PyTorch 入门指南1:机器学习基础
🐍 PyTorch 入门指南 1:机器学习基础
🔍一、机器学习的核心问题:分类与回归
🎯1.1 分类问题:离散标签的预测
定义:分类任务旨在将输入数据划分到有限个离散的类别中。模型通过学习数据特征,输出样本属于各个类别的概率或直接判定类别。
- 数学形式:给定输入特征向量$\mathbf{x}$,模型学习映射$f: \mathbf{x} \to y$,其中 $y$ 是离散类别(如$y \in {0, 1, 2, \dots, C-1}$),$C$为类别总数)。
- 应用场景:垃圾邮件识别(垃圾/非垃圾)、图像分类(如图二中“airplane”“automobile”等类别判断)。
- 输出特点:以图二为例,模型输出概率向量
[0.1, 0.1, 0.1, 0.1, 0, 0, 0, 0.5, 0.1, 0]
,表示样本属于 10 个类别的概率,最终选择概率最高的类别(第 8 类,概率 0.5)作为预测结果。
📈1.2 回归问题:连续值的预测
定义:回归任务用于预测连续的数值型结果,关注输入与输出之间的定量关系。
- 数学形式:模型学习映射$f: \mathbf{x} \to y$,其中$y$是连续数值(如房价、股票价格涨幅)。
- 应用场景:图三的股票数据预测,通过历史交易数据(开盘价、成交量等特征)预测股票指数(如 2991.56 点)或涨幅(+0.54%)。
- 输出特点:直接输出连续数值,用于描述趋势或具体量值,无类别划分。
🔀1.3 分类与回归的核心区别
维度 | 分类问题 | 回归问题 |
---|---|---|
目标输出 | 离散类别 | 连续数值 |
评价指标 | 准确率、精确率、召回率等 | 均方误差(MSE)、平均绝对误差(MAE)等 |
典型模型 | 逻辑回归、决策树、神经网络分类器 | 线性回归、随机森林回归、神经网络回归 |
🖼️二、分类问题实战:图像分类案例分析
📁2.1 图像分类任务流程
- 数据准备:收集标注好的图像数据集(如图二中包含“airplane”“bird”“cat”等类别的图像)。
- 特征提取:通过卷积神经网络(CNN)提取图像的纹理、形状等高层特征。
- 模型训练:使用分类模型(如 ResNet、VGG)学习特征与类别的映射关系。
- 预测推断:输入新图像,模型输出类别概率向量,选择概率最高的类别作为结果。
📋2.2 输出向量解读
图二中的概率向量 [0.1, 0.1, 0.1, 0.1, 0, 0, 0, 0.5, 0.1, 0]
表示:
- 向量长度对应类别总数(10 类);
- 每个元素值表示属于对应类别的概率,数值越大,属于该类的可能性越高。
📉三、回归问题实战:股票数据预测
📊3.1 股票数据特征与目标
- 输入特征:图三中的“今开”“昨收”“成交量”“成交额”等数据,构成特征向量$\mathbf{x}$。
- 预测目标:股票指数(如 2991.56)、涨幅(+0.54%)等连续值。
🚀3.2 回归模型构建思路
- 数据预处理:对时间序列数据进行归一化、滑动窗口处理(提取历史序列特征)。
- 模型选择:使用线性回归、LSTM(处理时序数据)或 Transformer 模型。
- 训练优化:以均方误差为损失函数,优化模型参数,拟合数据规律。
🧩四、机器学习问题的构成元素
如图四所示,机器学习问题由以下核心元素构成:
📇4.1 样本(数据)
- 定义:用于训练和测试的数据集,包含特征(输入)和标签(输出)。
- 作用:模型通过学习样本数据,捕捉数据中的潜在规律。例如图像分类的样本是“图像特征+类别标签”,股票回归的样本是“交易特征+价格标签”。
🤖4.2 模型
- 定义:描述输入与输出关系的数学结构,如线性模型、神经网络、决策树等。
- 设计原则:根据任务类型选择模型(分类用 Softmax 输出,回归用线性输出),平衡模型复杂度与泛化能力。
🔄4.3 训练
- 流程:
- 定义损失函数(分类用交叉熵,回归用均方误差);
- 选择优化器(如 SGD、Adam);
- 通过反向传播调整模型参数,最小化损失。
- 目标:让模型在训练样本上学习到正确的映射关系。
🌟4.4 测试
- 作用:使用未参与训练的测试样本评估模型性能,验证模型的泛化能力。
- 指标:分类任务关注准确率,回归任务关注 MSE 等。
🌌4.5 推理
- 定义:使用训练好的模型对新数据进行预测,输出分类结果或回归值。
- 应用:部署模型到实际场景(如股票预测系统、图像分类APP),提供实时预测服务。
🎉五、总结
机器学习通过解决分类与回归问题,赋能图像识别、金融预测等众多领域。理解分类与回归的本质区别,掌握样本、模型、训练等构成元素,是构建高效机器学习系统的基础。无论是处理离散类别还是连续数值,围绕核心元素设计流程,才能让模型在实际场景中发挥价值。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Coisini!
评论