🐍 PyTorch 入门指南 1:机器学习基础

机器学习的核心问题

🔍一、机器学习的核心问题:分类与回归

🎯1.1 分类问题:离散标签的预测

定义:分类任务旨在将输入数据划分到有限个离散的类别中。模型通过学习数据特征,输出样本属于各个类别的概率或直接判定类别。

  • 数学形式:给定输入特征向量$\mathbf{x}$,模型学习映射$f: \mathbf{x} \to y$,其中 $y$ 是离散类别(如$y \in {0, 1, 2, \dots, C-1}$),$C$为类别总数)。
  • 应用场景:垃圾邮件识别(垃圾/非垃圾)、图像分类(如图二中“airplane”“automobile”等类别判断)。
    分类
  • 输出特点:以图二为例,模型输出概率向量 [0.1, 0.1, 0.1, 0.1, 0, 0, 0, 0.5, 0.1, 0],表示样本属于 10 个类别的概率,最终选择概率最高的类别(第 8 类,概率 0.5)作为预测结果。

📈1.2 回归问题:连续值的预测

定义:回归任务用于预测连续的数值型结果,关注输入与输出之间的定量关系。

  • 数学形式:模型学习映射$f: \mathbf{x} \to y$,其中$y$是连续数值(如房价、股票价格涨幅)。
  • 应用场景:图三的股票数据预测,通过历史交易数据(开盘价、成交量等特征)预测股票指数(如 2991.56 点)或涨幅(+0.54%)。
    回归
  • 输出特点:直接输出连续数值,用于描述趋势或具体量值,无类别划分。

🔀1.3 分类与回归的核心区别

维度分类问题回归问题
目标输出离散类别连续数值
评价指标准确率、精确率、召回率等均方误差(MSE)、平均绝对误差(MAE)等
典型模型逻辑回归、决策树、神经网络分类器线性回归、随机森林回归、神经网络回归

🖼️二、分类问题实战:图像分类案例分析

📁2.1 图像分类任务流程

  1. 数据准备:收集标注好的图像数据集(如图二中包含“airplane”“bird”“cat”等类别的图像)。
  2. 特征提取:通过卷积神经网络(CNN)提取图像的纹理、形状等高层特征。
  3. 模型训练:使用分类模型(如 ResNet、VGG)学习特征与类别的映射关系。
  4. 预测推断:输入新图像,模型输出类别概率向量,选择概率最高的类别作为结果。

📋2.2 输出向量解读

图二中的概率向量 [0.1, 0.1, 0.1, 0.1, 0, 0, 0, 0.5, 0.1, 0] 表示:

  • 向量长度对应类别总数(10 类);
  • 每个元素值表示属于对应类别的概率,数值越大,属于该类的可能性越高。

📉三、回归问题实战:股票数据预测

📊3.1 股票数据特征与目标

  • 输入特征:图三中的“今开”“昨收”“成交量”“成交额”等数据,构成特征向量$\mathbf{x}$。
  • 预测目标:股票指数(如 2991.56)、涨幅(+0.54%)等连续值。

🚀3.2 回归模型构建思路

  1. 数据预处理:对时间序列数据进行归一化、滑动窗口处理(提取历史序列特征)。
  2. 模型选择:使用线性回归、LSTM(处理时序数据)或 Transformer 模型。
  3. 训练优化:以均方误差为损失函数,优化模型参数,拟合数据规律。

🧩四、机器学习问题的构成元素

如图四所示,机器学习问题由以下核心元素构成:
机器学习问题的构成元素

📇4.1 样本(数据)

  • 定义:用于训练和测试的数据集,包含特征(输入)和标签(输出)。
  • 作用:模型通过学习样本数据,捕捉数据中的潜在规律。例如图像分类的样本是“图像特征+类别标签”,股票回归的样本是“交易特征+价格标签”。

🤖4.2 模型

  • 定义:描述输入与输出关系的数学结构,如线性模型、神经网络、决策树等。
  • 设计原则:根据任务类型选择模型(分类用 Softmax 输出,回归用线性输出),平衡模型复杂度与泛化能力。

🔄4.3 训练

  • 流程
    1. 定义损失函数(分类用交叉熵,回归用均方误差);
    2. 选择优化器(如 SGD、Adam);
    3. 通过反向传播调整模型参数,最小化损失。
  • 目标:让模型在训练样本上学习到正确的映射关系。

🌟4.4 测试

  • 作用:使用未参与训练的测试样本评估模型性能,验证模型的泛化能力。
  • 指标:分类任务关注准确率,回归任务关注 MSE 等。

🌌4.5 推理

  • 定义:使用训练好的模型对新数据进行预测,输出分类结果或回归值。
  • 应用:部署模型到实际场景(如股票预测系统、图像分类APP),提供实时预测服务。

🎉五、总结

机器学习通过解决分类与回归问题,赋能图像识别、金融预测等众多领域。理解分类与回归的本质区别,掌握样本、模型、训练等构成元素,是构建高效机器学习系统的基础。无论是处理离散类别还是连续数值,围绕核心元素设计流程,才能让模型在实际场景中发挥价值。