PyTorch 入门指南1：机器学习基础

发表于2025-03-09|更新于2025-03-09|深度学习

|阅读量:

🐍 PyTorch 入门指南 1：机器学习基础

机器学习的核心问题

🔍一、机器学习的核心问题：分类与回归

🎯1.1 分类问题：离散标签的预测

定义：分类任务旨在将输入数据划分到有限个离散的类别中。模型通过学习数据特征，输出样本属于各个类别的概率或直接判定类别。

数学形式：给定输入特征向量$\mathbf{x}$，模型学习映射$f: \mathbf{x} \to y$，其中 $y$ 是离散类别（如$y \in {0, 1, 2, \dots, C-1}$)，$C$为类别总数）。
应用场景：垃圾邮件识别（垃圾/非垃圾）、图像分类（如图二中“airplane”“automobile”等类别判断）。
输出特点：以图二为例，模型输出概率向量 [0.1, 0.1, 0.1, 0.1, 0, 0, 0, 0.5, 0.1, 0]，表示样本属于 10 个类别的概率，最终选择概率最高的类别（第 8 类，概率 0.5）作为预测结果。

📈1.2 回归问题：连续值的预测

定义：回归任务用于预测连续的数值型结果，关注输入与输出之间的定量关系。

数学形式：模型学习映射$f: \mathbf{x} \to y$，其中$y$是连续数值（如房价、股票价格涨幅）。
应用场景：图三的股票数据预测，通过历史交易数据（开盘价、成交量等特征）预测股票指数（如 2991.56 点）或涨幅（+0.54%）。
输出特点：直接输出连续数值，用于描述趋势或具体量值，无类别划分。

🔀1.3 分类与回归的核心区别

维度	分类问题	回归问题
目标输出	离散类别	连续数值
评价指标	准确率、精确率、召回率等	均方误差（MSE）、平均绝对误差（MAE）等
典型模型	逻辑回归、决策树、神经网络分类器	线性回归、随机森林回归、神经网络回归

🖼️二、分类问题实战：图像分类案例分析

📁2.1 图像分类任务流程

数据准备：收集标注好的图像数据集（如图二中包含“airplane”“bird”“cat”等类别的图像）。
特征提取：通过卷积神经网络（CNN）提取图像的纹理、形状等高层特征。
模型训练：使用分类模型（如 ResNet、VGG）学习特征与类别的映射关系。
预测推断：输入新图像，模型输出类别概率向量，选择概率最高的类别作为结果。

📋2.2 输出向量解读

图二中的概率向量 [0.1, 0.1, 0.1, 0.1, 0, 0, 0, 0.5, 0.1, 0] 表示：

向量长度对应类别总数（10 类）；
每个元素值表示属于对应类别的概率，数值越大，属于该类的可能性越高。

📉三、回归问题实战：股票数据预测

📊3.1 股票数据特征与目标

输入特征：图三中的“今开”“昨收”“成交量”“成交额”等数据，构成特征向量$\mathbf{x}$。
预测目标：股票指数（如 2991.56）、涨幅（+0.54%）等连续值。

🚀3.2 回归模型构建思路

数据预处理：对时间序列数据进行归一化、滑动窗口处理（提取历史序列特征）。
模型选择：使用线性回归、LSTM（处理时序数据）或 Transformer 模型。
训练优化：以均方误差为损失函数，优化模型参数，拟合数据规律。

🧩四、机器学习问题的构成元素

如图四所示，机器学习问题由以下核心元素构成：
机器学习问题的构成元素

📇4.1 样本（数据）

定义：用于训练和测试的数据集，包含特征（输入）和标签（输出）。
作用：模型通过学习样本数据，捕捉数据中的潜在规律。例如图像分类的样本是“图像特征+类别标签”，股票回归的样本是“交易特征+价格标签”。

🤖4.2 模型

定义：描述输入与输出关系的数学结构，如线性模型、神经网络、决策树等。
设计原则：根据任务类型选择模型（分类用 Softmax 输出，回归用线性输出），平衡模型复杂度与泛化能力。

🔄4.3 训练

流程：
1. 定义损失函数（分类用交叉熵，回归用均方误差）；
2. 选择优化器（如 SGD、Adam）；
3. 通过反向传播调整模型参数，最小化损失。
目标：让模型在训练样本上学习到正确的映射关系。

🌟4.4 测试

作用：使用未参与训练的测试样本评估模型性能，验证模型的泛化能力。
指标：分类任务关注准确率，回归任务关注 MSE 等。

🌌4.5 推理

定义：使用训练好的模型对新数据进行预测，输出分类结果或回归值。
应用：部署模型到实际场景（如股票预测系统、图像分类APP），提供实时预测服务。

🎉五、总结

机器学习通过解决分类与回归问题，赋能图像识别、金融预测等众多领域。理解分类与回归的本质区别，掌握样本、模型、训练等构成元素，是构建高效机器学习系统的基础。无论是处理离散类别还是连续数值，围绕核心元素设计流程，才能让模型在实际场景中发挥价值。

文章作者: Coisini

文章链接: https://www.enju-tsubaki.icu/posts/b2b2014e.html

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Coisini！

相关推荐

PyTorch 入门指南 2：Tensor 的深度解析（操作篇）

PyTorch 入门指南2：Tensor 的深度解析（概念篇）

评论

✨ 有新文章啦！ 👉🍗点击食用🍔

数据库加载中