Hello World
🌟 简单的自我介绍 大家好,我是 Coisini,来自古城西安,是陕西理工大学数计学院人工智能专业的学生。 🚀 编程的目标方向 我对编程充满热情,尤其专注于人工智能领域的研究与应用,致力于探索机器学习和深度学习算法的潜力。通过结合Spring Boot框架,我能够快速构建稳定的应用程序,为AI算法的实际部署提供强有力的支持。利用MyBatis简化数据库操作,使我更专注于业务逻辑优化和算法实现,而Maven则帮助我高效管理项目依赖和构建过程,使开发更加流畅。每次攻克技术难题、掌握新概念,都让我感到极大的满足与成就,力求在AI技术的研究与实践中不断前进。 🌱 未来的学习方向 在这个快速发展的时代,我立志于紧跟人工智能领域的前沿趋势,深入学习并掌握一系列关键技术,包括但不限于DeepSeek、Cursor、Dify、工作流、智能体以及知识库等。这些技术代表了当前AI技术发展的重要方向,它们不仅能够提升我的专业技能,也为解决复杂问题提供了新的思路和工具。
逻辑回归
🚀 3.1逻辑回归🌟 学习目标 了解逻辑回归的现实应用场景 掌握逻辑回归的核心原理 理解损失函数与优化算法的数学逻辑 🌐 1. 逻辑回归的应用场景生活中常见的二分类问题都可以用逻辑回归解决: ✉️ 垃圾邮件识别(是 / 否) ❤️ 疾病诊断(患病 / 健康) 💰 金融风控(欺诈 / 正常) 📲 账号检测(虚假 / 真实) 📈 广告效果(点击 / 不点击) 特点:所有问题都只有两个对立结果,逻辑回归通过概率判断归属。 🧠 2. 逻辑回归的核心原理🔄 输入层:线性回归的输出逻辑回归的输入是线性回归的预测值: h(w) = w_1 x_1 + w_2 x_2 + w_3 x_3 \dots + b🚦 激活函数 🐱sigmoid 函数 g(w^T, x) = \frac{1}{1 + e^{-h(w)}} = \frac{1}{1 + e^{-w^T x}} 判断标准 回归的结果输入到sigmoid函数当中 输出结果:[0, 1]区间中的一个概率值,默认为0.5为阈值 逻辑回归最终的分类是通过属于某个类别的概率值来判断是否属于某个类别,并且这个类别默 ...
PyTorch 入门指南 2:Tensor 的深度解析(操作篇)
🚀PyTorch 入门指南 2:Tensor 的深度解析(操作篇)💡一、Tensor 的类型在 PyTorch 中,Tensor 拥有多种数据类型,满足不同计算需求。以下是常见类型及对应表示: 数据类型描述 PyTorch 类型表示(方式一) PyTorch 类型表示(方式二) 旧版 Tensor 类型表示 32 位浮点数 torch.float32 torch.float torch.*.FloatTensor 64 位浮点数 torch.float64 torch.double torch.*.DoubleTensor 16 位浮点数 torch.float16 torch.half torch.*.HalfTensor 8 位无符号整数 torch.uint8 — torch.*.ByteTensor 8 位有符号整数 torch.int8 — torch.*.CharTensor 16 位有符号整数 torch.int16 torch.short torch.*.ShortTensor 32 位有符号整数 torch.int32 to ...
PyTorch 入门指南2:Tensor 的深度解析(概念篇)
📚PyTorch 入门指南2:Tensor 的深度解析(概念篇) 在 PyTorch 框架里,Tensor(张量) 是核心数据结构之一,与 Variable(autograd)、nn.Module 共同构成 PyTorch 的基础概念体系。Tensor 本质是多维数组,是标量、向量、矩阵在高维空间的延伸,支持 GPU 加速计算,是深度学习模型构建的基础数据形式。 🌐一、Tensor 的维度概念 从维度视角理解,Tensor 包含以下典型形式: 🔢标量(零维张量):最基础的张量,仅有一个数值(如 3),代表零维数据。 12scalar = torch.tensor(3)print(scalar.shape) # 输出: torch.Size([]) 📊向量(一维张量):一维数组(如 \begin{bmatrix} 3 \\ 2 \\ 1 \\ 4 \end{bmatrix}),用于表示线性数据,对应一维张量。 12vector = torch.tensor([3, 2, 1, 4])print(vector.shape) # 输出: torch.Size([4]) ...
PyTorch 入门指南1:机器学习基础
🐍 PyTorch 入门指南 1:机器学习基础 🔍一、机器学习的核心问题:分类与回归🎯1.1 分类问题:离散标签的预测定义:分类任务旨在将输入数据划分到有限个离散的类别中。模型通过学习数据特征,输出样本属于各个类别的概率或直接判定类别。 数学形式:给定输入特征向量$\mathbf{x}$,模型学习映射$f: \mathbf{x} \to y$,其中 $y$ 是离散类别(如$y \in {0, 1, 2, \dots, C-1}$),$C$为类别总数)。 应用场景:垃圾邮件识别(垃圾/非垃圾)、图像分类(如图二中“airplane”“automobile”等类别判断)。 输出特点:以图二为例,模型输出概率向量 [0.1, 0.1, 0.1, 0.1, 0, 0, 0, 0.5, 0.1, 0],表示样本属于 10 个类别的概率,最终选择概率最高的类别(第 8 类,概率 0.5)作为预测结果。 📈1.2 回归问题:连续值的预测定义:回归任务用于预测连续的数值型结果,关注输入与输出之间的定量关系。 数学形式:模型学习映射$f: \mathbf{x} \to y$,其中$y$是 ...
线性回归的优化
🐰线性回归优化😜在机器学习的领域中,线性回归作为一种基础且重要的算法,有着广泛的应用。然而,在实际运用过程中,我们常常会遇到欠拟合和过拟合的问题,它们如同拦路虎一般,影响着模型的性能。接下来,就让我们深入了解这两个问题以及如何对线性回归进行优化。 🐱🏍一、欠拟合与过拟合的定义 🐻(一)过拟合过拟合指的是一个假设在训练数据上能够获得比其他假设更好的拟合效果,但是在测试数据集上却不能很好地拟合数据。这通常是因为模型过于复杂,它努力去适应训练数据中的每一个细节,包括一些噪声,从而导致在面对新数据时缺乏泛化能力。比如,在一个预测房价的模型中,如果模型把训练数据中某几个特殊房子的独特特征(如房子旁边恰好有个独特的小雕塑)过度学习,而这些特征并非普遍影响房价的因素,那么在遇到没有这个小雕塑的房子时,模型的预测就会出现偏差。 🐼(二)欠拟合欠拟合则是一个假设在训练数据上不能获得良好的拟合,并且在测试数据集上同样不能很好地拟合数据。原因是模型过于简单,无法捕捉到数据中的足够特征和规律。继续以房价预测为例,如果模型仅仅考虑房子的面积这一个特征,而忽略了诸如房间数量、地段等其他重要因素,那么 ...
案例:波士顿房价预测
😊案例:波士顿房价预测😎学习目标通过案例掌握正规方程和梯度下降法 api 的使用 🏠案例背景介绍 📊数据介绍房价数据集案例。给定的这些特征,是专家们得出的影响房价的结果属性。我们此阶段不需要自己去探究特征是否有用,只需要使用这些特征。到后面量化很多特征需要我们自己去寻找。 📈案例分析回归当中的数据大小不一致,可能会导致结果影响较大。所以需要做标准化处理,具体步骤如下: 数据分割与标准化处理 回归预测 线性回归的算法效果评估 📏回归性能评估🔍均方误差 (Mean Squared Error, MSE) 评价机制在线性回归评估中,均方误差是一种常用的评估指标。 MSE = \frac{1}{m} \sum_{i=1}^{m} (y^i - \bar{y})^2 注:y_i 为预测值,\bar{y} 平均值为真实值。💭思考MSE 和最小二乘法的区别是? 📚API 使用sklearn.metrics.mean_squared_error(y_true, y_pred) 用于计算均方误差回归损失,其中: y_true:真实值 y_pred:预测值 return:浮点数 ...
线性回归API
🥰2.2 线性回归 API 使用总结🎯学习目标 知道线性回归 api 的简单使用 了解正规方程的 api 及常用参数 了解梯度下降法 api 及常用参数 🌟线性回归 API 介绍🧐简单使用版 APIsklearn.linear_model.LinearRegression() 属性: LinearRegression.coef_:回归系数 🎉示例代码📋步骤分析 获取数据集 数据基本处理(该案例中省略) 特征工程(该案例中省略) 机器学习 模型评估(该案例中省略) 💻代码过程1234567891011121314151617181920212223242526# 导入模块from sklearn.linear_model import LinearRegression# 构造数据集x = [[80, 86], [82, 80], [85, 78], [90, 90], [86, 82], [82, 90], [78, 80], [92, 94]]y = [84.2, 80.6, 80.1, 90, 83.2 ...
线性回归
🎈2.1 线性回归简介🌟学习目标 了解线性回归的应用场景 知道线性回归的定义 🏠1 线性回归应用场景 房价预测 销售额度预测 贷款额度预测 🔍2 什么是线性回归📄2.1 定义与公式线性回归 (Linear regression) 是利用回归方程 (函数) 对一个或多个自变量 (特征值) 和因变量 (目标值) 之间关系进行建模的一种分析方式。 特点:只有一个自变量的情况称为单变量回归,多于一个自变量情况的叫做多元回归。 通用公式: h(w) = w_1 x_1 + w_2 x_2 + w_3 x_3 \ldots + b = w^T x + b 其中 w, x 可以理解为矩阵: w = \begin{pmatrix} b \\ w_1 \\ w_2 \end{pmatrix}, \quad x = \begin{pmatrix} 1 \\ x_1 \\ x_2 \end{pmatrix} 线性回归用矩阵表示举例 理解示例: 期末成绩:0.7× 考试成绩 + 0.3× 平时成绩 房子价格 = 0.02× 中心区域的距离 + 0.04× 城市一氧化氮浓度 + (- ...
案例:Facebook 签到位置预测案例
🎈 Facebook 签到位置预测案例🎯一、学习目标通过 Facebook 位置预测案例,熟练掌握KNN算法学习内容。 📌二、项目描述 本次比赛的目的是预测一个人将要签到的地方。Facebook 创建了一个虚拟世界,这个世界是一个 10 公里 ×10 公里,共 100 平方公里的区域,其中包含约 10 万个地方。对于给定的坐标集,任务是根据用户的位置、准确性和时间戳等信息,预测用户下一次的签到位置。数据被制作成类似于来自移动设备的位置数据。需要注意的是,只能使用提供的数据进行预测 。 📚三、数据集介绍(一)📄数据介绍 涉及的文件有 train.csv 和 test.csv ,各字段含义如下: row id:签入事件的 id。 x y:坐标。 accuracy:准确度,即定位精度。 time:时间戳。 place_id:签到的位置,这也是需要预测的内容。 (二)🔗官网数据集官网:https://www.kaggle.com/navoshta/grid-knn/data 🛠️四、步骤分析(一)📊数据基本处理对数据做一些基本处理(这里的处理不一定能达到最佳效果,只是简单尝 ...