案例:鸢尾花种类预测
🌼案例:鸢尾花种类预测 — 流程实现🥰🎯学习目标 🎯目标 熟悉:机器学习从数据获取到评估的完整流程 掌握:KNeighborsClassifier的使用及参数设置 理解:归一化和标准化原理、区别及适用场景 明晰:交叉验证和网格搜索概念及作用 运用:交叉验证和网格搜索优化模型 🔍K - 近邻算法 APIsklearn.neighbors.KNeighborsClassifier(n_neighbors=5, algorithm='auto') 📋参数说明 n_neighbors:int,可选(默认 = 5),k_neighbors 查询默认使用的邻居数 algorithm:{‘auto’,‘ball_tree’,‘kd_tree’,‘brute’},快速 k 近邻搜索算法,默认参数为 auto,可以理解为算法自己决定合适的搜索算法。除此之外,用户也可以自己指定搜索算法: brute:蛮力搜索,也就是线性扫描,当训练集很大时,计算非常耗时。 kd_tree:构造kd树存储数据以便对其进行快速检索的树形数据结构,kd树也就是数据结构中的二叉树。以中值切分构造 ...
K-近邻算法API
🌟1.2 k近邻算法api初步使用🌟🌈学习目标目标 了解sklearn工具的优点和包含内容 应用sklearn中的api实现KNN算法的简单使用 获取数据集 数据基本处理 特征工程 机器学习 模型评估 🛠️Scikit-learn 工具介绍 Scikit-learn是Python语言的机器学习工具,它具有以下特点: 包括许多知名的机器学习算法的实现 文档完善,容易上手,拥有丰富的AP 🔧安装使用以下命令进行安装:pip3 install scikit-learn 安装好之后可以通过以下命令查看是否安装成功:import sklearn 注:安装scikit-learn需要Numpy, Scipy等库。 📦Scikit-learn包含的内容 分类、聚类、回归 - 特征工程 模型选择、调优 📌K-近邻算法APIsklearn.neighbors.KNeighborsClassifier(n_neighbors=5) n_neighbors:int,可选(默认 = 5),k_neighbors 查询默认使用的邻居数 📋案例👣步骤分析 获取数据集 数据基本 ...
K-近邻算法
🎈1.1 K - 近邻算法简介🌟学习目标 目标:了解什么是 KNN 算法 知道:KNN 算法求解过程 🌸1 什么是 K - 近邻算法 根据你的 “邻居” 来推断出你的类别。 🐾1.1 K - 近邻算法 (KNN) 概念K Nearest Neighbor 算法又叫 KNN 算法,这个算法是机器学习里面一个比较经典的算法,总体来说 KNN 算法是相对比较容易理解的算法。 💡定义如果一个样本在特征空间中的 k 个最相似 (即特征空间中最邻近) 的样本中的大多数属于某一个类别,则该样本也属于这个类别。例如,在一个水果分类问题中,我们有一堆已知类别的水果样本(苹果、橙子等),对于一个未知类别的水果,我们通过计算它与已知水果样本的相似度(距离),找到最相似的 k 个样本,如果这 k 个样本中大多数是苹果,那么我们就可以推断这个未知水果也可能是苹果。 🌟来源KNN 算法最早是由 Cover 和 Hart 提出的一种分类算法。 📏距离公式两个样本的距离可以通过如下公式计算,又叫欧式距离 。 对于二维平面上点a(x_{1}, y_{1})与b(x{2}, y{2}) 之间的欧氏距离: ...