K-近邻法（KNN算法）

2023-11-01

1、kNN算法（K 最近邻(k-Nearest Neighbors)）描述

简单地说，k-近邻算法采用测量不同特征值之间的距离方法进行分类。

k-近邻算法是一种基本 分类与回归 方法；它是是监督学习中分类方法的一种，属于懒散学习法（惰性学习方法）。

给定一个训练集D 和一个测试对象z ,该测试对象是一个由属性值和一个未知的类别标签组成的向量，该算法需要计算z和每个训练对象之间的距离（或相似度），这样就可以确定最近邻的列表。然后将最近邻中实例数量占优的类别赋给z。（主要思想是如果一个样本在特征空间中的k个最近的样本中的大多数都属于某个类别，则该样本属于这个类别，并具有这个类别上的特性）。

注释： （1）所谓监督学习与非监督学习，是指训练数据是否有标柱类别，若有则为监督学习，否则为非监督学习。监督学习是指根据训练数据学习一个模型，然后能对后来的输入做预测。在监督学习中，输入变量和输出变量可以是连续的，也可以是离散的。若输入变量和输出变量均为连续变量，则称为回归；输出变量为有限个离散变量，则称为分类。

（2）懒散学习法在训练过程中不需要做许多处理。只有当新的未被分类的数据输入时，这类算法才会去做分类。积极学习法则会在训练中建立一个分类模型，当新的未分类数据输入时，这类学习器会把新数据也提供给这个分类模型。

2.KNN算法的工作原理：

存在一个样本数据集合，也称作为训练样本集，并且样本集中每个数据都存在标签，即我们知道样本集中每一个数据与所属分类的对应关系。输入没有标签的新数据后，将新的数据的每个特征与样本集中数据对应的特征进行比较，然后算法提取样本最相似数据(最近邻)的分类标签。一般来说，我们只选择样本数据集中前k个最相似的数据，这就是k-近邻算法中k的出处，通常k是不大于20的整数。最后，选择k个最相似数据中出现次数最多的分类，作为新数据的分类。

3、KNN算法的一般流程

（1）收集数据：可以使用任何方法。

（2）准备数据：距离计算所需要的数值，最好是结构化的数据格式。

（3）分析数据：可以使用任何方法。

（4）训练算法：此步骤不适用于k-近邻算法。

（5）测试算法：计算错误率。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

K-近邻法（KNN算法）的相关文章

在 python 中 pickling 数据时出现内存错误

我正在尝试使用 python 中提供的 dump 命令将字典转储为 pickle 格式字典的文件大小约为 150 mb 但仅转储 115 mb 的文件时会出现异常例外情况是 Traceback most recent call last
执行不区分大小写的“in”检查并检索原始元素的最简单方法？

假设 a 有一个字符串列表和一个特定字符串 particular string latitude list Id PRICE LATitude longitude 我想要实现的是执行不区分大小写的检查特定字符串是否在列表中所以现在我可以这
将 c++ 异常传播到 cython - python 异常

我的 Cython 0 17 1 有问题我的函数抛出一个std runtime error如果文件不存在我想以某种方式将此异常传播到我的 Cython 代码 void loadFile const string filename som
如何在仍然使用 unique = True 的同时允许 ModelForm 中的空字段？

目前在models py I have class ModelName models Model rowname models CharField max length 100 blank True unique True 就确保相同的值不
使用 LSTM 进行时间序列模式识别(python)

我的应用场景和上一个类似时间序列中的模式识别 https stackoverflow com questions 11752727 pattern recognition in time series By processing a tim
Python：os.remove 不起作用

为什么不是os remove string 为我工作我的代码写如下 try os remove a output current time trmv successful message message n output message
无法启动 Windows 快捷方式

我正在尝试使用 python 启动 Windows 我已经尝试了 os system subprocess call os startfile 等多种方法但总是收到错误消息指出路径不存在我知道路径是正确的因为我尝试在 CMD EXE
Python Twisted 与 Cmd 模块集成

我喜欢Python的Twisted http twistedmatrix com and Cmd http docs python org library cmd html 我想一起使用它们我已经完成了一些工作但到目前为止我还没有弄清楚
通过 beautiful soup python 找到所有字体大小大于最常见字体的跨度样式

我了解如何从特定的位置获取文本div or span这个问题的风格如何找到最常见的跨度样式 https stackoverflow com questions 40762692 is there a way to find the mos
XGBoostLibraryNotFound：在候选路径中找不到 XGBoost 库，您是否安装了编译器并在根路径中运行了 build.sh？

我在移动 XGBoost 的 python package 目录时遇到这个问题 Traceback most recent call last File setup py line 19 in LIB PATH libpath find l
setUp() 中的 if 条件忽略测试

在unittest python库中存在函数setUp and tearDown用于设置变量和其他测试前后的事情如何运行或忽略 setUp 中条件的测试您可以致电if cond self skipTest reason in setU
numpy 相关系数错误 - RuntimeWarning：true_divide 中遇到无效值

当我尝试查找数据系列之间的相关性时出现以下错误 gt gt gt i 1 1 1 gt gt gt j 2 2 2 gt gt gt import numpy as np gt gt gt np corrcoef i j usr loca
在Python中将数组的元素从科学记数法转换为十进制记数法

我有一个 numpy 数组其元素采用科学格式我想将它们转换为十进制格式我的 numpy 数组如下所示 array 93495052 96955582 98555123 06146193 array 1 00097681e 09 9 9
Spyder 内联绘图

设置 Anaconda 2 0 0 Win 64 Spyder Anaconda 附带的 2 3 0rc 我配置图形工具 gt 首选项 gt iPython 控制台 gt 图形 gt 图形后端 gt 内联但无论我做什么图形总是在单独的
如何重写一个列表列表，使值的“孤岛”彼此唯一？

假设我有一个列表列表或更概念上准确的二维数组 list 1 1 0 0 0 1 1 2 0 0 0 2 2 2 0 0 0 0 2 0 0 0 0 1 0 我想识别具有相同值的不同区域并重写列表以便每个区域都有唯一的值如下所示 lis
使用 python 将多个 JSON 文件插入 MongoDB

JSON文件如下a json b json z json 26个json文件每个文件的 json 格式如下 a cappella word a cappella wordset id 5feb6f679a meanings id 4920
DataFrame 对象没有属性“sort_values”

dataset pd read csv dataset csv fillna 100 dataset Id 0 dataset i 0 dataset j 0 entries dataset dataset Id 0 print type
仅将唯一行插入 SQLite (python)

我在用着cursor executemany将 CSV 文件中的批量行插入到 SQLite 表中根据主键字段其中一些行预计会重复当我执行该命令时可以预见的是我会收到完整性错误并且不会插入任何内容如何有选择地仅插入非重复行而无
在Python中设置Windows命令行终端标题

我在 Windows 计算机上运行某个 Python 脚本的多个实例每个实例都来自不同的目录并使用单独的 shell 窗口不幸的是 Windows 为每个 shell 窗口提供了相同的名称
pyodbc 无法正确处理 unicode 数据

我确实使用 pyodbc 成功连接了 MySQL 数据库并且它可以很好地处理 ascii 编码的数据但是当我打印使用 unicode utf8 编码的数据时它引发了错误 UnicodeEncodeError ascii codec c

随机推荐

前端实际开发中的命名规范(个人建议)

如果说计算机科学只存在两个难题缓存失效和命名那我觉得前端的命名占有一席之地让人难以理解的命名方式单词拼写错误中英文混用以数字1 9或者以a z命名中文拼音命名强制缩写命名方法每个单词之间用或者连接小驼峰除第一个单
JavaScript做简单的购物车效果（增、删、改、查、克隆）

比如有时候遇到下面这种情况点击加入购物车然后在上方的购物车中动态的添加商品以及商品的信息我们就可以通过JavaScript实现简单的这些操作首先我们需要在html文档中通过css对页面的布局做一些简单的设置并创建两个模板其di
第二十三节：DOM对象

DOM概述 DOM 是 JavaScript 操作网页的接口全称为文档对象模型 Document Object Model 它的作用是将网页转为一个 JavaScript 对象从而可以用脚本进行各种操作比如增删内容浏览器会根据 D
python字典调用键值对作为函数的形参_前端如何学习Python——字典和函数｜七日打卡...

字典 Python 中的字典和 Javascript的对象基本是一样的添加键值对 user user name david user age 18 print user 复制代码 name david age 18 复制代码删除键值对
RuntimeError: Error(s) in loading state_dict for SENET

错误提示 RuntimeError Error s in loading state dict for SENET Missing key s in state dict conv1 weight bn1 weight bn1 bias b
WebGL(threeJS)给物体打标签

threeJS给物体打标签有以下几种方法今天我们就郭老师的例子依次来看看区别三中标签的区别今天咱们现年看看效果下次咱们分析代码第一种 CSS2DRenderer 官方案例 CSS2DRenderer的标签本身的大小不会缩放也不会旋
OD华为机试 19

分苹果描述 A B两个人把苹果分为两堆 A希望按照他的计算规则等分苹果他的计算规则是按照二进制加法计算并且不计算进位 12 5 9 1100 0101 9 B的计算规则是十进制加法包括正常进位 B希望在满足A的情况下获取苹果重量最多
2022全年度净水器十大热门品牌销量榜单

随着人们健康意识的提升每天喝足量水的观念已经深入人心而伴随居民生活水平的提高当下居民对水污染问题也更加关注对饮水品质的认知和要求也随之升级因此净水器在过去几年开启了高速增长的趋势根据鲸参谋数据显示 2022年京东平台净水器的年
docker具名挂载与匿名挂载

文章分为三部分什么是具名匿名和指定路径挂载匿名挂载具名挂载什么是具名匿名和指定路径挂载 v 容器内路径匿名挂载 v 卷名容器内路径具名挂载 v 宿主机路径容器内路径指定路径挂载拓展宿主机路径容器内路径 ro 只读
好书推荐计划：Keras之父作品《Python 深度学习》

大家好我禅师的助理兼人工智能排版住手助手条子可能很多人都不知道我因为我真的难得露面一次天天给禅师做底层工作今天条子终于也熬到这一天终于也有机会来为大家写文章了激动的我啊都忘了9月17号中午和禅师在我厂门口兰州料理吃饭禅师要
C++——关于返回值优化问题

我们知道对于一个函数的返回值来说其是一个对象的拷贝并且应当是一个右值我们现在有一个函数 A get A A a 1 return a int mian A get A return 0 这个函数的行为应当是在函数体中构造一个a 然后
浅析React Router V6 useRoutes的使用

本篇文章记录了useRoutes第一个参数的使用方法暂不涉及第二个参数文章目录一使用位置二嵌套路由三分模块管理注意事项一使用位置一开始以为可以像react router config那样使用于是写成 import
用 construct 2 制作简易弹幕游戏

用 construct 2 制作简易弹幕游戏 1 打开construct 2 加入背景 3 建立新的图层 4 在新的图层里加入素材超人弹幕 4 加入鼠标 5 给超人和弹幕设置动作超人的弹幕的 6 加入文字框 7 编写代码完成啦
TCP/UDP报文格式及各种通信机制简介

TCP UDP报文格式及各种通信机制简介一 UDP报文二 TCP报文三 TCP通信机制 1 确认应答机制 2 超时重传机制 3 滑动窗口及快重传机制 4 流量控制 5 拥塞控制及慢启动机制 6 延迟应答 7 捎带应答 8 粘包问题一
PLC中的定时器

1 脉冲定时器将指令列表中的生成脉冲指令TP拖放到梯形图中在出现的调用选项对话框中将默认的背景数据块的名称改为T1 可以用它来做定时器的标示符单击确定按钮自动生成背景数据块定时器的输入IN为启动输入端 PT为预设时间
二叉搜索树的概念及功能代码实现

1 概念二叉搜索树又称二叉排序树特点二叉树每个节点中保存关键字 key 关键字需要具备比较的能力每个节点都是大于左子树小于右子树二叉树搜索树中不会出现相等的 key 中序遍历一定是有序的时间复杂度最好和
利用Hbuilder将Vue项目打包成apk

一配置config index js 本人没有配置index js文件就开始进行了打包结果最终效果是页面空白解决了空白接着底部图标我是用的阿里巴巴图片资源找不到所以配置这步比较重要 1 页面空白的解决打开config in
uboot2014移植到QT2440

http bbs chinaunix net thread 4143968 1 1 html
Kotlin 协程（Coroutines）配合使用 Retrofit，网络请求

第一步添加所需依赖管理生命周期 implementation androidx lifecycle lifecycle livedata ktx 2 2 0 implementation androidx lifecycle lifec
K-近邻法（KNN算法）

1 kNN算法 K 最近邻 k Nearest Neighbors 描述简单地说 k 近邻算法采用测量不同特征值之间的距离方法进行分类 k 近邻算法是一种基本分类与回归方法它是是监督学习中分类方法的一种属于懒散学习法惰性

K-近邻法（KNN算法）

K-近邻法（KNN算法） 的相关文章

随机推荐

热门标签

K-近邻法（KNN算法）的相关文章