使用k-近邻算法识别手写数字

2023-05-16

本文摘自《机器学习实战》案例，对其进行了代码更新与注释。

实战介绍

使用k-近邻分类器构造手写识别系统，为了简单起见，系统只识别0-9，需要识别的数字已经使用图形处理软件，处理成具有相同的色彩和大小：宽高是32像素*32像素的黑白图像。每个图像存于相应的txt文档中，如数字0的图像，存于‘0_x.txt’；数字1的图像，存于‘1_x.txt’中，其中x代表文档在文件夹的位次。
需要资源者请回复！！！

准备数据：将图像转化为测试向量

为了分类器更好处理，我们将把一个3232的二进制图像矩阵转化为11024的向量

def img2vector(filename):
    fr=open(filename)
    totalContent=fr.readlines()
    #size记录每列字符的数量，即行数,为32
    size=len(totalContent)
    #returnVectorLen记录文件中字符的数量，为1024
    returnVectorLen=0
    #horizonSize记录每行字符的数量，即列数，为32
    horizonSize=0
    for line in totalContent:
        line=line.strip()
        horizonSize=len(line)
        returnVectorLen+=horizonSize
    returnVect=np.zeros((1,returnVectorLen))
    for i in range(size):
        linestr=totalContent[i]
        for j in range(horizonSize):
            returnVect[0,horizonSize*i+j]=int(linestr[j])
    return returnVect

k-近邻算法

def classify0(inx,dataset,labels,k):
    datasize=dataset.shape[0]
    diffMat=np.tile(inx,(datasize,1))-dataset
    sqDiffMat=diffMat**2
    #axis=1代表横轴，即列表每行求和
    sqDistance=sqDiffMat.sum(axis=1)
    distance=sqDistance**0.5
    #.argsort()返回列表值从小到大的索引值
    sortedDistIndicies=distance.argsort()
    classCount={}
    for i in range(k):
        voteIlabel=labels[sortedDistIndicies[i]]
        classCount[voteIlabel]=classCount.get(voteIlabel,0)+1
    #items()返回字典的元组列表，逆序=降序；sorted()函数返回的是列表副本，sort()是对自己的操作，无返回值
    sortedClassCount=sorted(classCount.items(),key=lambda x:x[1],reverse=True)
    return sortedClassCount[0][0]

测试算法：使用k-近邻算法识别手写数字

在资源中，我们已经准备好测试文件‘testDigits’

from os import listdir
def handwritingClassTest():
    hwLabels=[]
    #listdir用于列出给定目录其中的文件名
    trainingFileList=listdir('traingDigits')
    m=len(trainingFileList)
    trainingMat=np.zeros((m,1024))
    for i in range(m):
        fileNameStr=trainingFileList[i]
        fileStr=fileNameStr.split('.')[0]
        classNumStr=int(fileStr.split('_')[0])
        hwLabels.append(classNumStr)
        trainingMat[i,:]=img2vector('traingDigits/'+fileNameStr)
    testFileList=listdir('testDigits')
    errorCount=0.0
    mTest=len(testFileList)
    for i in range(mTest):
        fileNamestr=testFileList[i]
        fileStr=fileNameStr.plit('.')[0]
        classNumStr=int(fileStr.split('_')[0])
        vectorUnderTest=img2vector('testDigits/'+fileNameStr)
        classifierResult=classify0(vectorUnderTest,trainingMat,hwLabels,3)
        if classifierResult!=classNumStr:
            errorCount+=1.0
    return errorCount/float(mTest)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

近邻算法识别手写数字

使用k-近邻算法识别手写数字的相关文章

Shell命令

shell命令 xff1a 操作系统的一个字符串操作 1 关机 xff1a halt reboot xff08 重启 xff09 poweroff 查看或匹配网卡 xff1a ifconfig 帮助手册 man 清屏 xff1a clear
1.20——golang环境配置(在Mac OS上)【没用过】

本节主要为大家讲解如何在Mac OS上安装Go语言开发包 xff0c 大家可以在Go语言官网下载对应版本的的安装包 xff08 https golang google cn dl xff09 xff0c 如下图所示安装Go语言开发包 M
spring自动装配Bean的五种方式

no xff1a 默认方式 xff0c 手动装配方式 xff0c 需要通过ref设定bean的依赖关系byName xff1a 根据bean的名字进行装配 xff0c 当一个bean的名称和其他bean的属性一致 xff0c 则自动装配by
ZCU106的FMC接口AD/DA（全网唯一、全网最详）

马上就要毕业啦 xff0c 好久没写文章了 xff0c 今天给大家带来硕士期间的最后一次AD DA实验的实验记录 xff0c 废话少说 xff0c 先看连接与视频连接视频我做的实验是AN108 43 FL9613的DA与AD回环测试
BigDecimalUtils BigDecimal加减乘除

span class token keyword public span span class token keyword class span span class token class name BigDecimalUtil span
关于引用的疑问

1 变量名回顾变量是一段实际连续存储空间的别名程序中通过变量来申请并命名存储空间通过变量的名字可以使用存储空间问题 xff1a 一段连续的存储空间只能有一个别名吗 xff1f 2 c 43 43 中引用引用可以看作一个已定
在Ubuntu系统中安装字体（以安装华文行楷和方正舒体为例）

背景 xff1a 笔者在做一个项目时 xff0c 因为项目是在windows系统中开发的 xff0c 用react写的页面 xff0c 在windows本地验证是没有问题 xff0c 但是部署到服务器 xff08 服务器系统为Ubuntu
Linux Shared Memory的查看与设置

1 Linux Check Memory Usage 2 How to Check Shared Memory on Linux 3 Shared Memory Configuration 共享内存就是进程之间可以共享的一段内存 xff0c
java构造和生成固定的json格式（geojson为例）

java构造和生成json格式 xff08 geojson为例 xff09 一所要构造的json格式二思路和步骤 1 题外说明本文是先解析读入的txt文件 xff0c 然后建立对应的java类来接受解析的某些值 xff0c 用了自己
Android 程序退出 Toast还一直显示解决方案

今天 xff0c 改了个bug xff1a 点击两次返回程序退出如大家所想 xff0c 第一次点击用Toast提示 xff0c 如果在两秒内再次点击那么程序退出在我们平时写App的时候 xff0c 习惯用Application的上下文对
在word中快速查找所有图片

选择导航窗格点击搜索框里的小三角选择查找图形
systemctl命令详解

在linux内核启动完以后 xff0c 会执行 etc rc d rc local脚本 xff0c 最后再执行 bin login程序 xff0c 进入用户登陆界面传统的做法 xff0c 如果要在linux里添加开机自启的命令 xff0c
Linux系统之下开启tomcat控制台，查看代码运行情况

方法 xff1a 进入tomcat安装文件夹 xff0c 打开命令行如下操作 xff1a bin gt startup sh cd logs tail f catalina out
四元数姿态表示总结

文章目录简介用法一 xff1a 欧拉角四元数1 Euler2Quat xff1a 2 Euler 2 Vect 2 Quat xff1a 3 Quat 2 Euler xff1a 用法二 xff1a 旋转矩阵四元数1 Quat 2 R
调用OpenCV库出现: undefined reference to `xxxxx‘ 的解决办法（使用MinGW编译器）

记录OpenCV正确安装与调用过程我的CMakeLists txt如下 xff1a cmake minimum required span class token punctuation span VERSION span class t
解决git fatal:无法找到‘https‘的远程助手

解决git fatal 无法找到 https 的远程助手 1 问题今天使用git拉去代码的时候出现 fatal 无法找到 39 https 39 的远程助手错误 xff0c 如下所示 span class token function g

随机推荐

[Android Framework]Android 11系统Update-API时Lint检查问题解决和记录

1 什么是Lint检查 Android Lint 是 ADT 16 xff08 和工具 16 xff09 中引入的一个新工具 xff0c 用于扫描 Android 项目源以查找潜在的错误 Android11之前 xff0c 我们在进行Fra
openEuler22.03LTS网卡配置

VmWare完成安装openEuler xff0c 修改网卡配置文件 xff0c 重启network报错service not found xff0c 因为欧拉使用nmcli管理网络按照centos7的经验 xff0c 修改ifcfg配置
利用在线词典批量查询英语单词

进来遇到很多英语生词 xff0c 工具书上给的解释错误百出 xff0c 而很多在线词典不但可以给出某个单词的解释 xff0c 而且有大量的示例 xff0c 因此猜想利用在线词典批量查询这些单词怎么实现呢 xff1f 首要问题是如何自动获取
linux svn服务器搭建 centos 搭建svn服务器

本文是在CentOS中采用yum安装方式优点 xff1a 简单 xff0c 一键安装 xff0c 不用手动配置环境变量等缺点 xff1a 安装位置为yum默认 xff0c 比如我们公司服务器上安装软件有自己的规定 xff0c 一般会采用
Firewall 防火墙常用命令

Firewall开启常见端口命令 xff1a 注意 permanent意思是永久生效 firewall cmd zone 61 public add port 61 80 tcp permanent firewall cmd zone 6
第二章——keil5修改工程名字

第一章 stm32f103建立工程第二章 keil5修改工程名字目录 1 修改模板文件名 2 修改工程文件名 3 删除中间文件 4 修改输出中间变量文件名 5 点击编译 xff0c 改名成功 1 修改模板文件名把第一章建立的工程模板的
origin2021如何切换中文界面

origin2021如何切换中文界面一直接设置Change Language二 Change Language菜单是灰色的一直接设置Change Language 1 单击 Help gt Change Language 2 将La
fbe 业务流程分析

参考链接 xff1a https www cnblogs com bobfly1984 p 14090078 html 总结根据 data unencrypted key和 data misc vold user keys de 0 路径
js的字符串匹配方法match()和Java的字符串匹配方法matches()的使用？以换行符替换为其他字符为例

js的字符串匹配方法match 和Java的字符串匹配方法matches 的使用 xff1f 以换行符替换为其他字符为例 js的 xff1a str match n igm length会返回str中有多少个换行str match bc i
UNIX 环境高级编程

与你共享 xff0c 与你共舞 xff01 UNIX环境高级编程 xff08 第3版 xff09 是被誉为UNIX编程圣经 xff1b 书中除了介绍UNIX文件和目录标准I O库系统数据文件和信息进程环境进程控制进程关系信号
华为服务器WebBios创建磁盘阵列

步骤 1 启动服务器按ctrl 43 h进入WebBios 2 点击Start确定进入下一步 3 左栏的Configuration Wizard添加raid 4 选New Configuration新建raid即可 5 选中硬盘然后再按N
goland 无法编译输出 Compilation finished with exit code 0

golang编写程序无法输出
分享关于AI的那些事儿

机器人很厉害给人治病的ibm 的Watson 沃森击败世界围棋冠军的AlphaGo阿尔法狗陪你聊天的机器人数据标注木马识别恶意访问拦截智能家居但是17年首次出现了机器人获得国籍这个机器人叫做索菲亚这是一个类似人类的机器人
String Evolver, My First Genetic Algorithm

When reading Evolutionary Computation for Modeling and Optimization 1 I found following problem in section 1 2 3 A strin
MongoDB特点及功能介绍

一 MongoDB 介绍 1 基本概念 MongoDB是一个高性能 xff0c 开源 xff0c 无模式的文档型数据库 xff0c 是当前NoSQL数据库产品中最热门的一种它在许多场景下可用于替代传统的关系型数据库或键值存储方式 xff
线程同步以及线程调度相关的方法

wait xff1a 使一个线程处于等待 xff08 阻塞 xff09 状态 xff0c 并且释放所持有的对象的锁 xff1b sleep xff1a 使一个正在运行的线程处于睡眠状态 xff0c 是一个静态方法 xff0c 调用此方法要处
智能医疗辅助诊断——调查与思考

背景为什么要做智能医疗 xff1f 优质医疗资源不足且增长缓慢各地方医疗资源分配不均客观条件满足 xff0c 人工智能技术发展 xff0c 算法算力数据齐备目录指出 xff0c 医用软件按照预期用途分为辅助诊断类和治疗类诊断功能
WebMvcConfigurer配置HandlerInterceptor拦截器失效

1 前言 Springboot2 0之前 xff0c 实现拦截器功能的配置类是通过继承 extends WebMvcConfigurerAdapter类完成的 xff0c 最近项目把Springboot升级到了Springboot2 X x
ubuntu deepin wechat中文乱码解决

deepin wechat 中文乱码解决方案方案一执行以下命令打开文件 gedit opt deepinwine tools run sh 找到WINE CMD 修改为 WINE CMD span class token operato
使用k-近邻算法识别手写数字

本文摘自机器学习实战案例 xff0c 对其进行了代码更新与注释实战介绍使用k 近邻分类器构造手写识别系统 xff0c 为了简单起见 xff0c 系统只识别0 9 xff0c 需要识别的数字已经使用图形处理软件 xff0c 处理成具有