基于k近邻（KNN）的手写数字识别

2023-05-16

作者：faaronzheng 转载请注明出处！

最近再看Machine Learning in Action. k近邻算法这一章节提供了不少例子，本着Talk is cheap的原则，我们用手写数字识别来实际测试一下。简单的介绍一下k近邻算法（KNN）：给定测试样本，基于某种距离度量找出训练集中与其最靠近的k个训练样本，然后基于这k个“邻居”的信息来进行预测。如下图所示：

x为测试样本，小黑点是一类样本，小红点是另一类样本。在测试样本x的周围画一个圈，这个圈就是依据某种距离度量画出的，可以看到我们选择的是5近邻。现在我们要做出一个预测，就是这个测试样本x是属于小黑点那一类还是小红点那一类呢？很简单，我们只要看看选中的近邻中哪一类样本多就把这类样本的标签赋给测试样本就可以了。图中自然就是小黑点，所以我们预测x是小黑点。

正文：

第一步：准备实验数据。Machine Learning in Action书中的数据使用的是“手写数字数据集的光学识别”一文中的数据。具体可以参考书中的相关介绍。所有的数据是以Txt形式保存的，由32行32列的0/1元素组成。下图就是一个手写数字0的保存数据。可以看出，数字所在的位置用1表示，空白的用0表示。

除此之外，为了能识别自己手写的数字，我们在原来实验的基础上添加画板的功能，使其能采集自己手写的数字并按照相同的格式保存下来。如下图所示，当点击CustomizeTestData后会出现一个画板，当我们在画板上写上数字后，按下ESC键保存图片并退出，接下来将保存的图片处理成我们想要的格式，就可以用算法对其进行预测了。画板的实现使用了pygame。

下面是画板功能的具体实现：

import pygame
from pygame.locals import *
import math
from sys import exit
#向sys模块借一个exit函数用来退出程序
pygame.init()
#初始化pygame,为使用硬件做准备
 
class Brush():
 def __init__(self, screen):
  self.screen = screen
  self.color = (0, 0, 0)
  self.size = 4
  self.drawing = False
  self.last_pos = None
  self.space = 1
  # if style is True, normal solid brush
  # if style is False, png brush
  self.style = False
  # load brush style png
  self.brush = pygame.image.load("brush.png").convert_alpha()
  # set the current brush depends on size
  self.brush_now = self.brush.subsurface((0,0), (1, 1))
 
 def start_draw(self, pos):
  self.drawing = True
  self.last_pos = pos
 def end_draw(self):
  self.drawing = False
 
 def set_brush_style(self, style):
  print "* set brush style to", style
  self.style = style
 def get_brush_style(self):
  return self.style
 
 def get_current_brush(self):
  return self.brush_now
 
 def set_size(self, size):
  if size < 0.5: size = 0.5
  elif size > 32: size = 32
  print "* set brush size to", size
  self.size = size
  self.brush_now = self.brush.subsurface((0,0), (size*2, size*2))
 def get_size(self):
  return self.size
 
 def set_color(self, color):
  self.color = color
  for i in xrange(self.brush.get_width()):
   for j in xrange(self.brush.get_height()):
    self.brush.set_at((i, j),
      color + (self.brush.get_at((i, j)).a,))
 def get_color(self):
  return self.color
 
 def draw(self, pos):
  if self.drawing:
   for p in self._get_points(pos):
    # draw eveypoint between them
    if self.style == False:
     pygame.draw.circle(self.screen, self.color, p, self.size)
    else:
     self.screen.blit(self.brush_now, p)
 
   self.last_pos = pos
 
 def _get_points(self, pos):
  """ Get all points between last_point ~ now_point. """
  points = [ (self.last_pos[0], self.last_pos[1]) ]
  len_x = pos[0] - self.last_pos[0]
  len_y = pos[1] - self.last_pos[1]
  length = math.sqrt(len_x ** 2 + len_y ** 2)
  step_x = len_x / length
  step_y = len_y / length
  for i in xrange(int(length)):
   points.append(
     (points[-1][0] + step_x, points[-1][1] + step_y))
  points = map(lambda x:(int(0.5+x[0]), int(0.5+x[1])), points)
  # return light-weight, uniq integer point list
  return list(set(points))
 
class Menu():
 def __init__(self, screen):
  self.screen = screen
  self.brush = None

 def set_brush(self, brush):
  self.brush = brush

 
class Painter():
 def __init__(self):
  self.screen = pygame.display.set_mode((100, 100))
 # self.menu = pygame.display.set_mode((80, 600))
  pygame.display.set_caption("Painter")
  self.clock = pygame.time.Clock()
  self.brush = Brush(self.screen)
  self.menu = Menu(self.screen)
  self.menu.set_brush(self.brush)
 
 def run(self):
  self.screen.fill((255, 255, 255))
  while True:
   # max fps limit
   self.clock.tick(30)
   for event in pygame.event.get():
    if event.type == QUIT:
        pygame.quit()
     #   break
    elif event.type == KEYDOWN:
     # press esc to clear screen
     if event.key == K_ESCAPE:
      fname = "test.png"
      pygame.image.save(self.screen, fname)    
      pygame.quit()
      #break
    elif event.type == MOUSEBUTTONDOWN:
     # <= 74, coarse judge here can save much time
     if ((event.pos)[0] <= 74 and
       self.menu.click_button(event.pos)):
      # if not click on a functional button, do drawing
      pass
     else:
      self.brush.start_draw(event.pos)
    elif event.type == MOUSEMOTION:
     self.brush.draw(event.pos)
    elif event.type == MOUSEBUTTONUP:
     self.brush.end_draw()
    self.menu.draw()
    pygame.display.update()

KNN算法--KNN的关键在我看来是距离度量的选择。不同的距离度量会对最终的结果产生比较大的影响。首先将手写数字变化为一个一维的向量，通过计算测试样例（向量）和每个训练样本（向量）之间的距离然后进行排序。最后选最近的k个进行投票产生对测试样例的预测。

import pygame
from numpy import *
import operator
from os import listdir
from Board import *
import Tkinter
import tkFileDialog
import tkMessageBox
import Image  
from KNN import dot
pygame.init()


def classify0(inX, dataSet, labels, k):           #k控制选取最近的k个近邻然后投票
    dataSetSize = dataSet.shape[0]
    #计算欧式距离（其实比较的是两个向量之间的距离）
    diffMat = tile(inX, (dataSetSize,1)) - dataSet
    sqDiffMat = diffMat**2
    sqDistances = sqDiffMat.sum(axis=1)
    distances = sqDistances**0.5
    sortedDistIndicies = distances.argsort()     
    classCount={}          
    #投票
    for i in range(k):
        voteIlabel = labels[sortedDistIndicies[i]]
        classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1
    sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse=True)
    return sortedClassCount[0][0]
def classify1(inX,dataSet,labels, k):
 dataSetSize = dataSet.shape[0]
 diffMat = tile(inX, (dataSetSize,1)) - dataSet
 diffMatT=(diffMat.T)
 sqDiffMat = dot(diffMat,diffMat.T)
 distances = sqrt(sqDiffMat)   
 sortedDistIndicies=distances.argsort() 
 classCount={}         
#投票
 for i in range(k):
    voteIlabel = labels[sortedDistIndicies[i]]
    classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1
 sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse=True)
 return sortedClassCount[0][0]
# 将文件转化为向量
def img2vector(filename):
    returnVect = zeros((1,1024))
    fr = open(filename)
    for i in range(32):
        lineStr = fr.readline()
        for j in range(32):
            returnVect[0,32*i+j] = int(lineStr[j])
    return returnVect

def handwritingClassTest(TrainDataPath):
    hwLabels = []
    trainingFileList = listdir(TrainDataPath)           #load the training set
    m = len(trainingFileList)
    trainingMat = zeros((m,1024))
    for i in range(m):
        fileNameStr = trainingFileList[i]
        fileStr = fileNameStr.split('.')[0]     #take off .txt
        classNumStr = int(fileStr.split('_')[0])
        hwLabels.append(classNumStr)
        trainingMat[i,:] = img2vector(TrainDataPath+'/%s' % fileNameStr)
    testFileList = listdir('C:/Users/HP/Desktop/MLiA_SourceCode/machinelearninginaction/Ch02/testDigits')        #iterate through the test set
    errorCount = 0.0
    mTest = len(testFileList)
    for i in range(mTest):
        fileNameStr = testFileList[i]
        fileStr = fileNameStr.split('.')[0]     #take off .txt
        classNumStr = int(fileStr.split('_')[0])
        vectorUnderTest = img2vector('C:/Users/HP/Desktop/MLiA_SourceCode/machinelearninginaction/Ch02/testDigits/%s' % fileNameStr)
        classifierResult = classify0(vectorUnderTest, trainingMat, hwLabels, 3)
        print "the classifier came back with: %d, the real answer is: %d" % (classifierResult, classNumStr)
        if (classifierResult != classNumStr): errorCount += 1.0
    print "\nthe total number of errors is: %d" % errorCount
    print "\nthe total error rate is: %f" % (errorCount/float(mTest))

top = Tkinter.Tk()

def TrainDataCallBack():
    TrainDataPath=tkFileDialog.askdirectory()
    handwritingClassTest(TrainDataPath)

def CustomizeTestDataCallBack():
    board = Painter()
    board.run()
    
def TestingCustomizeTestDataCallBack():
    ResizePic()
    TransformArray()
TrainDataButton = Tkinter.Button(top, text ="TrainData", command = TrainDataCallBack)
CustomizeTestDataButton = Tkinter.Button(top, text ="CustomizeTestData", command = CustomizeTestDataCallBack)
TestingButton = Tkinter.Button(top, text ="TestingCustomizeTestData", command = TestingCustomizeTestDataCallBack)

def ResizePic():
    im = Image.open("test.png")  
    w,h = im.size  
    im_ss = im.resize((int(32), int(32)))  
    im_ss.save("test.png")  

def TransformArray():
    TestArray = zeros((1,1024))
    im = Image.open("test.png")  
    width,height = im.size  
    for h in range(0, height):  
      for w in range(0, width):  
        pixel = im.getpixel((w, h))      
        if pixel!=(255,255,255):
            TestArray[0,32*h+w]=int(1)
    handwritingTesting(TestArray)


def handwritingTesting(TestArray):
  #  TrainDataPath=tkFileDialog.askdirectory()
    TrainDataPath="C:/Users/HP/Desktop/MLiA_SourceCode/machinelearninginaction/Ch02/trainingDigits"
    hwLabels = []
    trainingFileList = listdir(TrainDataPath)           #load the training set
    m = len(trainingFileList)
    trainingMat = zeros((m,1024))
    for i in range(m):
        fileNameStr = trainingFileList[i]
        fileStr = fileNameStr.split('.')[0]     #take off .txt
        classNumStr = int(fileStr.split('_')[0])
        hwLabels.append(classNumStr)
        trainingMat[i,:] = img2vector(TrainDataPath+'/%s' % fileNameStr)      
    classifierResult = classify0(TestArray, trainingMat, hwLabels, 100)
    classifierResult1 = classify1(TestArray, trainingMat, hwLabels, 100)
    print "the classifier came back with: %d"  %  classifierResult
    print "the classifier came back with: %d"  %  classifierResult1
       
TrainDataButton.pack()
CustomizeTestDataButton.pack()
TestingButton.pack()
top.mainloop()

源代码下载：faaron-KNN手写字识别

这里面我们采用了很笨的方法将测试样本与所有训练样本进行比较，更有效的方法是采用KD树。另外k的取值在这里也是固定的，更好的方法是在一个区间内网格搜索~

未完待续。。。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

KNN

手写数字识别

基于k近邻（KNN）的手写数字识别的相关文章

基于numpy的CNN实现，进行MNIST手写数字识别

主要框架来自于这篇文章 xff1a https blog csdn net qq 36393962 article details 99354969 xff0c 下面会以原文来代称这篇文章本文在原文的基础上增加了交叉熵以及mnist数据集
机器学习（二）--- KNN（K-Nearest Neighbors）

KNN K Nearest Neighbors 简单类比 xff08 Simple Analogy xff09 KNN xff1a 通过你周围的人来判断你是哪一类人 Tell me about your friends who your n
最简单的分类算法之一：KNN（原理解析+代码实现）

KNN K Nearest Neighbor 即K最邻近算法是数据挖掘分类技术中最简单的方法之一简单来说它是根据最邻近这一特征来对样本进行分类目录 1 大致了解KNN 2 原理分析 2 1一些数学知识 2 2算法思想 3 代码实
基于Hadoop的Knn算法实现

Knn算法的核心思想是如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类别则该样本也属于这个类别并具有这个类别上样本的特性该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别 Knn方法在类
K最近邻算法（KNN）---sklearn+python实现

k 近邻算法概述简单地说 k近邻算法采用测量不同特征值之间的距离方法进行分类 k 近邻算法优点精度高对异常值不敏感无数据输入假定缺点计算复杂度高空间复杂度高适用数据范围数值型和标称型 k 近邻算法 kNN 它的工作原理是
机器学习(四)：基于KNN算法对鸢尾花类别进行分类预测

文章目录专栏导读 1 KNN算法原理 2 实战案例对鸢尾花类别分类预测 2 1确定特征和类别 2 2对特征进行处理 2 3对模型调参选择最优参数 2 4使用分类模型进行预测 2 5评估模型检验模型效果 3 完整代码及结果专栏导读
KNN分类算法原理及其Matlab实现

KNN算法原理 K近邻算法是一种简单的监督学习算法对于给定测试样本直接计算该样本和训练集的距离将距离最近的k个邻居点的类别作为参考作为预测结果返回测试数据测试数据来自林智仁的分类任务数据集链接 https www csie
DolphinDB 机器学习在物联网行业的应用：实时数据异常率预警

数据异常率预警在工业安全生产中是一项重要工作对于监控生产过程的稳定性保障生产数据的有效性维护生产设备的可靠性具有重要意义随着大数据技术在生产领域的深入应用基于机器学习的智能预警已经成为各大生产企业进行生产数据异常率预警的一种有效解
TensorFlow学习笔记（八）—— TensorFlow基于MNIST数据集识别手写数字

训练程序参照Tensorflow中文社区教程 http www tensorfly cn tfdoc tutorials mnist pros html 能在自己的环境中成功运行代码注意一点关于教程的print函数在博主用的Pyth
kNN处理iris数据集-使用交叉验证方法确定最优 k 值

基本流程 1 计算测试实例到所有训练集实例的距离 2 对所有的距离进行排序找到k个最近的邻居 3 对k个近邻对应的结果进行合并再排序返回出现次数最多的那个结果交叉验证对每一个k 使用验证集计算记录k对应的错误次数取错误数最小的
KNN分类——matlab（转载）

KNN分类 matlab 时间 2016 09 06 标签 matlab knn算法算法栏目 MATLAB 原文 http blog csdn net lwwangfang article details 52452429 adsbyg
朴素贝叶斯与KNN算法

朴素贝叶斯算法数学基础我们先举一个例子投硬币是一个随机过程我们不能预测任意一次投币结果是正面还是反面我们只能谈论其下一次结果是正面或者反面的概率如果容貌取得一些额外的数据如硬币的精准成分硬币的最初位置投币的力量与方向硬币
sklearn K近邻KNeighborsClassifier参数详解

原文网址 https scikit learn org stable modules generated sklearn neighbors KNeighborsClassifier html class sklearn neighbors
k近邻算法中k的值

我有 7 个类需要分类我有 10 个特征在这种情况下我需要使用 k 的最佳值吗或者我是否必须针对 1 到 10 大约 10 之间的 k 值运行 KNN 并在算法本身的帮助下确定最佳值此外文章我在评论里发帖有this one这也表明
Predict() 返回太多值而不是一个

我正在构建一个系统根据最适合用户的内容从数据集中推荐一本书问题是不仅退还给我一本书而且还出了很多书我该如何解决代码是这样的 from sklearn neighbors classification import KNeighb
matlab中的KNN算法

我正在研究拇指识别系统我需要实现 KNN 算法来对我的图像进行分类根据this 它只有 2 个测量值通过这些测量值计算找到最近邻居的距离但在我的例子中我有 400 张 25 X 42 的图像其中 200 个用于训练 200 个用
SKLearn 中具有类别权重的 KNN [关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案是否可以在 SKLearn 中定义 K 最近邻分类器的类权重我查看了API 但无法解决我有一个 knn 问题它的类
np 数组之间的欧氏距离

我有两个 numpy 数组 a 和 b a 和 b 的尺寸相同 a 的尺寸可以与 b 的尺寸不同例如 a 1 2 5 7 b 3 8 4 7 9 15 有没有一种简单的方法来计算 a 和 b 之间的欧几里得距离以便这个新数组可以在 k
Java 中字符串（非结构化数据）的 K 最近邻实现

我正在寻找 Java 中针对非结构化数据的 K 最近邻算法的实现我发现了许多数字数据的实现但是我如何实现它并计算文本字符串的欧几里得距离以下是 double 的一个示例 public static double Euclidean
如果 kNN 没有训练阶段，当我们将 .fit() 方法应用于 Scikit-learn 中的 kNN 模型时会发生什么？

由于 kNN 在 RAM 级别处理训练和预测并且不需要显式的训练过程那么当拟合 knn 模型时到底会发生什么我认为这一步与训练模型有关谢谢这是如果我跳过拟合步骤将会得到的错误 NotFittedError This KNeighb

随机推荐

DS18B20 1-WIRE ROM搜索算法详解

转自 xff1a http blog sina com cn s blog 57ad1bd20102uxxw html 1 WIRE 搜索算法详解 xff08 1 xff09 0 前言美信公司 xff08 http www maximin
关于python tkinter 多线程依然无响应问题

今天解决了一个GUI程序的多线程问题因为GUI程序在执行高IO操作的时候容易出现假死和无响应的状态 xff0c 所以需要用到多线程但我的程序开了线程之后依然是无响应状态几次尝试 xff0c 终于找到问题所在 1 首先 xff0c 我的
Ubuntu内核的查看、更新、卸载、取消及启用自动更新

1 查看当前内核版本 xff1a uname r 2 升级内核 xff1a sudo apt get update sudo apt cache search linux image 查看可用内核在选择合适的内核后 xff0c sudo
孤立森林(Isolation Forest)

背景现有的异常检测方法主要是通过对正常样本的描述 xff0c 给出一个正常样本在特征空间中的区域 xff0c 对于不在这个区域中的样本 xff0c 视为异常这些方法的主要缺点是 xff0c 异常检测器只会对正常样本的描述做优化 xff0
FreeRTOS三种数据结构区别（StreamBuffer，MessageBuffer，Queue）

Queue队列是最基本的数据结构 xff0c 在FreeRTOS v10 0后提供了另外两种高级数据结构为Streambuffer和MessageBuffer xff0c 称为流式缓冲区和消息缓冲区 FreeRTOS 嵌入式系统开源 Fre
ubuntu16安装librealsense 以及在ros上使用 [深度相机sr300]

记录ubuntu16安装librealsense 和ros包的过程 xff0c 还有一些遇到的问题温馨提醒如果按照下面步骤每一步完成 xff08 都没报错 xff09 xff0c 还是不能显示图像 xff0c 换个usb3 0口试试或者
原生安卓苹果APP-java抢单派单系统平台源码

简介 xff1a java源码派单系统平台源码完整版带项目说明网盘下载地址 xff1a http kekewl cc 9qsCp179URb0 图片 xff1a
基于Android和OpenCV的物体跟随系统设计需要留言

本设计为基于Android和OpenCV的物体跟随系统设计本文对基于计算机视觉的物体跟随系统的特点和应用领域国内外的研究现状及其发展分别做出了较详尽介绍并且按照社会科技化进步的要求 xff0c 给出了具有参考意义的智能跟随模块系统根
【Linux C王者归来】【第十一章】【进程控制】

1 程序可以有多个进程 xff0c 一个进程与进程id11 对应 2 PROC中的数字对应id号 xff0c getpid和getppid可以获得进程id父进程id 3 getuid geteuid 获得进程用户id和有效用户id 4 ge
DSP28335使用FIFO的串口中断总结

一串行通信与并行通信 DSP控制器间 xff0c DSP控制器与外部设备间交换信息 xff0c 通信 xff0c 可采取的通信方式主要两大类1 串行通信 2 并行通信并行通信一般包括多条数据线多条控制线和状态线 xff0c 传输速度快
点阵屏上绘图——基于LCD12864 控制详解

本文引用自 xff1a http blog csdn net s3c44b0x article details 7498706 原始地址 xff1a http www amobbs com thread 591361 1 1 html 相关
使用iPad编写C++程序(转载)

使用iPad编写C 43 43 程序一搭建C 43 43 环境 1在cydia内安装 deb 包注 xff1a 在cydia 软件源设置中改为开发者 xff0c 否则有些deb搜索不到 OpenSSH xff0c OpenSSL w
Python多线程学习(三、生产者与消费者)

生产者与消费者问题是典型的同步问题这里简单介绍两种不同的实现方法 1 xff0c 条件变量 view plaincopy to clipboardprint import threading import time class Produ
在~Firmware下面用roslaunch 启动launch 报错 udp0: sendto:Invalid argument

在 Firmware下面用roslaunch 启动launch 报错 xff0c 如下 roslaunch px4 mavros posix sitl launch 报错 ERROR 1658284290 546891096 udp0 se
roslaunch运行px4功能包报错

运行条件ubuntu 16 04 ros kinetic 隔段时间运行roslaunch 会如下错误 mavros posix sitl launch is neither a launch file in package px4 nor
tf2_ros::Buffer::Buffer(ros::Duration, bool)’未定义的引用

新建一个功能包及 cpp文件后报错tf2 ros Buffer Buffer ros Duration bool 未定义的引用 opt ros kinetic include tf2 ros buffer h 51 xff1a 对 vtab
Android Studio 配置 JDK1.8 使用Lambda表达式

Android Studio 配置 JDK1 8 使用Lambda表达式 JDK1 8 添加几项新特性譬如对集合的优化语法的便捷配合Lambda表达式使用可以让代码更加简便美观 xff0c 但对于一些没有接触Lambda表达式的同学们来说就
深入解读四轴飞行器的硬件设计

xfeff xfeff 转载自 xff1a http www openedv com posts list 20892 htm 传感器之一 xff1a 角速度传感器应用科里奥利力原理 xff1a 科里奥利力来自于物体运动所具有的惯性 xff
【GIT】使用Vscode同步git仓库，错误和解决方法记录

这里写目录标题命令行操作仓库常见命令1 报错在签出前 xff0c 请清理存储库工作树 2 报错 fatal unable to access 39 https github com 39 OpenSSL SSL read Connect
基于k近邻（KNN）的手写数字识别

作者 xff1a faaronzheng 转载请注明出处 xff01 最近再看Machine Learning in Action k近邻算法这一章节提供了不少例子 xff0c 本着Talk is cheap的原则 xff0c 我们用手写数

基于k近邻（KNN）的手写数字识别

基于k近邻（KNN）的手写数字识别 的相关文章

随机推荐

热门标签

基于k近邻（KNN）的手写数字识别的相关文章