聚类（K-means）实现手写数字识别-2

2023-05-16

其他实现手写数字识别的方法：
1.KNN实现手写数字识别
2. 卷积神经网络（CNN）实现手写数字识别
3. 全连接神经网络实现手写数字识别
4. 聚类（K-means）实现手写数字识别

实验数据是老师收集了所有人的手写数字图片，且经过处理将图像生成了.txt文件，如何生成点击这，如下图
代码实现

from __future__ import print_function
import numpy as np
import tensorflow as tf
from tensorflow.contrib.factorization import KMeans
from os import listdir
from keras.utils import to_categorical

"""
函数说明:将32x32的二进制图像转换为1x1024向量
"""
def img2vector(filename):
    # 创建1x1024零向量
    returnVect = np.zeros((1, 1024))
    # 打开文件
    fr = open(filename)
    # 按行读取
    for i in range(32):
        # 读一行数据
        lineStr = fr.readline()
        # 每一行的前32个元素依次添加到returnVect中
        for j in range(32):
            returnVect[0, 32 * i + j] = float(lineStr[j])
    # 返回转换后的1x1024向量
    return returnVect

'''
函数说明：获取标签
'''
def getLabel(Datapath):
    # 训练集的Labels
    hwLabels = []
    # 返回Datapath目录下的文件名
    trainingFileList = listdir(Datapath)
    # 返回文件夹下文件的个数
    m = len(trainingFileList)
    # 从文件名中解析出训练集的类别
    for i in range(m):
        # 获得文件的名字
        fileNameStr = trainingFileList[i]
        # 获得分类的数字
        classNumber = int(fileNameStr.split('_')[0])
        # 将获得的类别添加到hwLabels中
        hwLabels.append(classNumber)
    return hwLabels

'''
函数说明：获取数据
'''
def getData(Datapath):
    # 返回train目录下的文件名
    trainingFileList = listdir(Datapath)
    # 返回文件夹下文件的个数
    m = len(trainingFileList)
    # 初始化训练的Mat矩阵,训练集
    trainingMat = np.zeros((m, 1024))
    for i in range(m):
        # 获得文件的名字
        fileNameStr = trainingFileList[i]
        # 将每一个文件的1x1024数据存储到trainingMat矩阵中
        trainingMat[i, :] = img2vector(Datapath+'/%s' % (fileNameStr))
    return trainingMat

# 加载数据
train_images = getData('train')
test_images = getData('testless')
train_labels = getLabel('train')
train_labels = to_categorical(train_labels)
test_labels = getLabel('testless')
test_labels = to_categorical(test_labels)

full_data_x = train_images

# 参数
num_steps = 1000  # 训练次数
batch_size = 10  # 每一批的样本数
k = 60  # clusters的数量
num_classes = 10  # 10分类
num_features = 1024  # 每张图片是32*32

# 输入图片
X = tf.placeholder(tf.float32, shape=[None, num_features])
# Labels (将标签分配给质心并用于测试)
Y = tf.placeholder(tf.float32, shape=[None, num_classes])

# K-Means 的参数
# inputs：输入张量或输入张量列表。假设数据点先前已被随机置换。
# num_clusters：一个整数张量，指定簇的数量。如果initial_clusters是张量或numpy数组，则忽略此参数。
# distance_metric：用于群集的距离度量。支持的选项：“squared_euclidean”，“cosine”。
# use_mini_batch：如果为true，请使用小批量k-means算法。
# mini_batch_steps_per_iteration：更新的集群中心同步回主副本的步骤数。
kmeans = KMeans(inputs=X, num_clusters=k, distance_metric='cosine',
                use_mini_batch=True)

# 创建 KMeans 模型
training_graph = kmeans.training_graph()

# 返回值
# all_scores: 每个向量到每个簇的距离，是一个[样本数， 簇数]的矩阵
# cluster_idx： 每个样本被分到的簇的标记，为([样本数], type)的元组
# scores: 每个样本到其被分到的簇的距离，为[样本数]大小的矩阵，
# cluster_centers_initialized:返回bool值，cluster是否被初始化（不知道有什么用）
# init_op： 初始化操作，sess init的时候需要传入样本
# training_op： 训练操作

if len(training_graph) > 6:
    (all_scores, cluster_idx, scores, cluster_centers_initialized,
     cluster_centers_var, init_op, train_op) = training_graph
else:
    (all_scores, cluster_idx, scores, cluster_centers_initialized,
     init_op, train_op) = training_graph

cluster_idx = cluster_idx[0]
avg_distance = tf.reduce_mean(scores)  # 用于计算张量tensor沿着指定的数轴（tensor的某一维度）上的的平均值

# 初始化变量 (用默认值)
init_vars = tf.global_variables_initializer()


sess = tf.Session()
sess.run(init_vars, feed_dict={X: full_data_x})
sess.run(init_op, feed_dict={X: full_data_x})  # 使用之前 一定要使用数据初始化 KMeans

# 训练
for i in range(1, num_steps + 1):
    _, d, idx = sess.run([train_op, avg_distance, cluster_idx],
                         feed_dict={X: full_data_x})
    if i % 10 == 0 or i == 1:
        print("Step %i, Avg Distance: %f" % (i, d))

# 为每个质心分配标签
# 使用每次训练的标签计算每个质心的标签总数
# 计算样本到最近的质心
counts = np.zeros(shape=(k, num_classes))
# print(len(idx))
for i in range(len(idx)):
    counts[idx[i]] += train_labels[i]
# 将最频繁的标签分配给质心
labels_map = [np.argmax(c) for c in counts]
# print(labels_map)
labels_map = tf.convert_to_tensor(labels_map)  # 将给定值转换为张量

# 评估
#  查找：centroid_id 的标签
cluster_label = tf.nn.embedding_lookup(labels_map, cluster_idx)
# print(cluster_label)
# 计算准确路
# tf.equal(x,y,name=None)
# 判断，x, y 是不是相等，它的判断方法不是整体判断，
# 而是逐个元素进行判断，如果相等就是True，不相等，就是False
# 由于是逐个元素判断，所以x，y 的维度要一致。

# tf.cast():用于改变某个张量的数据类型

# tf.argmax(input,axis)根据axis取值的不同返回每行或者每列最大值的索引。
# axis=0时比较每一列的元素，将每一列最大元素所在的索引记录下来，
# 最后输出每一列最大元素所在的索引数组。
# axis=1的时候，将每一行最大元素所在的索引记录下来，
# 最后返回每一行最大元素所在的索引数组
correct_prediction = tf.equal(cluster_label, tf.cast(tf.argmax(Y, 1), tf.int32))
accuracy_op = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

# 测试模型
test_x, test_y = test_images, test_labels
print("Test Accuracy:", sess.run(accuracy_op, feed_dict={X: test_x, Y: test_y}))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

聚类（K-means）实现手写数字识别-2 的相关文章

Ubuntu20.04安装ROS2+ROS2-PX4框架搭建

目录 Ubuntu20 04安装ROS2Set localeSetup SourcesInstall ROS2 packageEnvironment setup测试 ROS2 PX4框架搭建Install PX4Install ROS2Se
Jetson Nano利用ROS2通过MicroDDS与PX4通讯

目录 Jetson Nano安装Ubuntu20 04Ubuntu20 04 配置ROS2环境Pixhawk配置Jetson Nano上MicroDDS Agent配置及和pixhawk通讯 PX4在V1 14及后续版本中 xff0c 将原
用速腾RS16跑LeGO-LOAM

版权声明 xff1a 本文为博主原创文章 xff0c 遵循 CC 4 0 BY SA 版权协议 xff0c 转载请附上原文出处链接和本声明本文链接 xff1a https blog csdn net Zed Of Zoe article
Visual Studio 2017环境配置MPI v9.0 并行编程环境

目录第一步 xff1a 下载安装mpi 官网 xff1a http www mpich org windows版官网 xff1a https msdn microsoft com en us library bb524831 v 61 v
学习java基础的心得感悟

学完java基础 xff0c 对java面向对象的思想有更加深刻的认识了 xff0c 从学习java语言概述到最后网络编程IDE的使用 xff0c 时间用了1个月零9天 xff0c 上课时间28天 xff0c 回首感觉快又感觉漫长 xff0
如何使用SQL批量替换数据库特定字段中部分特定数据

1 替换数据库特定字段中部分特定数据的SQL语句 SQL语句 xff1a update 表名 set 字段名 61 replace 字段名原字符串需要替换成的字符串以将表exam major中的字段pos2019中的数据 50 替换成
阿里云ubuntu16.04 server 配置方案 1 配置桌面环境

首先为服务器配置一个桌面系统升级一下哦 xff01 span class hljs built in sudo span apt get update span class hljs built in sudo span apt get
Xshell远程连接华为云服务器

Xshell远程连接华为云服务器一关于华为云1 什么是云服务器2 为什么使用华为云3 我的华为云体验二控制台操作 1 设置密码 2 开放端口 3 切换系统三 Xshell操作 1 下载Xshell和Xftp2 连接云服务器一关
校园网网络连接反复断开又连接是什么原因？

网络连接反复断开又连接是什么原因 xff1f 原因可能跟ARP攻击或擅自使用P2P终结者等攻击软件有关因为校园内多个楼宇已部署防ARP攻击网络设备 xff0c 只要判断用户计算机感染ARP或使用P2P终结者网络执法官聚生网管等软件攻击
xuperchain源码分析-启动过程

xuperchain的启动分为两个比较大的过程 xff0c 一个是节点的初始化 xff0c 另一个是挖坑的初始化
通过Excel学习PID算法（一步步理解它的KP,KI,KD）

PID原理 PID控制算是应用非常广泛的经典控制算法但是怎么理解PID这三个参数呢 xff1f 在参考了别人的文章之后 xff0c 我还是有点一知半解 xff0c 这时候发现不自己动手算一算是很难理解PID了 xff0c 但是我又不想做这
通过Excel学习PID算法（连续系统的PID）

总结上一节在之前 xff0c 我们用倒水的例子通俗易懂的解释了什么是PID算法在这里先回顾一下之前的学习的内容 P表示对误差的比例系数与目标值差多少 xff0c 就在下一次修正中加上这个误差与P的乘积 xff0c 同时会导致系统有一个
原来学习是如此地苦涩

原文链接 xff1a http blog csdn net tangl 99 article details 2047657 最近一直在忙第一篇Paper xff0c 虽然想法大致的框架成熟了 xff0c 但是还有一些细节需要完善这几天在
互联网+时代的7个引爆点（读书笔记）

百货商场里的销售人员一直抱怨 xff0c 大家只是到自己这里来看看 xff0c 之后转身就在网上下单从旧视角瞎看这固然是一种文体 xff0c 显示着揭示了一种新的机会以线下体验为入口的机会小团队精益式的迭代 xff0c 几个周期后就可
maperuce运算框架

1 xff0c 概念 mapreduce 运算框架主要实现hadoop 的数据处理 xff0c 数据处理中流经过5个节点数据流 xff1a input gt spilt gt map gt shuffle gt reduce xff08
在Python中使用print输出时，出现UnicodeEncodeError错误，错误提示为“‘gbk‘ codec can‘t encode character ‘\u2022‘ in posit

利用chatgpt一步步解决了这个问题 xff0c 感觉ChatGPT还是太强大了问题描述 xff1a 在Python中使用print输出时 xff0c 出现UnicodeEncodeError错误 xff0c 错误提示为 39 gbk
openstack一些特性资料

Keystone RBAC nova compute Cells Bare Metal Compute 是什么东西 xff1f http wiki openstack org blueprint nova compute cells htt
【神经网络和深度学习-开发案例】第二章神经网络结构

神经网络和深度学习第二章神经网络结构案例 xff1a 使用神经网络识别手写数字我将介绍一个神经网络 xff0c 它可以很好地对手写的数字进行分类为了准备这一点 xff0c 它有助于解释一些术语 xff0c 让我们可以命名一个网络的
2000页kubernetes操作手册，内容详细代码清晰，小白也能看懂

现如今 xff0c Kubernetes业务已成长为新时代的IT基础设施 xff0c 并成为高级运维工程师架构师后端开发工程师的必修技术栈毫无疑问 xff0c Kubernetes是云计算发展演进的一次彻底革命性的突破 xff0c 只
FreeRTOS代码阅读笔记：heap_4.c

FreeRTOS中对于内存的管理当前一共有5种实现方式 xff08 作者当前的版本是10 1 1 xff09 xff0c 均在 Source portable MemMang 下面 xff0c 这里笔记下 heap 4 c和第二种方式比较相

随机推荐

（1）touchgfx 添加时钟控件

第一步 xff1a 新建空白模版添加图片 xff1a 放入链接 xff1a https pan baidu com s 1NI6LUYrTUs64Z2jZE6AAQQ 提取码 xff1a 2odw 添加控件 xff1a 位置部件属性1T
【基于51】红外寻迹智能小车 - 代码篇

文章目录前言一准备工作二使用步骤1 模块化编程2 电机模块3 小车动作模块4 PWM 和定时器中断系统5 寻迹逻辑总结前言关于硬件部分可以看我上次写的帖子https blog csdn net ZER00000001 arti
C++关键字override

一什么是override override的翻译是覆盖实际上它在C 43 43 中可以检测哪些虚函数没有被重写并报错注 xff1a 在派生类的成员函数中使用override时 xff0c 如果基类中无此函数 xff0c 或基类中的函数
邻接矩阵和邻接表

图的概述和存储结构 xff08 一 xff09 文章目录前言一图的概述1 xff09 图的分类2 xff09 图的要素二图的存储结构三邻接矩阵四邻接表前言有一种说法是程序是由数据结构和算法组成的 xff0c 这很能体现出数据
图解迪杰斯特拉（Dijkstra）最短路径算法

往期文章目录干货满满 xff01 最小生成树 Prim算法最小生成树 Kruskal算法目录前言一最短路径的概念及应用二 Dijkstra迪杰斯特拉 1 什么是Dijkstra 2 逻辑实现总结前言无论是什么程序都要和数
Vscode配置Git+快速入门，一篇学会80%的Git操作

前言团队开发中经常会用到Git xff0c 能极大简化开发的流程 xff0c 而个人开发也可以利用Git管理自己的代码同样作为一个初学者 xff0c 我在学完Git之后写下这篇文章总结个人走过的坑 xff0c 大家一起进步 Git下载和
【C++11】三大神器之——智能指针

文章目录前言一智能指针的原理1 RAII机制2 简单的实现二智能指针的用法1 智能指针的分类2 unique ptr基本语法 3 shared ptr基本语法 4 删除器5 weak ptr 前言一智能指针的原理 1 RAII
【C++11】三大神器之——右值、移动语义、完美转发

前言如果你还不知道C 43 43 11引入的右值移动语义完美转发是什么 xff0c 可以阅读这篇文章 xff1b 如果你已经对这些知识了如指掌 xff0c 也可以看看有什么可以补充 x1f60f 一右值值类别vs变量类型在正式认
【C++11】三大神器之——包装器和绑定器

前言如果你还不知道 C 43 43 11 引入的包装器和绑定器是什么 xff0c 可以读读这篇文章 xff0c 看看有什么启发 xff1b 如果你已经对包装器和绑定器了如指掌 xff0c 也可以读读这篇文章 xff0c 看看有什么补充
【神经网络和深度学习-开发案例】第四章神经网络如何对数字进行分类

神经网络和深度学习第四章神经网络如何对数字进行分类案例 xff1a 使用神经网络识别手写数字好了 xff0c 让我们来写一个程序 xff0c 学习如何识别手写的数字 xff0c 使用随机梯度下降和MNIST的训练数据我们将用一个简
Win7下安装Ubuntu（双硬盘）的简要步骤

0 硬件准备一个至少4G大小的U盘 xff0c 用于刻录Ubuntu系统并安装 1 下载Ubuntu镜像及刻录 Ubuntu镜像 Ubuntu镜像可从官网下载 xff08 外网 xff0c 速度太慢 xff09 xff0c 或使用国内镜像
C++ Primer Plus拾遗

本博文整理了C 43 43 Primer Plus前六章中的部分知识点 xff0c 一般为不常用的小技巧或基础概念性的内容 C与C 43 43 的语言特性 C语言特性结构化编程 xff08 Structured Programming x
时隔一年，对全国大学生智能车竞赛做段总结（五）

早期粗糙的赛道元素处理说这个没有别的意思 xff0c 就是觉得 xff0c 遇到实际应用上的问题 xff0c 虽然脑海里的知识技巧并不能让我们有多高明的手法去解决这个问题 xff0c 但也要努力去尝试元素判断这里的元素判断也是粗糙的
Windows7 VMware USB Arbitration Service启动失败解决

转自 http huxiaodan666 blog 163 com blog static 162090542201091014749373 前几日安装了Windows7 xff0c 不过vmware虚拟机安装之后却无法使用usb 软件是官
Windows下以太坊公钥加密功能python实现

文章目录一什么是公钥私钥地址二实现过程1 从keystore文件中解出私钥以及私钥 gt 公钥 gt 地址2 利用公钥进行消息加密解密一什么是公钥私钥地址私钥 xff1a 32字节 xff08 256位 xff09 x
fatal error: mav_msgs/Actuators.h: 没有那个文件或目录

编译ros gz包的时候 xff0c ros ign bridge一直报错 xff0c 最开始都已经放弃了 xff0c 但是今天发现不得不跑 xff0c 唉 xff0c 一直报 xff1a fatal error mav msgs Actu
stalled和Initial connection偶尔请求时间长

Queueing 请求排队的时间关于这个 xff0c 需要知道一个背景 xff0c 就是浏览器与同一个域名建立的TCP连接数是有限制的 xff0c chrome设置的6个 xff0c 如果说同一时间 xff0c 发起的同一域名的请求超过了
自制stm32F103c6t6出现No target connected或者Internal command error的原因猜测和解决方法

刚刚焊好的最小系统板 xff0c 在使用ST LINK下载程序的时候 xff0c 发现没有啥问题 xff0c 之后再下载的时候便出现了这样的问题 xff0c 怀疑是单片机供电出现了问题 xff0c 但是每个脚都供好了电 xff0c 网上说可
QEMU来创建一个，[教程在这]。

RASPBERRY PI ON QEMU Let s start setting up a Lab VM We will use Ubuntu and emulate our desired ARM versions inside of i
聚类（K-means）实现手写数字识别-2

其他实现手写数字识别的方法 xff1a 1 KNN实现手写数字识别 2 卷积神经网络 xff08 CNN xff09 实现手写数字识别 3 全连接神经网络实现手写数字识别 4 聚类 xff08 K means xff09 实现手写数字识别

聚类（K-means）实现手写数字识别-2

聚类（K-means）实现手写数字识别-2 的相关文章

随机推荐

热门标签