机器学习概论聚类算法实现(实验四)

2023-11-07

一、实验目的
1、熟悉使用numpy模块生成二维正态分布；
2、掌握kmeans聚类的代码实现；
3、熟悉numpy的使用；
4、熟悉matplotlib的使用。
二、实验设备
计算机：CPU四核i7 6700处理器；内存8G； SATA硬盘2TB硬盘； Intel芯片主板；集成声卡、千兆网卡、显卡； 20寸液晶显示器。
编译环境：python解释器、Pycharm编辑器
三、实验内容
1、新建项目和文件，并导入numpy和matplotlib
（1）打开Pycharm，新建项目，并在该项目下新建文件kmeans_clustering.py。
（2）导入一些编程中需要的包。

import numpy as np
import matplotlib.pyplot as plt
2、构造一个函数data_producer
（1）定义函数头data_producer，该函数有三个参数，miu，sigma，sample_no分别表示生成二维正态分布的均值，标准差和生成样本点的个数。
（2）调用numpy.random.multivariate_normal生成二维正态分布的数据。
（3）该函数返回生成的数据。```

```java

def data_producer(miu, sigma, sample_no):
    data = np.random.multivariate_normal(miu, sigma, sample_no)
    return data
``3、编写一个类KmeansClustering
（1）构造一个类KmeansClustering，并定义构造函数，需要数据集和kmeans算法中的k作为输入。
（2）定义类方法cluster，实现kmeans算法，并打印分类后的混淆矩阵，返回分类后的数据。`

```java
class KmeansClustering:
    def __init__(self, data, k, maxrenew):
        self.data = data
        self.k = k
        self.Sigma1 = None
        self.Sigma2 = None
        self.Sigma3 = None
        self.renew = 0
        self.maxrenew = maxrenew
    def cluster(self):
        a = []; iter = 0
        for i in range(self.k):
            x = np.random.randint(0, np.shape(self.data)[0])
            a.append(self.data[x])
        c = np.array(a)
        Old_d = np.copy(c)
        while(self.maxrenew <=1000):
            New_d = np.copy(Old_d)
            self.Sigma1 = []
            self.Sigma2 = []
            self.Sigma3 = []
            for j in range(np.shape(self.data)[0]):
                if np.argmin(np.sqrt(np.sum((self.data[j, :-1]-New_d[:, :-1])**2, axis=1))) == 0:
                    self.Sigma1.append(self.data[j])
                if np.argmin(np.sqrt(np.sum((self.data[j, :-1]-New_d[:, :-1])**2, axis=1))) == 1:
                    self.Sigma2.append(self.data[j])
                if np.argmin(np.sqrt(np.sum((self.data[j, :-1]-New_d[:, :-1])**2, axis=1))) == 2:
                    self.Sigma3.append(self.data[j])
            self.data=np.vstack((self.Sigma1, self.Sigma2, self.Sigma3))
            aa = np.shape(self.Sigma1)[0]
            bb = np.shape(self.Sigma2)[0]
            cc = np.shape(self.Sigma3)[0]
            qq = np.shape(self.data[aa+1:bb+1])
            New_d[0] = np.array(np.mean(self.data[:aa+1], axis=0))
            New_d[1] = np.array(np.mean(self.data[aa+1:aa+bb+1], axis=0))
            New_d[2] = np.array(np.mean(self.data[aa+bb+1:], axis=0))
            if np.sum(New_d != Old_d) == 0:
                self.renew += 1
                print("更新不变的次数", self.renew)
                if self.renew >= 3:
                    return self.Sigma1, self.Sigma2, self.Sigma3
            else:
                iter += 1
                print("迭代次数", iter)
                Old_d = New_d
        return self.Sigma1, self.Sigma2, self.Sigma3

4、编写if name”main”:
（1）构造if name”main”:。
（2）在其中设置生成二维正态分布的参数，调用data_producer获取数据。
（3）初始化KmeansClustering类的一个对象my_kmeans，调用cluster方法。
（4）绘制原始数据分布和分类后的数据分布。

if __name__ == "__main__":
    Sample_No = 100
    Miu1 = [0, 3]
    Sigma_1 = np.array([[2, 0], [0, 2]])
    Miu2 = [3, 0]
    Sigma_2 = np.array([[2, 0], [0, 2]])
    Miu3 = [5, 5]
    Sigma_3 = np.array([[2, 0], [0, 2]])
    Data1 = data_producer(Miu1, Sigma_1, Sample_No)
    Data1 = np.hstack((Data1, np.zeros([Sample_No, 1], dtype=np.int8)))
    Data2 = data_producer(Miu2, Sigma_2, Sample_No)
    Data2 = np.hstack((Data2, np.zeros([Sample_No, 1], dtype=np.int8)))
    Data3 = data_producer(Miu3, Sigma_3, Sample_No)
    Data3 = np.hstack((Data3, np.zeros([Sample_No, 1], dtype=np.int8)))
    Data = np.vstack([Data1, Data2, Data3])
    my_kmeans = KmeansClustering(Data, 3, 1000)
    Sigma_1, Sigma_2, Sigma_3 = my_kmeans.cluster()
    plt.figure()
    plt.subplot(121)
    plt.plot(Data1[:, 0], Data1[:, 1], 'rs', Data2[:, 1], 'gD', Data3[:, 0], Data3[:, 1], "x")
    plt.subplot(122)
    plt.plot(np.array(Sigma_1)[:, 0], np.array(Sigma_1)[:, 1], 'rs', np.array(Sigma_2)[:, 1],
             'gD', np.array(Sigma_3)[:, 0], np.array(Sigma_3)[:, 1], "x")
    plt.show()

实验截图：
在这里插入图片描述

五、实验总结
本次实验学习了kmeans聚类的代码实现，一种无监督的聚类算法。在给定的样本集，按照样本之间的距离大小，将样本集划分为K个簇。但是从几组数据来看，迭代次数的多样性，对于K值的选取不好把握，如果数据不平衡，则kmeans聚类效果会不佳。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习概论聚类算法实现(实验四) 的相关文章

基于机器学习的贷中风险预测模型-江苏银行“随e融”杯-二等奖

文章目录源码下载地址项目介绍界面预览项目备注毕设定制咨询源码下载地址源码下载地址点击这里下载源码项目介绍基于机器学习的贷中风险预测模型江苏银行
华为OD机试真题-字符串拼接-2023年OD统一考试（C卷）

题目描述给定M 0
【需求响应】改进连续时间控制方法用于分散式需求响应的恒温负荷研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Python代码及文章
基于GPT4+Python近红外光谱数据分析及机器学习与深度学习建模

详情点击链接基于ChatGPT4 Python近红外光谱数据分析及机器学习与深度学习建模教程第一 GPT4 基础 1 ChatGPT概述 GPT 1 GPT 2 GPT 3 GPT 3 5 GPT 4模型的演变 2 ChatGPT对话初
关于整型提升与截断的一道题目

关于整型提升与截断可以看我的博客 C语言整型提升 c语言整形提升 CSDN博客 C语言截断整型提升算数转换练习 c语言unsigned CSDN博客一题目二题解 char a 101截断由于101是整型数据需要32比特
小白刷题之图形输出

拓展 string string int num char ch num表示打印字符个数 ch表示打印内容 include
【固定翼飞机】基于最优控制的固定翼飞机着陆控制器设计研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【具有延迟反馈的滤波器，其具有负群延迟】对于混沌系统，在可预测性高的阶段，该滤波器具有预测能力(Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
2024年华为OD机试真题-小明找位置-Java-OD统一考试（C卷）

题目描述小朋友出操按学号从小到大排成一列小明来迟了请你给小明出个主意让他尽快找到他应该排的位置算法复杂度要求不高于nLog n 学号为整数类型队列规模 lt 10000 输入描述 1 第一行输入已排成队列的小朋友的学号正整
【路径规划】基于A*算法路径规划研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【路径规划】基于A*算法路径规划研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【自适应滤波】一种接近最佳的自适应滤波器，用于突发系统变化研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
矩阵基本操作3

题目描述问题描述定义一个N M N M lt 100 的矩阵将一个该矩阵的行和列的元素互换存到另一个二维数组中输入格式一行两个整数 N M 中间用空格隔开表示矩阵有N行 M列接下来共N行M列表示矩阵输出格式输出转置以后的
LeetCode解法汇总83. 删除排序链表中的重复元素

目录链接力扣编程题解法汇总分享记录 CSDN博客 GitHub同步刷题项目 https github com September26 java algorithms 原题链接力扣 LeetCode 描述给定一个已排序的链表的头
毕业设计- 基于深度学习的小样本时间序列预测算法 - Attention

目录前言课题背景与意义课题实现一数据集二设计思路三相关代码示例最后前言大四是整个大学期间最忙碌的时光一边要忙着准备考研考公考教资或者实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校
机器学习算法实战案例：Informer实现多变量负荷预测

文章目录机器学习算法实战案例系列答疑技术交流 1 实验数据集 2 如何运行自己的数据集 3 报错分析机器学习算法实战案例系
【固定翼飞机】基于最优控制的固定翼飞机着陆控制器设计研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【一种新的Burton-Miller型奇异边界方法（BM-SBM）】用于声学设计灵敏度分析，2D和3D声学设计灵敏度分析的奇异边界方法研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 2D 2 2 3D
【GRNN-RBFNN-ILC算法】【轨迹跟踪】基于神经网络的迭代学习控制用于未知SISO非线性系统的轨迹跟踪（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 第1部分 2 2 第2部分
GPT4+Python近红外光谱数据分析及机器学习与深度学习建模

详情点击链接 GPT4 Python近红外光谱数据分析及机器学习与深度学习建模第一 GPT4 入门基础 1 ChatGPT概述 GPT 1 GPT 2 GPT 3 GPT 3 5 GPT 4模型的演变 2 ChatGPT对话初体验注册与

随机推荐

Air101

目录 1 合宙Air101 固件编译可参考 PinOut V2 1092400 管脚映射表 PinOut V2 1091800 2 Air103 最新固件下载固件编译可参考 PinOut V3 21112201 管脚映射表资料链接 Pi
Solid JS基础

Solid js 用于构建用户界面的声明式高效且灵活的 JavaScript 库您可以在官方教程中尝试下面提到的部分例子本文引用并简化了官方教程中的部分例子本文讲述部分 solid 主要内容更多详细内容移步 Solid AP
编码器的使用

首先来看一下增量式编码器的输出信号和它的信号倍频技术增量式编码器输出的脉冲波形信号形式常见的有两种一种是占空比50 的方波通道A和B相位差为90 另一种则是正弦波这类模拟信号通道A和B相位差同样为90 对于第1种形式的方波信号如果
MATLAB量化浮点数

在做算法设计和验证时常在matlab进行浮点验证然后量化后在用在FPGA上对于类似与FIR这些滤波器系数 matlab直接可以export出来但是在验证麦克风或者ADC出来的24bit补码这类时常常需要使用matlab生成定点数进行
有关DHCP、链路聚合、NAT、ACL、Telnet配置小综合实验

实验需求 1 局域网中存在VLAN10 VLAN20 VLAN30和VLAN40四个部门 IP网段应192 168 10 0 24 192 168 20 0 24 192 168 30 0 24 192 168 40 0 24 2 业务V
Linux虚拟机 Ubuntu16 cheese命令打开摄像头黑屏，以及mjpg-stream框架不显示视频界面。

在Linux虚拟机 Ubuntu16打开笔记本的摄像头时用 ubuntu16的cheese命令显示黑屏如下图解决方法 1 查看虚拟机是否已经已连接上摄像头显示断开连接连接主机 D 则虚拟机已连接上摄像头 2 确认摄像头笔记本的摄
搭建环境【2】windows主机和ubuntu互传文件的4种方法

我的ubuntu系统是安装在 VMware 虚拟机中的两者之间经常要互传文件下面介绍4种常用的互传文件方法 1 共享文件夹方式互传在虚拟机中需要开启共享文件夹的功能首先虚拟机中的ubuntu要求是已经开机了的状态然后进行设置虚拟
山东轻工业学院高校俱乐部主席“我和我的CSDN高校俱乐部”

今天天气不错上午收到了CSDN邮寄过来的2012年度优秀主席证书以及奖品心情也不错感谢CSDN教育事业部全体同事一年来对我们工作的支持与帮助同时也感谢那些奋战在一线的兄弟姐妹们你们为轻工学院CSDN高校俱乐部所做的一切我永远铭记
ThreadLocal - ThreadlMap与弱引用

ThreadLocal源码在看ThreadLocal源码的时候其中嵌套类ThreadLocalMap中的Entry继承了WeakReferenc static class ThreadLocalMap static class Entr
C++ string字符串修改和替换方法详解

字符串内容的变化包括修改和替换两种本节将分别讲解字符串内容的修改和字符串内容的替换字符串内容的修改可以通过使用多个函数修改字符串的值例如 assign operator erase 交换 swap 插入 insert 等另外还可
使用Guava RateLimiter限流以及源码解析

前言在开发高并发系统时有三把利器用来保护系统缓存降级和限流缓存缓存的目的是提升系统访问速度和增大系统处理容量降级降级是当服务出现问题或者影响到核心流程时需要暂时屏蔽掉待高峰或者问题解决后再打开限流限流的目的是通过对并发
win10 graphedit存储的路径

如果安装郭windows SDK的话可能的存储位置为C Program Files x86 Windows Kits 10 bin x86 C Program Files x86 Windows Kits 10 bin x64
【C语言学习教程---2】C语言的数据类型

事物的难度远远低于对事物的恐惧上一篇文章已经介绍说明了Visual C 的安装和使用链接如下 C语言学习教程 1 VC 6 0的安装和创建简单C语言工程文件教程文末有程序代码免费的获取方式本篇文章开始正式讲解和介绍C语言的知识在学
安装破解版的edraw max

一简介 project是一款好用的项目管理工具二安装过程 1 下载安装包安装软件安装后先不要运行 https pan baidu com share init surl gKfohSW8XEn 9cYLwnJwdQ h3um 2
git：git clone -b提示remote branch master not found in upstream origin

问题如标题解决办法检查下分支名是否写错了 git创建时有时候不一定有master分支而是main分支需要注意
Selenium webdriver的无头模式（headless）可能导致cookies内容缺失，以及解决措施

无头模式 headless 是selenium的webdriver浏览器驱动的一项功能允许浏览器不出现而仍可访问网页并与之交互这对于运行自动化测试或网络抓包大有用处因为运行速度更快占用资源更少但是笔者发现在无头模式下运行时浏览
高性能mysql一.mysql系统结构和概念

文章目录 1 1Mysql逻辑架构 1 1 1连接管理和安全性 1 1 2优化与执行 1 2并发控制 1 2 1读写锁 1 2 2锁粒度 1 3事务 1 3 1隔离级别 1 3 2死锁 1 3 3事务日志 1 3 4mysql中的事务 1
uni-app 下拉条件筛选菜单组件sl-filter app端不能正常显示

1 使用uniapp的sl filter组件时在浏览器中可以正常看到下拉筛选组件如下图1 2 在app中无法看到条件筛选控件如下图2 3 找到sl filter中sl filter vue中的 created onReady 方法将
MSP430F5529学习笔记（5）——按键切换灯的亮灭

MSP430F5529学习笔记 4 按键点灯目录官方示例代码内容解析 BIT0的含义解析按键消抖增加的宏定义问题解决办法官方示例代码官方视频教程里面的代码如下我做了些许的调整但是是一样的只需要看while 1 中的
机器学习概论聚类算法实现(实验四)

一实验目的 1 熟悉使用numpy模块生成二维正态分布 2 掌握kmeans聚类的代码实现 3 熟悉numpy的使用 4 熟悉matplotlib的使用二实验设备计算机 CPU四核i7 6700处理器内存8G SATA硬盘2TB硬

机器学习概论 聚类算法实现(实验四)

机器学习概论 聚类算法实现(实验四) 的相关文章

随机推荐

热门标签

机器学习概论聚类算法实现(实验四)

机器学习概论聚类算法实现(实验四) 的相关文章