kmeans python 多维_使用 k-means 聚类算法对多维属性数据进行分类

2023-05-16

数据形式如下：

前期数据整合：

import pandas as pd

import scipy

import scipy.cluster.hierarchy as sch

from scipy.cluster.vq import vq,kmeans,whiten

import numpy as np

import matplotlib.pylab as plt

df1 = pd.read_csv(r"D:\01RiverPro\01DATA\01Headwater\CSV\dem.csv")

df2 = pd.read_csv(r"D:\01RiverPro\01DATA\01Headwater\CSV\ndvi_mean.csv")

df3 = pd.read_csv(r"D:\01RiverPro\01DATA\01Headwater\CSV\pop_mean.csv")

result = pd.merge(df1, df2, how='inner', on=['GRIDCODE'])#取交集

result = pd.merge(result, df3, how='inner', on=['GRIDCODE'])

df=result[['GRIDCODE','dem_mean','ndvi_mean','pop_mean']]

#新增一列其他方法进行的分类标签

ishw = [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0,

0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

df['Headwater_label'] = ishw

#转为array

dataset = df.values

points = dataset [:,1:4]#第2列到第4属性列

ishw_label = dataset[:,-1]

#print("points:\n",points)

# k-means聚类

#将原始数据做归一化处理

data=whiten(points)

#使用kmeans函数进行聚类,输入第一维为数据,第二维为聚类个数k.

#有些时候我们可能不知道最终究竟聚成多少类,一个办法是用层次聚类的结果进行初始化.当然也可以直接输入某个数值.

#k-means最后输出的结果其实是两维的,第一维是聚类中心,第二维是损失distortion,我们在这里只取第一维,所以最后有个[0]

#centroid = kmeans(data,max(cluster))[0]

centroid = kmeans(data,2)[0]#分为2类

print(centroid)#输出中心

#使用vq函数根据聚类中心对所有数据进行分类,vq的输出也是两维的,[0]表示的是所有数据的label

label=vq(data,centroid)[0]

label

#输出两类的数量

num = [0,0]

for i in label:

if(i == 0):

num[0] = num[0] + 1

else:

num[1] = num[1] + 1

print('num =',num)

#输出符合预期的比例等

print("Final clustering by k-means:\n",label)

result = np.subtract(label,ishw_label)

print("result:\n",result)

count = [0,0]

for i in result:

if(i == 0):

count[0] = count[0] + 1

else:

count[1] = count[1] + 1

print(count)

print(float(count[0])/(count[0]+count[1]))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

kmeans

python

means

聚类算法对多维属性数据进行分类

kmeans python 多维_使用 k-means 聚类算法对多维属性数据进行分类的相关文章

将列的百分比设置为 0 (pandas)

我有一个 pandas 数据框我想将列的某些百分比设置为 0 假设 df 有两列 A B 1 6 2 7 3 8 4 4 5 9 我现在想将 df 的前 20 和后 20 的 B 设置为 0 A B 1 0 2 7 3 8 4 4 5 0
Nonetype 错误/使用 python 的 beautifulsoup 没有打印任何元素

所以我尝试使用 python 比较 2 个列表其中一个包含我从网站获取的 1000 个链接另一个包含一些单词这些单词可能包含在第一个列表的链接中如果是这种情况我想得到一个输出我打印了第一个列表它确实有效例如如果链接是 ht
Beautiful Soup 中 find_all 方法的返回类型是什么？

from bs4 import BeautifulSoup SoupStrainer from urllib request import urlopen import pandas as pd import numpy as np imp
Pandas：删除具有纳米值索引的行

给定以下 pandas DataFrame 其中一些索引是NaN 如何删除第三行和第八行因为它们的索引是NaN Thanks import pandas as pd import numpy as np data list abcdefg
Xgboost：bst.best_score、bst.best_iteration 和 bst.best_ntree_limit 有什么区别？

当我使用 xgboost 训练我的数据时2 cates classification problem 我想使用提前停止来获得最佳模型但我对在预测中使用哪一个模型感到困惑因为提前停止将返回 3 个不同的选择例如我应该使用 preds
Python 是否有与 PHP 函数 htmlspecialchars() 等效的函数？

Python 中是否有与 PHP 函数 htmlspecialchars 类似或等效的函数到目前为止我发现的最接近的是htmlentitydefs entitydefs 我所知道的最接近的是cgi escape http docs pyt
为什么 itertools.chain 比扁平列表理解更快？

在评论中的讨论中这个问题 https stackoverflow com questions 49630581 why does python forbid the use of sum with strings有人提到虽然连接字符串序列
使用 BeautifulSoup 在 python 中抓取多个页面

我已经设法编写代码来从第一页中抓取数据现在我不得不在这段代码中编写一个循环来抓取接下来的 n 页下面是代码如果有人可以指导帮助我编写从剩余页面中抓取数据的代码我将不胜感激 Thanks from bs4 import Beauti
将 Fabric env.hosts 字符串作为变量传递在函数中不起作用

将 Fabric env hosts 字符串作为变量传递在函数中不起作用 demo py usr bin env python from fabric api import env run def deploy hosts command
如何在 Python 3.2 程序中优雅地包含 Python 3.3 from None 异常语法？

我正在尝试重新引发异常以便为用户提供有关实际错误的更好信息 Python 3 3 包括PEP 409 http www python org dev peps pep 0409 它添加了raise NewException from No
GitPython 并向 Git 对象发送命令

GitPython http gitorious org git python是一种从 python 与 git 交互的方式我正在尝试访问基本的 git 命令例如git commit m message 从此模块中根据this htt
如何复制 tf.keras.models.Model 子类？

我需要复制 keras 模型但我无法知道可以做什么除非该模型is not a tf keras models Model 子类 Note 使用copy deepcopy 将在没有任何错误的情况下工作但是每当使用副本时都会导致另一个错误
我无法在 docker 中安装 opencv-contrib-python

我尝试安装opencv contrib python但我无法让它在 docker 上工作它说找不到满足 opencv contrib python 要求的版本 I tried pip install opencv contrib pyth
没有名为“_pywrap_tensorflow_internal”的模块

在尝试验证tensorflow gpu的安装时在尝试执行 import tensorflow as tf 时出现ImportError 我在 Windows 7 上使用 Quadro K620 Tensorflow 是使用 pip 安装的
尝试导入 cv2(opencv-python) 包时出错

我正在尝试使用 cv2 opencv python 包访问我的网络摄像头当我尝试导入它时出现此错误 Traceback most recent call last File server py line 6 in
Django 模型选择不会因无效选择而引发错误

我在 Django 中有一个带有选择字段的对象 class CustomFieldType models Model STRING STRING DATE DATE BOOLEAN BOOLEAN NUMERIC NUMERIC EMAIL
即使在 virtualenv 激活后，python 也指向全局安装

有点奇怪我激活了虚拟环境python仍然指向全局安装 which python usr bin python source virtualenv bin activate virtualenv which python usr bin p
在 Python 的内置数字类型上，repr 和 str 总是相同吗？

Are repr and strPython 内置数字类型相同 int bool float and complex 或者是否存在深奥的两者可能产生不同结果的情况 SO的相关问题例如this one https stackoverfl
识别输入的数据类型

我正在尝试打印用户输入的数据类型并生成如下表 ABCDEFGH String 1 09 float 0 int true bool etc 我正在使用 Python 3 2 3 并且我知道我可以使用type 获取数据的类型但在Python
如何在Python中的滚动平均计算中忽略NaN

对于时间序列销售预测任务我想创建一个代表过去 3 天平均销售额的功能当我想预测未来几天的销售额时遇到问题因为这些数据点没有销售数据 NaN 值 Pandas 提供rolling mean 但当窗口中的任何数据点为 NaN 时该函数会

随机推荐

arcgis 将栅格值提取到点_ArcGIS教程：值提取至点 (空间分析)

摘要基于一组点要素提取栅格像元值 xff0c 并将这些值记录到输出要素类的属性表用法输入点要素类中的所有字段均将包括在输出点要素类中输出要素类将添加一个名为 RASTERVALU 的新字段对多波段栅格使用值提取至点时 xff0c
deepinv2 添加打印机_科学网-Deepin Linux虚拟PDF打印机的安装与妙用-黄健的博文

前段时间用WPS文字准备了一些申请材料 xff0c 但系统要求上传pdf文档 WPS有直接输出为PDF的功能 xff0c 但这样输出的PDF文件太大 xff0c 满足不了系统要求举个例子 xff0c 一个184 5K的DOCX文档 xff
活动文档服务器,ACTIVEDOC 示例：实现活动文档服务器

ACTIVEDOC 示例 xff1a 实现活动文档服务器 08 18 2008 本文内容更新 xff1a 2007 年 11 月 ACTIVEDOC 示例说明如何实现活动文档服务器此示例演示以下操作 xff1a 如何实现 IOleDoc
ftp: connect: 没有到主机的路由

connect 没有到主机的路由今天使用vsftpd配置好ftp服务器 xff0c 允许匿名登录服务端没发现任何问题 xff0c 客户端就是连接不上 span class token punctuation span root 64 l
unix服务器上传文件,Unix lrzsz命令上传本地文件到服务器 / 发送文件到客户端...

babylonjs A Babylon js Primer Table of contents Babylon js WebGL Game Creation System The Browser Useful Link Java异步回调作
ajax是异步非阻塞,[转帖]再谈IO的异步，同步，阻塞和非阻塞

前提概要 xff1a IO的过程 xff1a 整个IO的过程其实是应用发起IO的请求 xff0c 到应用获取到IO请求数据的中间过程这个中间 xff0c 其实主要的时间就是系统准备数据的过程这也是异步技术的优化所在对系统调用的理解 x
centos7调节虚拟机字体_ubuntu虚拟机(中或英文版)字体大小调节傻瓜教程

最近学ics和数据库 xff0c 用了ubuntu的虚拟机 xff0c 感觉字体太小了 xff0c 所以探索了很多方法调解了一下 xff0c 总结如下 xff08 个人强推第三种方法 xff09 1 方法一桌面右击 xff0c 选择打开
python 怎么样才有output_Python C1-4——output函数初体验

在昨天字典类型基础上接触了output 函数在python2 中print只是关键字 xff0c 但在python3 中却是函数 output函数和print还是有所不同 xff0c 在2 中 xff0c output既然是函数就需要调用
matlab迭代算法实例_CORDIC算法详解(四)CORDIC 算法之双曲系统及其数学应用

CORDIC算法详解四 CORDIC 算法之双曲系统及其数学应用文章目录 CORDIC算法详解四 CORDIC 算法之双曲系统及其数学应用4 CORDIC 算法之双曲系统及其数学应用 4 1 CORDIC 算法之双曲系统4 2 COR
python ascii码转字符_我用Python库在控制台激情演绎舞曲No body

作者小帅b 来源学习python的正确姿势废话先不多说 xff0c 上视频 xff1a 哈哈 xff0c 是不是又有点内味了 xff1f 今天就想给你介绍一个好玩的库 xff0c 叫做 video to ascii xff0c 主要是将
通达信四色谱四量图源码_通达信指标公式源码主力资金进出副图指标

做价值的传播者 xff0c 一路同行 xff0c 一起成长问题 xff1a 怎样才能每天都收到这类文章 xff01 答案 xff1a 只需点击上方通达信公式指标 VarF 61 100 3 SMA CLOSE LLV LOW 65 HH
python 重定向 ctf_CTF常用python代码

参加个CTF比赛 xff0c 发现自己零代码量 xff0c 什么东西都没有准备 xff0c 被吊打当然正常 xff0c 基本的工具常用的代码可以自己提前写好的呀常用的代码有 xff1a gcd xff1a 求两个数的最大公约数 egcd
linux桌面版排行2019_2019年Linux系统TOP100排行国产Deepin排名第十

2019年Linux系统都有哪些值得关注的呢 xff1f 专注Linux系统发行的distrowatch网站上现在就汇总了去年TOP100的Linux发行版需要说明的是 xff0c 这个榜单主要是以关注度为基础 xff0c Linux发行
配置网络yum_CentOS7下部署开源网络监控工具Observium

点击上方 34 walkingcloud 34 关注 xff0c 并选择 34 星标 34 公众号 Observium简单介绍 Observium是一个免费的开源网络管理和监控工具 xff0c 可用于监控所有的网络设备 Observium是
Linux——PXE高效批量网络装机

文章目录前言一部署PXE远程安装服务1 批量部署的前提条件2 PXE批量部署的优点3 PXE启动方式4 基本部署过程5 PXE服务器和客户机的工作过程 6 搭建 PXE 远程安装服务器6 1 添加网卡并配置网卡信息6 2 安装并启用 D
mysql plugin_Mysql5.7修改plugin

系统环境CentOS 6 x 43 Mysql5 7 1 前言在部署open falcon的时候 xff0c 第一启动有很多模块都失败 xff0c 查看log日志有如下报错 2019 01 04 10 33 13 db go 22 g I
c++怎么输出空格_怎么用c++画爱心

展开全部 include lt iostream gt using namespace std int main int i j k l m char c 61 39 3 39 ASCII码里面 3 就是一个62616964757a6869
如何使用windows自带远程桌面连接linux,使用Windows自带远程桌面应用连接CentOS8远程桌面...

Loading 前言本文目的是为了实现通过Windows自带的Mstsc来远程连接具有图形界面的CentOS8 博主找了很多方法 xff0c 最终采用XRDP服务实现了对CentOS8的图形界的远程桌面管理下面直接进入正题来讲具体步骤
计算机学经济管理,请问计算机专业想考经济管理的研究生，需要学习哪些基础课程，和重要课程！谢谢（请懂的回答，答后附加高...

类似问题答案 2021年厦门华天涉外学院计算机网络技术专业职业基础课程 2 职业基础课程职业基础课是学生掌握专业知识专业技能的必修课程针对本专业的特点人才培养方式和人才培养目标制定了专业导论初级程序员计算机网络基础和HTML5交
kmeans python 多维_使用 k-means 聚类算法对多维属性数据进行分类

数据形式如下 xff1a 前期数据整合 xff1a import pandas as pd import scipy import scipy cluster hierarchy as sch from scipy cluster vq i

kmeans python 多维_使用 k-means 聚类算法对多维属性数据进行分类

kmeans python 多维_使用 k-means 聚类算法对多维属性数据进行分类 的相关文章

随机推荐

热门标签

kmeans python 多维_使用 k-means 聚类算法对多维属性数据进行分类的相关文章