Python 将 k-means 集群与实例关联

2023-12-20

我已阅读文档here http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html以及看着this http://fromdatawithlove.thegovans.us/2013/05/clustering-using-scikit-learn.html教程,但我仍然缺少一些关于在 scikit-learn 中使用 K-means 的基本知识:

假设我有一个这样的数据集:

|UserName| Variable1 | Variable2 | Variable3 |  Cluster |
|  bob   |    1      |     3     |    7      |          |
|  joe   |    2      |     4     |    8      |          |
|  bill  |    1      |     6     |    4      |          |

由于 K-means 采用 numpy 数组,因此我必须去掉用户名并仅使用数值变量。但是,创建集群后,如何将它们与每个单独的用户关联起来以进行进一步分析。即如何用相应的簇号填充“簇”列?


这是一个示例,假设您从文件中将数据读入列表中:

import sklearn.cluster
import numpy as np

data = [
    ['bob', 1, 3, 7],
    ['joe', 2, 4, 8],
    ['bill', 1, 6, 4],
]

labels = [x[0] for x in data]
a = np.array([x[1:] for x in data])
clust_centers = 2

model = sklearn.cluster.k_means(a, clust_centers)

模型现在包含一个元组(质心、标签、惯性)

所以像这样取回标签:

clusters = dict(zip(lables, model[1]))

并打印“one”的集群 ID:

print clusters['bob']

或者将其发送回 csv,如下所示:

for d in data:
    print '%s,%d' % (','.join([str(x) for x in d]), clusters[d[0]])
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python 将 k-means 集群与实例关联 的相关文章

随机推荐

  • HTTP 的 BPF 是什么?

    定义可见here http en wikipedia org wiki Berkeley Packet Filter 候选人的答案可能是tcp and dst port 80 但是可以tcp and dst port 80保证它是HTTP流
  • Visual Studio 类图未显示关系

    当我定义类属性而不使用字段 使用 C 3 0 启用 时 类图未显示我的一对一 多关系 不过 继承在图中是可见的 有没有办法来解决这个问题 当您右键单击字段或属性时 您可以选择显示为关联或显示为集合关联
  • Flutter Android Studio 错误:无法获取未知属性“keystoreProperty”

    我是 flutter 新手 我正在尝试运行我的第一个项目 而不对演示应用程序的源代码进行任何更改 但我不断收到以下错误 Launching lib main dart on SM A115F in release mode Running
  • Rails 如何验证文件格式?

    如何验证我的文件字段的格式是否正确 我希望图像字段验证它是 png jpg jpeg 以及结尾为 flv 的 flv 还有它的结尾为 mov 的 Quicktime 以及如何创建错误消息来告知该字段无效 我的 simple form for
  • 访问cookie过期时间owin

    我正在尝试访问 Owin 上的过期时间 我正在使用以下示例 访问 Owin Cookie 身份验证的 ExpireTimeSpan 属性以通知用户登录到期 https stackoverflow com questions 27107264
  • 如何在 PHP 中克隆 gd 资源

    我正在寻找用 PHP 创建的克隆图像imagecreatetruecolor或其他一些图像创建功能 正如评论中所说 不 你不能做出像这样简单的感情 copy original 这是因为资源是引用 不能像标量值一样被复制 例子 a image
  • 用于获取标签列表的 GCP API

    是否有用于获取资源标签的 GCP API 我想要获取 GCP 项目的所有标签的列表 如何获取GCP中的所有标签 基本上 GCP 资源管理器 API 返回每个资源的 Lebel 对象 但我想使用一个 API 调用获取所有标签的列表 我尝试了下
  • 如何获取 numpy 数组中最大值的所有索引?

    我有一个数字数组 最大值可能会出现多次 我们如何获得数组中所有出现最大值的索引集合 例如 对于以下数组 import numpy as np a np array 1 2 3 2 3 2 1 3 结果应该是 2 4 7 或等效的数组或元组
  • Docker - 使用多模块 Maven 项目进行多阶段构建

    我有一个具有 root 的 Maven 项目pom xml具有多个子文件夹作为模块和依赖项的文件 它看起来像这样
  • 导入错误:没有名为flask.ext.script的模块

    事实上我现在无法使用任何软件包 导入错误 没有名为flask ext script的模块 https i stack imgur com dARhF png 导入错误 没有名为 Pymongo 的模块 https i stack imgur
  • php删除大括号和里面的内容检索剩余

    want to 删除大括号内的 php 字符串的特定文本 包括大括号 它应该被删除 数据串如下所示 page header this text should not be removed menu list menu list 2 this
  • 在 Vue 3 中设置全局 Axios 标头

    我正在尝试使用 Axios 访问我的后端 Django 但在设置全局标头以在标头中包含 CSRF 令牌时遇到一些问题 这是到达我的服务器 import axios from axios async function loadCards va
  • C# 执行外部程序并捕获(流式传输)输出

    我正在编写一个程序来处理一些视频文件 我正在使用 ffmpeg 可执行文件将多个文件合并到一个文件中 该命令需要几分钟才能完成 因此 我需要一种方法来 监视 输出 并在 GUI 上显示进度条 查看以下 stackoverflow 主题 如何
  • 使用动态规划对列表进行分区

    我在这里发布了一些与我一直在尝试从事的项目相关的内容 但我不断遇到设计问题并且必须从头开始设计 所以我想知道我是否可以发布我正在尝试做的事情 并且有人可以帮助我了解如何获得我想要的结果 背景 我是编程新手 正在努力学习 因此 我开展了一个我
  • Binutils LD 创建巨大文件

    我正在尝试创建尽可能小的 ELF 我创建了一个像这样的测试文件 NASM 语法 SECTION text dd 0xdeadbeef 使用此链接描述文件 SECTIONS text text 然后我检查了平面二进制文件的大小 并通过两种方式
  • 将 UDF 应用于 Spark Dataframe 中的多个列

    我有一个如下所示的数据框 id age rbc bgr dm cad appet pe ane classification 3 48 0 normal 117 0 no no poor yes yes ckd 我写了一个 UDF 来转换分
  • 终止或停止 HtmlUnit

    我使用 htmlunit 测试一些网站 我注意到 Htmlunit 卡在一些网页上 这个问题导致调用 htmlunit 的线程不会终止 请您知道有什么方法可以停止 Htmlunit 就像在真正的网络浏览器中一样 您只需单击浏览器停止按钮即可
  • 考虑到每个静态库定义导出的功能(vc++ 2008),如何将多个静态链接库合并到一个 dll 中?

    鉴于每个静态库都定义导出功能 vc 2008 如何将多个静态链接库合并到单个 dll 中 在存在单个 dll 项目和静态链接的多个子项目 在 dll 项目中 的多项目布局中 尽管被标记为 declspec export 子项目 lib 中的
  • python Tkinter 中的简单加载屏幕

    我是一个Python初学者 尤其是tkinter 我想制作一个简单的 python 脚本的 加载屏幕 并在脚本结束后关闭 但制作窗户需要mainloop函数 这意味着它将无限循环或等待用户交互 或者我认为如此 并且它将消除 加载 屏幕的想法
  • Python 将 k-means 集群与实例关联

    我已阅读文档here http scikit learn org stable modules generated sklearn cluster KMeans html以及看着this http fromdatawithlove theg