如何使用 Python 查找我的数据属于哪个集群？

2024-02-11

我刚刚对我的数据运行了 PCA，然后运行了 K 均值聚类算法，运行算法后我得到了 3 个聚类。我试图找出我的输入属于哪些集群，以便收集有关输入的一些定性属性。我的输入是客户 ID，用于聚类的变量是某些产品的支出模式

下面是我为 K 均值运行的代码，寻找一些有关如何将其映射回源数据的输入，以查看输入属于哪个集群：

kmeans= KMeans(n_clusters=3)
X_clustered=kmeans.fit_predict(x_10d)

LABEL_COLOR_MAP = {0:'r', 1 : 'g' ,2 : 'b'}
label_color=[LABEL_COLOR_MAP[l] for l in X_clustered]

#plot the scatter diagram

plt.figure(figsize=(7,7))
plt.scatter(x_10d[:,0],x_10d[:,2] , c=label_color, alpha=0.5)
plt.show()

Thanks

如果您想将集群标签添加回数据框中，并假设 x_10d 是您的数据框，您可以执行以下操作：

x_10d["簇"] = X_clustered

这将在数据框中添加一个名为“cluster”的新列，其中应包含每行的集群标签。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

clusteranalysis

kmeans

如何使用 Python 查找我的数据属于哪个集群？的相关文章

如何在 QTableView 标题中单击鼠标右键单击上下文菜单？

下面的示例代码很大程度上受到here http www saltycrane com blog 2007 12 pyqt 43 qtableview qabstracttablemodel 有一个右键单击上下文菜单当用户单击表中的单元格
minAreaRect OpenCV 返回的裁剪矩形 [Python]

minAreaRectOpenCV 中返回一个旋转的矩形如何裁剪矩形内图像的这部分 boxPoints返回旋转矩形的角点的坐标以便可以通过循环框内的点来访问像素但是在 Python 中是否有更快的裁剪方法 EDIT See code在
Python设置1和True的解释

在 IPython 3 交互式 shell 中 In 53 set2 1 2 True hello In 54 len set2 Out 54 3 In 55 set2 Out 55 hello True 2 是因为 1 和 True 得到
如何使用我自己的自定义表单覆盖 django-rest-auth 中的表单？

我正在使用 django rest auth 并尝试通过覆盖表单的方法之一来修复密码重置视图中的错误尽管我已经使用不同的 django rest auth 表单成功完成了类似的操作但我无法让它在这个表单上工作无论我做什么都会使用旧的
在 Jupyter Notebook 中设置环境变量的不同方法

在某些情况下我在 Windows 10 计算机上使用 Jupyter 笔记本我想通过设置环境变量 GOOGLE APPLICATION CREDENTIALS 来向 GCP 进行身份验证我想知道这两种设置环境变量的方式有什么区别当
如何在seaborn热图标签中使用科学计数法？

我正在尝试在 python 中使用seaborn 获取热图不幸的是即使数字非常大它也没有使用科学记数法我想知道是否有任何简单的方法可以转换为科学记数法或任何其他合理的格式这是显示问题的一段代码 import seaborn as
Django 查询：“datetime + delta”作为表达式

好吧我的问题如下假设我有下一个模型这是一个简单的情况 class Period models Model name CharField field specs here start date DateTimeField field s
烧瓶 - 404 未找到

我是烧瓶开发的新手这是我在烧瓶中的第一个程序但它向我显示了这个错误在服务器上找不到请求的 URL 如果您输入了网址请手动检查拼写并重试这是我的代码 from flask import Flask app Flask name ap
如果另一列中的值为空，则删除重复项 - Pandas

我拥有的 df Name Vehicle Dave Car Mark Bike Steve Car Dave Steve 我想从名称列中删除重复项但前提是车辆列中的相应值为空我知道我可以使用 df dropduplicates
获取 int() 参数必须是字符串或数字，而不是“Column”- Apache Spark

如果我使用以下代码我会收到此异常 int argument must be a string or a number not Column df df withColumn FY F when df ID substr 5 2 isin
dask apply：AttributeError：“DataFrame”对象没有属性“name”

我有一个参数数据框并对每一行应用一个函数该函数本质上是几个 sql queries 和对结果的简单计算我正在尝试利用 Dask 的多处理同时保持结构和界面下面的例子有效并且确实有显着的提升 def get metrics row
打印一份拥有多个家庭的人员名单，每个家庭都有多个电话号码

我有一类 Person 它可以有多个 Home 每个 Home 都有一个或多个电话号码我已经定义了类但现在我正在尝试创建一个视图其中列出每个人的所有家庭以及每个家庭地址的所有电话号码类似于 john smith 123 fake s
错误：尝试使用 scrappy 登录时出现 raise ValueError("No element found in %s" % response)

问题描述我想从我大学的bbs上抓取一些信息这是地址 http bbs byr cn http bbs byr cn下面是我的蜘蛛的代码 from lxml import etree import scrapy try from scra
将 Python Selenium 输出写入 Excel

我编写了一个脚本来从在线网站上抓取产品信息目标是将这些信息写入 Excel 文件由于我的Python知识有限我只知道如何在Powershell中使用Out file导出但结果是每个产品的信息都打印在不同的行上我希望每种产品都有一条
使用 Sphinx 时，如何记录没有文档字符串的成员？

我正在为我发布的包编写文档我发现您的文档越全面人们就越容易找到您的包来使用废话实际上我在充满爱心地编写代码的所有功能和细节方面获得了很多乐趣然而我对如何为类级变量编写与 Sphinx 兼容的文档感到完全困惑特别是我有一些e
通过新数据更新绘图，而不是在 Jupyter 笔记本中制作新绘图

我有一些问题希望你能帮我解决我需要使用下拉小部件创建交互式绘图我可以在其中选择并绘制感兴趣的数据我通过以下方式做到这一点 import plotly graph objects as go import ipywidgets as
使用 Numpy 进行多维批量图像卷积

在图像处理和分类网络中一个常见的任务是输入图像与一些固定滤波器的卷积或互相关例如在卷积神经网络 CNN 中这是一种极其常见的操作我已将通用版本任务减少为 Given 一批 N 个图像 N H W D 和一组 K 个滤镜 K H W
为什么我的 PyGame 应用程序根本不运行？

我有一个简单的 Pygame 程序 usr bin env python import pygame from pygame locals import pygame init win pygame display set mode 400
正则表达式 - 匹配不包含字符串的模式

我对正则表达式很陌生并且一直在寻找方法来做到这一点但没有成功给定一个字符串我想删除以 abc 开头以 abc 结尾且中间不包含 abc 的任何模式如果我做 abc abc abc 它将匹配以 b 开头以 abc 结尾并且中间包
用 Beautiful Soup 进行抓取：为什么 get_text 方法不返回该元素的文本？

最近我一直在用 python 开发一个项目其中涉及抓取一些网站的一些代理我遇到的问题是当我尝试抓取某个知名代理站点时当我要求 Beautiful Soup 查找 IP 在代理表中的位置时它并没有按照我的预期执行操作我将尝试查找每

随机推荐

MySQL - 增加列值或插入数据（如果不存在）

我有用户访问该网站用户可以执行一系列不同的操作我想要一个计数器来计算用户执行该操作的次数问题是这是每天每天都重新开始所以模型有 ID 用户操作时间日期我想用这个但我不能因为Action不是钥匙也不可能是钥匙其他字
TensorFlow.Keras ModelCheckpoint 在训练时保存模型，为什么？

我想知道为什么我们需要在训练时保存模型在火车开始时保存一次然后只在火车期间保存重量还不够吗我的意思是模型在火车过程中没有改变为什么需要这个布尔值 class ModelCheckpoint Callback save weights
Java 相当于 OpenLayers [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个Java库来显示来自各种来源的地图数据包括shapefile WMS WFS Goog
使用 LINQ 根据两个属性对列表中的项目进行分组

我有一个Column类如下 public class Column public int LocId get set public int SecId get set public double StartElevation get set
多个意图接收器？

文件指出如果Intent可以由多个应用程序处理系统将提示用户一个对话框要求他选择应用程序来完成操作有没有办法让用户选择多个应用程序来一一完成操作例如如果我想分享一条消息我将使用ACTION SEND具有指定的 MIME 类型
Ember 选择设置默认值

即使阅读了大量文档后我仍然无法完成这个简单的任务我的模板中有一个选择视图 view Ember Select id id diff contentBinding difficulties optionValuePath content
使用 interop.Excel 的 C# 中的 Excel 范围。范围既为空又不为空？

我有一个看起来像这样的 Excel 工作表 A1 B1 空白 D1 E1 F1 IE 仅填充第一行第三列为空白我使用 interop excel 在 C 中按以下方式解析此内容 Excel Application exApp OpenE
Office.js 性能：我应该在一个 Excel.run 函数中投入多少？

我正在处理一些大型电子表格约 30 000 行并遇到一些性能问题并有以下一些与性能相关的问题我可以或者更好的是我应该塞进一个Excel run功能我需要考虑哪些事情来确定何时将事情分解为多个Excel run call 一般来
如何消除光线的偏转[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我在 python 中使用 OpenCV 进行图像处理我的主要问题是光偏转这些偏转可以通过某种方法消除吗我在这里实现了很多代码
从 Ruby 打开 RSA 私钥

I think我知道如何创建自定义加密 RSA 密钥但如何像 ssh keygen 那样读取加密的密钥我知道我可以这样做 OpenSSL PKey RSA new File read private key 但随后 OpenSSL 要求
检查单击时复选框是否未选中 - jQuery

我想检查当用户单击某个复选框时是否未选中该复选框这样做的原因是因为我想在用户取消选中复选框时进行验证因为至少需要选中一个复选框因此如果他取消选中最后一项那么它会自动再次检查自身使用 jQuery 我可以很容易地知道它是否被检查
为什么我会收到 System.InvalidOperationException？

我此刻真的很绝望我正在编写一个 WPF 程序我建立了一个简单的XAML construct并根据数据库中存储的元素数量动态生成网格和网格内的标签尽管我定义了标签并将其命名为标签但我得到了System InvalidOperation
尝试理解

如何使用 Python 查找我的数据属于哪个集群？

如何使用 Python 查找我的数据属于哪个集群？ 的相关文章

随机推荐

如何使用 Python 查找我的数据属于哪个集群？的相关文章