Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
使用 scikit learn 对通过 networkx 生成的图进行谱聚类
我有一个 3000x50 特征向量矩阵 我使用以下方法获得了一个相似度矩阵sklearn metrics pairwise distances作为 相似度矩阵 现在我用了networkx使用上一步中生成的相似度矩阵创建一个图G nx fro
clusteranalysis
scikitlearn
partitioning
networkx
spectral
计算聚类的 F 度量
谁能帮我计算一下F measure的总和吗 我知道如何计算召回率和精度 但不知道对于给定的算法如何计算一个 F 测量值 举个例子 假设我的算法创建m集群 但我知道有n相同数据的聚类 由另一个基准算法创建 我找到了一份 pdf 但它没有用 因
clusteranalysis
datamining
precisionrecall
贪心聚类算法速度提升
我正在尝试在 python 中实现一个非常简单的贪婪聚类算法 但很难优化它的速度 该算法将采用距离矩阵 找到具有最多小于预定距离截止值的分量的列 并将行索引 具有小于截止值的分量 存储为簇的成员 簇的质心是列索引 然后 从距离矩阵中删除每个
python
performance
clusteranalysis
R 合并具有相似值的行
我有一个数据框 行值首先从小到大排序 我计算相邻行之间的行值差异 组合具有相似差异 例如 小于 1 的行 并返回组合行的平均值 我可以使用 for 循环检查每一行的差异 但这似乎是一种非常低效的方法 还有更好的想法吗 谢谢 library
r
DataFrame
dplyr
diff
clusteranalysis
不同长度的时间序列数据的聚类
我有不同系列长度的时间序列数据 我想根据 DTW 距离进行聚类 但找不到与之相关的 ant 库 sklearn给出直接错误 而 tslearn kmeans 给出错误答案 我的问题是如果我用零填充它就可以解决 但我不确定这在聚类时填充时间序
TimeSeries
clusteranalysis
kmeans
如何选择 eps 和 minPts(DBSCAN 算法的两个参数)以获得有效的结果?
我应该使用什么例程或算法来为 DBSCAN 算法提供 eps 和 minPts 参数以获得有效的结果 DBSCAN 论文建议根据维度选择 minPts 根据 k 距离图中的肘部选择 eps 在最近的出版物中 舒伯特 E 桑德 J 埃斯特 M
python
clusteranalysis
DBSCAN
用正确的组号标记 R 树状图分支
我正在尝试绘制树状图 以便分支上的标签与聚类分析中的组号相匹配 目前 分支只是按照它们出现的顺序从左到右标记 而不是实际的组号 这是我当前的 R 代码和生成的树状图 dst lt dist Model Results method bina
r
clusteranalysis
dendrogram
dendextend
射线聚类算法
我知道显然有点的聚类算法 但我有不同的场景 我有许多光线 它们的起点都在 3D 球体上 并且其方向矢量向内指向球体 一些光线指向 A 点 其他光线指向 B 点等 并带有一些噪声 即光线彼此不完全相交 是否有一种聚类算法可以让我根据光线指向的
Algorithm
clusteranalysis
如何在 scipy 层次聚类中获取非单例簇 ID
根据this http docs scipy org doc scipy reference generated scipy cluster hierarchy dendrogram html scipy cluster hierarchy
python
scipy
clusteranalysis
hierarchicalclustering
使用杰卡德距离矩阵进行 Kmeans 聚类
我正在尝试创建 Jaccard 距离矩阵并对其执行 K 均值以给出簇 id 和簇中元素的 id 它的输入是 Twitter 推文 以下是代码 我无法理解如何使用 kmeans 文件中的初始种子 install packages rjson
r
twitter
clusteranalysis
kmeans
tweets
循环系统发育树上的节点标签
我正在尝试创建循环系统发育树 我有这部分代码 fit lt hclust dist Data 4 method complete members NULL nclus 3 color c red blue green color list
r
clusteranalysis
datavisualization
phylogeny
apephylo
python scikit-learn 缺失数据聚类
我想对缺少列的数据进行聚类 手动执行此操作 我将在没有此列的情况下计算缺少列的距离 使用 scikit learn 不可能出现丢失数据的情况 也没有机会指定用户距离函数 是否有机会对缺失数据进行聚类 示例数据 n samples 1500
python
scikitlearn
clusteranalysis
missingdata
在 python 中绘制 sklearn 集群
我使用亲和力传播获得了以下 sklearn 集群 import sklearn cluster import numpy as np sims np array 0 17 10 32 32 18 0 6 20 15 10 8 0 20 21
python
matplotlib
machinelearning
scikitlearn
clusteranalysis
K 表示使用 PySpark 进行聚类
我有一个非常大的数据框 我必须使用数据框中的特定 8 列 其中值要么是 强烈同意 同意 或 不同意 根据这 8 列 我需要创建一个新列来告诉该行属于哪个簇 1 8 最好使用 K 均值聚类 这在 PySpark 中可能吗 PS 我是 PySp
python
PySpark
clusteranalysis
如何从一个巨大的矩阵中获得最大可能的列序列和最少可能的行NA?
我想从数据框中选择列 以便得到结果连续的列序列尽可能长 而带有 NA 的行数尽可能少 因为之后必须删除它们 我想这样做的原因是 我想运行TraMineR seqsubm 自动获取转移成本矩阵 按转移概率 并稍后运行cluster agnes
r
clusteranalysis
powerset
traminer
sequenceanalysis
scikit-learn 中聚类超参数评估的网格搜索
我正在对大约 100 条记录 未标记 的样本进行聚类 并尝试使用 grid search 来评估具有各种超参数的聚类算法 我正在使用得分silhouette score效果很好 我的问题是我不需要使用交叉验证方面GridSearchCV R
python
scikitlearn
clusteranalysis
scoring
谱聚类
首先 我必须说我是 matlab 以及这个网站 的新手 所以请原谅我的无知 我正在尝试在 matlab 中编写一个函数 该函数将使用谱聚类将一组点分成两个簇 我的代码如下 function Groups TrySpectralCluster
MATLAB
clusteranalysis
linearalgebra
eigenvector
如何总结组合列表
我有一个包含 2 个元素组合的列表 如下所示 cbnl lt list c A B c B A c C D c E D c F G c H I c J K c I H c K J c G F c D C c E C c D E c C E
r
list
clusteranalysis
在散点图中为每个类别绘制不同的聚类标记
我有一个散点图 其中绘制了 14 个簇 但每 2 个簇属于同一类 它们都使用相同的标记 每 50 行是一个簇 每 100 行是同一类的两个簇 我想要做的是更改每 2 个簇或 100 行的标记 数据框链接 http www mediafire
python
matplotlib
clusteranalysis
scatterplot
计算 3D 平面的 Voronoi 图
是否有代码 库可以计算 3D 平面 平行四边形 的 Voronoi 图 我检查了 Qhull 它似乎只能处理点 在它的示例中 Voro 可以处理不同大小的球体 但我找不到任何多边形 在这张图片中 3d 中的样本平面 https i stac
3d
clusteranalysis
euclideandistance
Voronoi
qhull
1
2
3
4
5
6
7
»