clusteranalysis

如何将聚类标签与 Matlab 中的“真实值”标签相匹配

我在这里搜索并用谷歌搜索但没有结果在 Weka 中进行聚类时有一个方便的选项即类到聚类它与算法生成的聚类相匹配例如简单的 k means 到您作为类属性提供的基本事实类标签这样我们就可以看到聚类准确率错误百分比现在我

MATLAB clusteranalysis Weka

如何使用 FactoMineR 包以编程方式确定主成分的列索引？

给定一个包含混合变量即分类变量和连续变量的数据框例如 digits 0 9 set seed for reproducibility set seed 17 function to create random string creat

r clusteranalysis PCA featureselection unsupervisedlearning

在scikit-learn中，DBSCAN可以使用稀疏矩阵吗？

当我运行 scikit 的 dbscan 算法时出现内存错误我的数据约为20000 10000 它是一个二进制矩阵也许这样的矩阵不适合使用DBSCAN 我是机器学习的初学者我只是想找到一种不需要初始簇号的聚类方法不管怎样我发现了

machinelearning scikitlearn clusteranalysis datamining DBSCAN

对一维数据进行最佳聚类？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有人有一篇论文解释如何CKmeans 1d dp http cran r project org

r clusteranalysis kmeans

R - 二进制博客数据的聚类分析

我有一个与下面的示例类似的网络数据它仅具有用户和二进制值用于表明该用户是否点击了网站内的特定链接我想对这些数据进行一些聚类我的主要目标是根据用户的在线行为找到相似的用户对此有什么好的聚类算法我尝试过 k means 它不适用于二

r clusteranalysis kmeans

OpenCV K 均值 (kmeans2)

我正在使用 Opencv 的 K means 实现来对一大组 8 维向量进行聚类它们聚类得很好但我找不到任何方法来查看聚类过程创建的原型这可能吗 OpenCV 似乎只提供对集群索引或标签的访问如果没有我想是时候自己实现了我不

c opencv clusteranalysis kmeans

如何在Python中绘制k距离图

如何在 DBSCAN 中绘制在 python 中给定最小点值的距离图我正在寻找拐点和相应的 epsilon 值在 sklearn 中我没有看到任何返回此类距离的方法我错过了什么吗您可能想使用 numpy 提供的矩阵运算来加速距

python clusteranalysis DBSCAN

ELKI：在 Java 中的自定义对象上运行 DBSCAN

我正在尝试在 JAVA 中使用 ELKI 来运行 DBSCAN 为了进行测试我使用了 FileBasedDatabaseConnection 现在我想使用我的自定义对象作为参数来运行 DBSCAN 我的对象具有以下结构 public cl

Java clusteranalysis DBSCAN elki

scikit-learn 中是否有可用的子空间聚类包

scikit learn 中是否有任何类型的子空间聚类包可用如果有人还有兴趣的话是的有一个使用 scikit learn 子空间聚类 https github com ChongYou subspace clustering 它是用于

python machinelearning scikitlearn clusteranalysis

在 matlab 中直观地将数据分为两类

我有两个数据簇每个簇都有 x y 坐标和一个知道其类型的值 1 class1 2 class 2 我已经绘制了这些数据但我想用边界视觉上分割这些类做这样的事情的功能是什么我尝试了轮廓但没有帮助考虑一下这个分类 http e

MATLAB clusteranalysis plot

选择带宽和线性空间进行核密度估计。（为什么我的带宽不起作用？）

我已关注这个链接 https stackoverflow com questions 35094454 how would one use kernel density estimation as a 1d clustering metho

python machinelearning scikitlearn clusteranalysis kerneldensity

Python scipy/numpy 中相关性的层次聚类？

如何在相关矩阵上运行层次聚类scipy numpy 我有一个 100 行 x 9 列的矩阵我想根据 9 个条件中每个条目的相关性进行分层聚类我想使用 1 pearson 相关性作为聚类距离假设我有一个numpy array X包含 1

python NumPy clusteranalysis machinelearning scipy

R - “princomp”只能与比变量更多的单位一起使用

我正在使用 R 软件 R Commander 对我的数据进行聚类我的数据有一个较小的子集包含 200 行和大约 800 列尝试 kmeans 聚类并在图表上绘制时出现以下错误 princomp 只能与比变量更多的单位一起使用然后我创

r clusteranalysis kmeans PCA rcommander

在 ELKI 中运行聚类算法

我需要以编程方式使用 ELKI 运行 k medoids 聚类算法我有一个相似度矩阵我希望将其输入到算法中是否有任何代码片段可用于如何运行 ELKI 算法我基本上需要知道如何创建Database and Relation对象创建自

Java clusteranalysis kmeans elki

Scipy.cluster.hierarchy.fclusterdata + 距离测量

1 我正在使用 scipy 的 hcluster 模块所以我可以控制的变量是阈值变量我如何知道每个阈值的表现即在 Kmeans 中该性能将是所有点到其质心的总和当然这必须进行调整因为通常更多的簇更短的距离我可以用 hclu

python clusteranalysis scipy

'KMeansModel' 对象在 apache pyspark 中没有属性 'computeCost'

我正在 pyspark 中试验聚类模型我试图获得适合不同 K 值的簇的均方成本 def meanScore k df inputCol df columns 38 assembler VectorAssembler inputCols i

python apachespark PySpark clusteranalysis kmeans

文本聚类主题建模效率低下

我尝试使用 LDA 进行文本聚类但它没有给我不同的聚类下面是我的代码 Import libraries from gensim import corpora models import pandas as pd from gensim

python clusteranalysis gensim LDA

如何识别每个簇内的序列？

使用作为一部分的 biofam 数据集TraMineR library TraMineR data biofam lab lt c P L M LM C LC LMC D biofam seq lt seqdef biofam 10 25

r clusteranalysis datamanipulation traminer

如何创建每行库存的二进制矩阵？ (右)

我有一个由 9 列组成的数据框其中包含一系列因素每行可以填充全部 9 列因为该行包含 9 个东西但大多数没有大多数有 3 4 个这些列也不具体就像第 200 项出现在第 1 列和第 3 列中一样这是同一件事我想为包含所有

r sparsematrix clusteranalysis

kmean 需要三角不等式吗？

我想知道对于 kmeans 中使用的距离度量是否需要三角不等式 k 均值是designed for 欧几里得距离正好满足三角不等式使用其他距离函数是有风险的因为它可能会停止收敛然而原因是not三角不等式但是平均值可能不会最小化距离

machinelearning clusteranalysis Distance datamining kmeans