Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
如何将聚类标签与 Matlab 中的“真实值”标签相匹配
我在这里搜索并用谷歌搜索 但没有结果 在 Weka 中进行聚类时 有一个方便的选项 即类到聚类 它与算法生成的聚类相匹配 例如简单的 k means 到您作为类属性提供的 基本事实 类标签 这样我们就可以看到聚类准确率 错误百分比 现在 我
MATLAB
clusteranalysis
Weka
如何使用 FactoMineR 包以编程方式确定主成分的列索引?
给定一个包含混合变量 即分类变量和连续变量 的数据框 例如 digits 0 9 set seed for reproducibility set seed 17 function to create random string creat
r
clusteranalysis
PCA
featureselection
unsupervisedlearning
在scikit-learn中,DBSCAN可以使用稀疏矩阵吗?
当我运行 scikit 的 dbscan 算法时 出现内存错误 我的数据约为20000 10000 它是一个二进制矩阵 也许这样的矩阵不适合使用DBSCAN 我是机器学习的初学者 我只是想找到一种不需要初始簇号的聚类方法 不管怎样 我发现了
machinelearning
scikitlearn
clusteranalysis
datamining
DBSCAN
对一维数据进行最佳聚类? [关闭]
Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 有没有人有一篇论文解释如何CKmeans 1d dp http cran r project org
r
clusteranalysis
kmeans
R - 二进制博客数据的聚类分析
我有一个与下面的示例类似的网络数据 它仅具有用户和二进制值 用于表明该用户是否点击了网站内的特定链接 我想对这些数据进行一些聚类 我的主要目标是根据用户的在线行为找到相似的用户 对此有什么好的聚类算法 我尝试过 k means 它不适用于二
r
clusteranalysis
kmeans
OpenCV K 均值 (kmeans2)
我正在使用 Opencv 的 K means 实现来对一大组 8 维向量进行聚类 它们聚类得很好 但我找不到任何方法来查看聚类过程创建的原型 这可能吗 OpenCV 似乎只提供对集群索引 或标签 的访问 如果没有 我想是时候自己实现了 我不
c
opencv
clusteranalysis
kmeans
如何在Python中绘制k距离图
如何在 DBSCAN 中绘制 在 python 中 给定最小点值的距离图 我正在寻找拐点和相应的 epsilon 值 在 sklearn 中 我没有看到任何返回此类距离的方法 我错过了什么吗 您可能想使用 numpy 提供的矩阵运算来加速距
python
clusteranalysis
DBSCAN
ELKI:在 Java 中的自定义对象上运行 DBSCAN
我正在尝试在 JAVA 中使用 ELKI 来运行 DBSCAN 为了进行测试 我使用了 FileBasedDatabaseConnection 现在我想使用我的自定义对象作为参数来运行 DBSCAN 我的对象具有以下结构 public cl
Java
clusteranalysis
DBSCAN
elki
scikit-learn 中是否有可用的子空间聚类包
scikit learn 中是否有任何类型的子空间聚类包可用 如果有人还有兴趣的话 是的 有一个使用 scikit learn 子空间聚类 https github com ChongYou subspace clustering 它是用于
python
machinelearning
scikitlearn
clusteranalysis
在 matlab 中直观地将数据分为两类
我有两个数据簇 每个簇都有 x y 坐标 和一个知道其类型的值 1 class1 2 class 2 我已经绘制了这些数据 但我想用边界 视觉上 分割这些类 做这样的事情的功能是什么 我尝试了轮廓 但没有帮助 考虑一下这个分类 http e
MATLAB
clusteranalysis
plot
选择带宽和线性空间进行核密度估计。 (为什么我的带宽不起作用?)
我已关注这个链接 https stackoverflow com questions 35094454 how would one use kernel density estimation as a 1d clustering metho
python
machinelearning
scikitlearn
clusteranalysis
kerneldensity
Python scipy/numpy 中相关性的层次聚类?
如何在相关矩阵上运行层次聚类scipy numpy 我有一个 100 行 x 9 列的矩阵 我想根据 9 个条件中每个条目的相关性进行分层聚类 我想使用 1 pearson 相关性作为聚类距离 假设我有一个numpy array X包含 1
python
NumPy
clusteranalysis
machinelearning
scipy
R - “princomp”只能与比变量更多的单位一起使用
我正在使用 R 软件 R Commander 对我的数据进行聚类 我的数据有一个较小的子集 包含 200 行和大约 800 列 尝试 kmeans 聚类并在图表上绘制时出现以下错误 princomp 只能与比变量更多的单位一起使用 然后我创
r
clusteranalysis
kmeans
PCA
rcommander
在 ELKI 中运行聚类算法
我需要以编程方式使用 ELKI 运行 k medoids 聚类算法 我有一个相似度矩阵 我希望将其输入到算法中 是否有任何代码片段可用于如何运行 ELKI 算法 我基本上需要知道如何创建Database and Relation对象 创建自
Java
clusteranalysis
kmeans
elki
Scipy.cluster.hierarchy.fclusterdata + 距离测量
1 我正在使用 scipy 的 hcluster 模块 所以我可以控制的变量是阈值变量 我如何知道每个阈值的表现 即在 Kmeans 中 该性能将是所有点到其质心的总和 当然 这必须进行调整 因为通常更多的簇 更短的距离 我可以用 hclu
python
clusteranalysis
scipy
'KMeansModel' 对象在 apache pyspark 中没有属性 'computeCost'
我正在 pyspark 中试验聚类模型 我试图获得适合不同 K 值的簇的均方成本 def meanScore k df inputCol df columns 38 assembler VectorAssembler inputCols i
python
apachespark
PySpark
clusteranalysis
kmeans
文本聚类主题建模效率低下
我尝试使用 LDA 进行文本聚类 但它没有给我不同的聚类 下面是我的代码 Import libraries from gensim import corpora models import pandas as pd from gensim
python
clusteranalysis
gensim
LDA
如何识别每个簇内的序列?
使用作为一部分的 biofam 数据集TraMineR library TraMineR data biofam lab lt c P L M LM C LC LMC D biofam seq lt seqdef biofam 10 25
r
clusteranalysis
datamanipulation
traminer
如何创建每行库存的二进制矩阵? (右)
我有一个由 9 列组成的数据框 其中包含一系列因素 每行可以填充全部 9 列 因为该行包含 9 个 东西 但大多数没有 大多数有 3 4 个 这些列也不具体 就像第 200 项出现在第 1 列和第 3 列中一样 这是同一件事 我想为包含所有
r
sparsematrix
clusteranalysis
kmean 需要三角不等式吗?
我想知道对于 kmeans 中使用的距离度量是否需要三角不等式 k 均值是designed for 欧几里得距离 正好满足三角不等式 使用其他距离函数是有风险的 因为它可能会停止收敛 然而原因是not三角不等式 但是平均值可能不会最小化距离
machinelearning
clusteranalysis
Distance
datamining
kmeans
«
1
2
3
4
5
6
7
»