clusteranalysis

R 聚类-带有观察标签的轮廓

我用以下方法进行层次聚类clusterR 中的包使用silhouette函数我可以获得树状图中任何给定高度 h 截止点的簇输出的轮廓图 run hierarchical clustering if require cluster ins

r plot clusteranalysis

Scikit-learn、KMeans：如何使用 max_iter

我想了解类中的参数 max itersklearn cluster KMeans http scikit learn org stable modules generated sklearn cluster KMeans html 根据文档

python parameters scikitlearn clusteranalysis kmeans

python 中的图谱聚类

我想使用谱聚类在 python 中对图进行聚类谱聚类是一种更通用的技术不仅可以应用于图形还可以应用于图像或任何类型的数据但是它被认为是一种特殊的技术graph聚类技术遗憾的是我无法在线找到 python 中的谱聚类图的示例 S

python scikitlearn clusteranalysis graphtheory spectral

scikit-learn 中聚类的混淆矩阵

我有一组带有已知标签的数据我想尝试聚类看看是否可以获得已知标签给出的相同聚类为了测量准确性我需要得到类似混淆矩阵的东西我知道我可以轻松获得分类问题测试集的混淆矩阵我已经尝试过了this http scikit learn org

python scikitlearn clusteranalysis confusionmatrix scikits

R 中的 PCA 多重图

我有一个如下所示的数据集 India China Brasil Russia SAfrica Kenya States Indonesia States Argentina Chile Netherlands HongKong 0 0854

r plot 3d clusteranalysis PCA

聚类和贝叶斯分类器 Matlab

因此我正处于下一步该做什么的十字路口我开始学习一些机器学习算法并将其应用于复杂的数据集现在我已经做到了我从一开始的计划就是结合两种可能的分类器试图建立一个多分类系统但这就是我被困住的地方我选择聚类算法模糊 C 均值在学习了

MATLAB clusteranalysis Classification Bayesian fuzzycmeans

如何在自组织图中关联回原始数据点

我正在使用 R kohonen 包来实现 SOM 我发现将自组织映射产生的代码向量与原始数据点相关联时遇到麻烦我尝试在训练过程中包含没有权重的标签但结果令人难以理解有没有办法在训练过程完成后从每个节点引用原始数据点您将从中获得中心值

r Classification clusteranalysis selforganizingmaps

最相距的 k 个元素（聚类？）

我有一个简单的机器学习问题我有 n 110 个元素以及所有成对距离的矩阵我想选择相距最远的 10 个元素也就是说我想要 Maximize Choose 10 different elements Return min distan

使用 Mclust 进行聚类会产生空聚类

我正在尝试使用 Mclust 对我的经验数据进行聚类使用以下非常简单的代码时 library reshape2 library mclust data lt read csv file choose header TRUE check n

r clusteranalysis GMM mclust

Python：3 维空间中的 DBSCAN

我一直在寻找 3 维点的 DBSCAN 实现但运气不佳有谁知道我的图书馆可以处理这个问题或者有这方面的经验吗我假设 DBSCAN 算法可以处理 3 个维度通过将 e 值设置为半径度量并通过欧几里德分离测量点之间的距离如果有人尝试过

python clusteranalysis DBSCAN

R中按距离聚类

我有一个整数向量我希望将其分成簇以便任何两个簇之间的距离大于下限并且在任何簇内两个元素之间的距离小于上限例如假设我们有以下向量 1 4 5 6 9 29 32 36 并将上述下界和上限分别设置为 19 和 9 下面的两个向量应该

r clusteranalysis

混淆矩阵和列联表有什么区别？

我正在编写一段代码来评估我的聚类算法我发现每种评估方法都需要来自m n类似矩阵A aij where aij是属于类成员的数据点的数量ci和簇的元素kj 但似乎有两个这种类型的矩阵数据挖掘简介 Pang Ning Tan 等一个是混淆矩

matrix clusteranalysis datamining difference

谷歌地图 API v3 的服务器端集群

我目前正在开发一种谷歌地图概述小部件它将位置显示为地图上的标记标记的数量从数百个到数千个 10000 个以上不等现在我正在使用谷歌地图的 MarkerClusterer v3 1 0和谷歌地图 javascript api v3 高

php googlemapsapi3 serverside googlemapsmarkers clusteranalysis

删除加权有向图中的循环

这是我其他帖子的后续问题具有大小约束的聚类算法 https stackoverflow com questions 30112428 algorithm for clustering with size constraints 我正在研究

Algorithm Graph clusteranalysis

关联词的邻近度

假设我有一段大约一段时间的对话文本记录 1小时我想知道哪些词彼此相邻我将使用什么类型的统计技术来确定哪些单词聚集在一起以及它们彼此之间的接近程度如何我怀疑某种聚类分析或主成分分析要确定单词的邻近度您必须构建一个图表每个单词都是一

Algorithm Text statistics clusteranalysis

在坐标和非空间特征上对地理空间数据进行聚类

假设我将以下数据帧存储为称为坐标的变量其中前几行如下所示 business lat business lng business rating 0 19 111841 72 910729 5 1 19 111342 72 908387 5

python scikitlearn clusteranalysis Geospatial DBSCAN

对相似的时间序列进行聚类？

我有 10 20k 个不同的时间序列 24 维数据一天中每个小时的一列并且我对表现出大致相同活动模式的时间序列进行聚类感兴趣我最初开始实施动态时间扭曲 DTW 是因为并非我所有的时间序列都完全一致出于我的目的两个稍微偏移的时间序

python machinelearning TimeSeries clusteranalysis DTW

如何使用 ELKI 中的索引结构？

这些是报价形式http elki dbs ifi lmu de http elki dbs ifi lmu de 本质上我们将抽象距离查询绑定到数据库然后对该距离进行最近邻搜索此时 ELKI 将自动选择最合适的 kNN 查询类如果我

database clusteranalysis outliers rtree elki

Rand Index函数（聚类性能评估）

据我所知 python 中没有可用于 Rand Index 的软件包而对于调整后的 Rand Index 您可以选择使用sklearn metrics adjusted rand score labels true labels pred

python clusteranalysis precision unsupervisedlearning

为树状图中的刻度标签着色以匹配簇颜色

如何为树状图的标签单独着色使其与 MATLAB 中簇的颜色相匹配这是使用下面我的答案中的代码生成的所需输出示例请注意标签只是 50 个字符系列 A r 如果有更直接的方法来做到这一点请发布答案因为我无法通过谷歌搜索找到解决方案

MATLAB plot clusteranalysis hierarchicalclustering dendrogram