Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
R 聚类-带有观察标签的轮廓
我用以下方法进行层次聚类clusterR 中的包 使用silhouette函数 我可以获得树状图中任何给定高度 h 截止点的簇输出的轮廓图 run hierarchical clustering if require cluster ins
r
plot
clusteranalysis
Scikit-learn、KMeans:如何使用 max_iter
我想了解类中的参数 max itersklearn cluster KMeans http scikit learn org stable modules generated sklearn cluster KMeans html 根据文档
python
parameters
scikitlearn
clusteranalysis
kmeans
python 中的图谱聚类
我想使用谱聚类在 python 中对图进行聚类 谱聚类是一种更通用的技术 不仅可以应用于图形 还可以应用于图像或任何类型的数据 但是 它被认为是一种特殊的技术graph聚类技术 遗憾的是 我无法在线找到 python 中的谱聚类图的示例 S
python
scikitlearn
clusteranalysis
graphtheory
spectral
scikit-learn 中聚类的混淆矩阵
我有一组带有已知标签的数据 我想尝试聚类 看看是否可以获得已知标签给出的相同聚类 为了测量准确性 我需要得到类似混淆矩阵的东西 我知道我可以轻松获得分类问题测试集的混淆矩阵 我已经尝试过了this http scikit learn org
python
scikitlearn
clusteranalysis
confusionmatrix
scikits
R 中的 PCA 多重图
我有一个如下所示的数据集 India China Brasil Russia SAfrica Kenya States Indonesia States Argentina Chile Netherlands HongKong 0 0854
r
plot
3d
clusteranalysis
PCA
聚类和贝叶斯分类器 Matlab
因此 我正处于下一步该做什么的十字路口 我开始学习一些机器学习算法并将其应用于复杂的数据集 现在我已经做到了 我从一开始的计划就是结合两种可能的分类器 试图建立一个多分类系统 但这就是我被困住的地方 我选择聚类算法 模糊 C 均值 在学习了
MATLAB
clusteranalysis
Classification
Bayesian
fuzzycmeans
如何在自组织图中关联回原始数据点
我正在使用 R kohonen 包来实现 SOM 我发现将自组织映射产生的代码向量与原始数据点相关联时遇到麻烦 我尝试在训练过程中包含没有权重的标签 但结果令人难以理解 有没有办法在训练过程完成后从每个节点引用原始数据点 您将从中获得中心值
r
Classification
clusteranalysis
selforganizingmaps
最相距的 k 个元素(聚类?)
我有一个简单的机器学习问题 我有 n 110 个元素 以及所有成对距离的矩阵 我想选择相距最远的 10 个元素 也就是说 我想要 Maximize Choose 10 different elements Return min distan
使用 Mclust 进行聚类会产生空聚类
我正在尝试使用 Mclust 对我的经验数据进行聚类 使用以下非常简单的代码时 library reshape2 library mclust data lt read csv file choose header TRUE check n
r
clusteranalysis
GMM
mclust
Python:3 维空间中的 DBSCAN
我一直在寻找 3 维点的 DBSCAN 实现 但运气不佳 有谁知道我的图书馆可以处理这个问题或者有这方面的经验吗 我假设 DBSCAN 算法可以处理 3 个维度 通过将 e 值设置为半径度量并通过欧几里德分离测量点之间的距离 如果有人尝试过
python
clusteranalysis
DBSCAN
R中按距离聚类
我有一个整数向量 我希望将其分成簇 以便任何两个簇之间的距离大于下限 并且在任何簇内 两个元素之间的距离小于上限 例如 假设我们有以下向量 1 4 5 6 9 29 32 36 并将上述下界和上限分别设置为 19 和 9 下面的两个向量应该
r
clusteranalysis
混淆矩阵和列联表有什么区别?
我正在编写一段代码来评估我的聚类算法 我发现每种评估方法都需要来自m n类似矩阵A aij where aij是属于类成员的数据点的数量ci和簇的元素kj 但似乎有两个这种类型的矩阵数据挖掘简介 Pang Ning Tan 等 一个是混淆矩
matrix
clusteranalysis
datamining
difference
谷歌地图 API v3 的服务器端集群
我目前正在开发一种谷歌地图概述小部件 它将位置显示为地图上的标记 标记的数量从数百个到数千个 10000 个以上 不等 现在我正在使用谷歌地图的 MarkerClusterer v3 1 0和谷歌地图 javascript api v3 高
php
googlemapsapi3
serverside
googlemapsmarkers
clusteranalysis
删除加权有向图中的循环
这是我其他帖子的后续问题 具有大小约束的聚类算法 https stackoverflow com questions 30112428 algorithm for clustering with size constraints 我正在研究
Algorithm
Graph
clusteranalysis
关联词的邻近度
假设我有一段大约一段时间的对话文本记录 1小时 我想知道哪些词彼此相邻 我将使用什么类型的统计技术来确定哪些单词聚集在一起以及它们彼此之间的接近程度如何 我怀疑某种聚类分析或主成分分析 要确定单词的邻近度 您必须构建一个图表 每个单词都是一
Algorithm
Text
statistics
clusteranalysis
在坐标和非空间特征上对地理空间数据进行聚类
假设我将以下数据帧存储为称为坐标的变量 其中前几行如下所示 business lat business lng business rating 0 19 111841 72 910729 5 1 19 111342 72 908387 5
python
scikitlearn
clusteranalysis
Geospatial
DBSCAN
对相似的时间序列进行聚类?
我有 10 20k 个不同的时间序列 24 维数据 一天中每个小时的一列 并且我对表现出大致相同活动模式的时间序列进行聚类感兴趣 我最初开始实施动态时间扭曲 DTW 是因为 并非我所有的时间序列都完全一致 出于我的目的 两个稍微偏移的时间序
python
machinelearning
TimeSeries
clusteranalysis
DTW
如何使用 ELKI 中的索引结构?
这些是报价形式http elki dbs ifi lmu de http elki dbs ifi lmu de 本质上 我们将抽象距离查询绑定到数据库 然后对该距离进行最近邻搜索 此时 ELKI 将自动选择最合适的 kNN 查询类 如果我
database
clusteranalysis
outliers
rtree
elki
Rand Index函数(聚类性能评估)
据我所知 python 中没有可用于 Rand Index 的软件包 而对于调整后的 Rand Index 您可以选择使用sklearn metrics adjusted rand score labels true labels pred
python
clusteranalysis
precision
unsupervisedlearning
为树状图中的刻度标签着色以匹配簇颜色
如何为树状图的标签单独着色 使其与 MATLAB 中簇的颜色相匹配 这是使用下面我的答案中的代码生成的所需输出示例 请注意 标签只是 50 个字符系列 A r 如果有更直接的方法来做到这一点 请发布答案 因为我无法通过谷歌搜索找到解决方案
MATLAB
plot
clusteranalysis
hierarchicalclustering
dendrogram
«
1
2
3
4
5
6
...8
»