clusteranalysis

在 K 均值算法 (MATLAB) 中使用绝对皮尔逊相关性作为距离

我需要使用相关距离进行一些聚类但我需要绝对皮尔逊距离而不是使用定义为 d 1 r 的内置距离相关在我的应用程序中反相关数据应该获得相同的集群 ID 现在当使用 kmeans 函数时我得到的质心高度反相关我希望通过组合它们来

MATLAB clusteranalysis datamining kmeans

在 MATLAB 中对文本进行聚类

我想在 MATLAB 中对文本进行层次凝聚聚类说吧我有四句话 I have a pen I have a paper I have a pencil I have a cat 我想把上面的四个句子聚类一下看看哪个更相似我知道统计工具

MATLAB clusteranalysis textmining

python 用高斯混合模型（GMM）拟合加权数据，协方差最小

我想使用 python 将高斯混合模型拟合到一组加权数据点我尝试了 sklearn mixture GMM 它工作得很好除了它对所有数据点的权重相等有谁知道如何在此方法中为数据点分配权重我多次尝试使用数据点来增加其权重但这对于大

python opencv scikitlearn clusteranalysis expectationmaximization

Matlab聚类编码-绘制散点图

我有一年期间每日每年的能源消耗数据集我想显示该数据集的散点图分为我期望存在的四个集群由于四个季节的差异我知道 matlab cluster 函数可以做到这一点但我的统计数据非常生疏我希望得到一些指导来确定哪个函数最好使用 Th

MATLAB clusteranalysis scatterplot

根据相似度对图像进行聚类

我面临着基于相似性的图像聚类问题而不知道聚类的数量理想情况下我想实现类似这样的目标http cs231n github io assets cnnvis tsne jpeg http cs231n github io assets c

算法 - 字符串相似度分数/散列

有没有一种方法可以计算字符串的一般相似度分数在某种程度上我不是将两个字符串比较在一起而是为每个字符串获取一些数字分数哈希这些数字分数可以稍后告诉我两个字符串是否相似两个相似的字符串应该具有相似接近的分数哈希值让我们

python string Algorithm clusteranalysis Hash

k-means 使用从 minhash 生成的签名矩阵

我在文档及其木瓦上使用了 minhash 从这些文档生成签名矩阵我已经验证签名矩阵可以很好地比较已知相似文档例如关于同一运动队的两篇文章或关于同一世界赛事的两篇文章的杰卡德距离从而给出正确的读数我的问题是使用这个签名矩阵来执行

python Text clusteranalysis kmeans minhash

DBSCAN sklearn 非常慢

我正在尝试对包含超过 100 万个数据点的数据集进行聚类一列包含文本另一列包含与其对应的数值我面临的问题是它被卡住并且永远不会完成我尝试过处理大约 100 000 个较小的数据集它运行得相当快但当我开始增加数据点时它开始变慢

python machinelearning scikitlearn clusteranalysis DBSCAN

K表示当肘部图是平滑曲线时寻找肘部

我正在尝试使用以下代码绘制 k 的肘部 load CSDmat mydata for k 2 20 opts statset MaxIter 500 Display off IDX1 C1 sumd1 D1 kmeans CSDmat k

MATLAB clusteranalysis kmeans Variance

如何使用 NLP 将非结构化文本内容分成不同的段落？

以下非结构化文本具有三个不同的主题史泰龙费城和美国革命但是您会使用哪种算法或技术将这些内容分成不同的段落分类器在这种情况下不起作用我还尝试使用 Jaccard 相似度分析器来查找连续句子之间的距离并尝试在连续句子之间的距离小于给

Text NLP Classification clusteranalysis textsegmentation

如何在R编程中显示同一坐标中的总数

更新2017年9月11日问题这是我在 R 中集群 kmode 的代码 library klaR setwd D kmodes data to cluster lt read csv kmodes csv header TRUE sep c

r clustercomputing clusteranalysis kmeans visualize

在 R 中，如何在对数据进行聚类后绘制相似度矩阵（如框图）？

我想生成一个图表显示聚类数据和相似度矩阵之间的相关性我怎样才能在 R 中做到这一点 R 中是否有任何函数可以创建像此链接中的图片一样的图形 http bp0 blogger com VCI4AaOLs A SG5H jm f8I AAA

r clusteranalysis

Java集群库[关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找java中的轻量级聚类库我不需要该库中的 100 个聚类算法只需 5 到 7 个算法就可以

Java Math clusteranalysis

余弦距离作为 k 均值的向量距离函数

我有一个 N 个顶点的图其中每个顶点代表一个地方我还有向量每个用户一个 N 个系数中的每一个其中系数的值是在相应地点花费的持续时间以秒为单位如果没有访问该地点则为 0 例如对于图表向量 v1 100 50 0 30 0 意味

clusteranalysis datamining Distance kmeans cosinesimilarity

当数据形状为(x,y,z)时如何进行聚类？

假设我有 10 个单独的观测值每个观测值的大小为 125 59 我想根据这 10 个观测值的 2d 特征矩阵 125 59 对它们进行分组这是否可以在不将每个观测值展平为 125 59 1D 矩阵的情况下实现我什至无法实现 PCA 或

K-Medoids 真的比 K-Means 更擅长处理异常值吗？（举例说明相反）

K 中心点 and K Means是两种流行的分区聚类方法我的研究表明当存在异常值时 K Medoids 更擅长对数据进行聚类 source https stackoverflow com questions 21619794 what

r clusteranalysis partitioning kmeans

使用elasticsearch进行文档聚类的便捷方法是什么？

我在 Elasticsearch 索引中存储了来自不同来源的 RSS 提要的大量新闻文章当我进行搜索查询时一次查询就会返回很多类似的新闻文章因为相同的新闻主题会被许多 RSS 源覆盖相反我想做的是仅返回同一主题的一组文章中的一篇新

Algorithm elasticsearch clusteranalysis

寻找集体智慧.Net / C# 资源 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案首先我意识到这是一个与此非常相似的问题 net java 中有哪些优秀的集体智能开源库 https

c NET Algorithm clusteranalysis collectiveintelligence