Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
在 K 均值算法 (MATLAB) 中使用绝对皮尔逊相关性作为距离
我需要使用相关距离进行一些聚类 但我需要绝对皮尔逊距离 而不是使用定义为 d 1 r 的内置 距离 相关 在我的应用程序中 反相关数据应该获得相同的集群 ID 现在 当使用 kmeans 函数时 我得到的质心高度反相关 我希望通过组合它们来
MATLAB
clusteranalysis
datamining
kmeans
在 MATLAB 中对文本进行聚类
我想在 MATLAB 中对文本进行层次凝聚聚类 说吧 我有四句话 I have a pen I have a paper I have a pencil I have a cat 我想把上面的四个句子聚类一下 看看哪个更相似 我知道统计工具
MATLAB
clusteranalysis
textmining
python 用高斯混合模型(GMM)拟合加权数据,协方差最小
我想使用 python 将高斯混合模型拟合到一组加权数据点 我尝试了 sklearn mixture GMM 它工作得很好 除了它对所有数据点的权重相等 有谁知道如何在此方法中为数据点分配权重 我多次尝试使用数据点来 增加其权重 但这对于大
python
opencv
scikitlearn
clusteranalysis
expectationmaximization
Matlab聚类编码-绘制散点图
我有一年期间每日 每年的能源消耗数据集 我想显示该数据集的散点图 分为我期望存在的四个集群 由于四个季节的差异 我知道 matlab cluster 函数可以做到这一点 但我的统计数据非常生疏 我希望得到一些指导来确定哪个函数最好使用 Th
MATLAB
clusteranalysis
scatterplot
根据相似度对图像进行聚类
我面临着基于相似性的图像聚类问题 而不知道聚类的数量 理想情况下 我想实现类似这样的目标http cs231n github io assets cnnvis tsne jpeg http cs231n github io assets c
算法 - 字符串相似度分数/散列
有没有一种方法可以计算字符串的一般 相似度分数 在某种程度上 我不是将两个字符串比较在一起 而是为每个字符串获取一些数字 分数 哈希 这些数字 分数可以稍后告诉我两个字符串是否相似 两个相似的字符串应该具有相似 接近 的分数 哈希值 让我们
python
string
Algorithm
clusteranalysis
Hash
k-means 使用从 minhash 生成的签名矩阵
我在文档及其木瓦上使用了 minhash 从这些文档生成签名矩阵 我已经验证签名矩阵可以很好地比较已知相似文档 例如 关于同一运动队的两篇文章或关于同一世界赛事的两篇文章 的杰卡德距离 从而给出正确的读数 我的问题是 使用这个签名矩阵来执行
python
Text
clusteranalysis
kmeans
minhash
DBSCAN sklearn 非常慢
我正在尝试对包含超过 100 万个数据点的数据集进行聚类 一列包含文本 另一列包含与其对应的数值 我面临的问题是它被卡住并且永远不会完成 我尝试过处理大约 100 000 个较小的数据集 它运行得相当快 但当我开始增加数据点时 它开始变慢
python
machinelearning
scikitlearn
clusteranalysis
DBSCAN
K表示当肘部图是平滑曲线时寻找肘部
我正在尝试使用以下代码绘制 k 的肘部 load CSDmat mydata for k 2 20 opts statset MaxIter 500 Display off IDX1 C1 sumd1 D1 kmeans CSDmat k
MATLAB
clusteranalysis
kmeans
Variance
如何使用 NLP 将非结构化文本内容分成不同的段落?
以下非结构化文本具有三个不同的主题 史泰龙 费城和美国革命 但是您会使用哪种算法或技术将这些内容分成不同的段落 分类器在这种情况下不起作用 我还尝试使用 Jaccard 相似度分析器来查找连续句子之间的距离 并尝试在连续句子之间的距离小于给
Text
NLP
Classification
clusteranalysis
textsegmentation
如何在R编程中显示同一坐标中的总数
更新2017年9月11日问题 这是我在 R 中集群 kmode 的代码 library klaR setwd D kmodes data to cluster lt read csv kmodes csv header TRUE sep c
r
clustercomputing
clusteranalysis
kmeans
visualize
在 R 中,如何在对数据进行聚类后绘制相似度矩阵(如框图)?
我想生成一个图表 显示聚类数据和相似度矩阵之间的相关性 我怎样才能在 R 中做到这一点 R 中是否有任何函数可以创建像此链接中的图片一样的图形 http bp0 blogger com VCI4AaOLs A SG5H jm f8I AAA
r
clusteranalysis
Java集群库[关闭]
Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我正在寻找java中的轻量级聚类库 我不需要该库中的 100 个聚类算法 只需 5 到 7 个算法就可以
Java
Math
clusteranalysis
余弦距离作为 k 均值的向量距离函数
我有一个 N 个顶点的图 其中每个顶点代表一个地方 我还有向量 每个用户一个 N 个系数中的每一个 其中系数的值是在相应地点花费的持续时间 以秒为单位 如果没有访问该地点则为 0 例如 对于图表 向量 v1 100 50 0 30 0 意味
clusteranalysis
datamining
Distance
kmeans
cosinesimilarity
当数据形状为(x,y,z)时如何进行聚类?
假设我有 10 个单独的观测值 每个观测值的大小为 125 59 我想根据这 10 个观测值的 2d 特征矩阵 125 59 对它们进行分组 这是否可以在不将每个观测值展平为 125 59 1D 矩阵的情况下实现 我什至无法实现 PCA 或
K-Medoids 真的比 K-Means 更擅长处理异常值吗? (举例说明相反)
K 中心点 and K Means是两种流行的分区聚类方法 我的研究表明 当存在异常值时 K Medoids 更擅长对数据进行聚类 source https stackoverflow com questions 21619794 what
r
clusteranalysis
partitioning
kmeans
使用elasticsearch进行文档聚类的便捷方法是什么?
我在 Elasticsearch 索引中存储了来自不同来源的 RSS 提要的大量新闻文章 当我进行搜索查询时 一次查询就会返回很多类似的新闻文章 因为相同的新闻主题会被许多 RSS 源覆盖 相反 我想做的是仅返回同一主题的一组文章中的一篇新
Algorithm
elasticsearch
clusteranalysis
寻找集体智慧.Net / C# 资源 [关闭]
Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 首先 我意识到这是一个与此非常相似的问题 net java 中有哪些优秀的集体智能开源库 https
c
NET
Algorithm
clusteranalysis
collectiveintelligence
«
1
2
3
4
5
6
7
»