Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
在 R 中获得多种分区方法的共识
My data data cbind c 1 1 2 1 1 3 c 1 1 2 1 1 1 c 2 2 1 2 1 2 colnames data paste item 1 3 rownames data paste method 1 6
r
Algorithm
Classification
clusteranalysis
partitioning
如何根据Python中最近的聚类质心逻辑将新的观察值分配给现有的Kmeans聚类?
我使用下面的代码通过 Scikit learn 创建 k means 集群 kmean KMeans n clusters nclusters n jobs 1 random state 2376 max iter 1000 n init
python
scikitlearn
clusteranalysis
kmeans
textclassification
基于相似单词序列的字符串聚类
我正在寻找一种有效的方法 根据相似单词序列的出现将大约 1000 万个字符串聚类成簇 考虑一个字符串列表 例如 the fruit hut number one the ice cre am shop number one jim s ta
Algorithm
machinelearning
NLP
clusteranalysis
在 Python 中使用 Scipy Hierarchy Clustering 进行文本聚类
我有一个文本语料库 其中包含 1000 多篇文章 每篇文章都在单独的行中 我正在尝试使用 python 中的 Scipy 进行层次聚类来生成相关文章的集群 这是我用来进行聚类的代码 Agglomerative Clustering impo
python
scipy
clusteranalysis
textmining
如何对 NetworkX 中创建的图 g 进行聚类?
我正在尝试将聚类应用于数据集 在此之前 我必须将图划分为 n 个簇 但我不知道该怎么做 Suppose 边缘列表你的未加权的 and 不定向的 graph保存在文件edges txt中 您可以按照以下步骤对图的节点进行聚类 Step 1 g
python
clusteranalysis
networkx
Embedding
聚类数量未知的无监督聚类
我有一大组 3 维向量 我需要根据欧几里德距离对它们进行聚类 以便任何特定聚类中的所有向量彼此之间的欧几里德距离小于阈值 T 我不知道有多少个集群 最后 可能存在不属于任何簇的单独向量 因为其与空间中任何向量的欧几里德距离不小于 T 这里应
如何使用 R 中的 k 均值聚类技术获得与数据相对应的聚类编号? [关闭]
很难说出这里问的是什么 这个问题模棱两可 含糊不清 不完整 过于宽泛或言辞激烈 无法以目前的形式合理回答 如需帮助澄清此问题以便重新打开 访问帮助中心 我通过 k 均值聚类方法对数据进行聚类 如何在 R 中使用 k 均值聚类技术获得与数据相
r
clusteranalysis
kmeans
如何解决错误:storage.mode(x) <-“double”中的错误:无法强制“list”对象输入“double”
您好 我正在尝试运行 som 和 kmeans 分析 但我无法解决它 因为有一个错误代码 storage mode x 我怎么解决这个问题 cdata lt read delim Cluster txt stringsAsFactors F
r
SyntaxError
clusteranalysis
kmeans
som
有哪些实现半监督(约束)聚类的软件包?
我想对半监督 约束 聚类进行一些实验 特别是作为实例级成对约束 必须链接或无法链接约束 提供的背景知识 我想知道有没有好的开源包实现半监督聚类 我尝试查看 PyBrain mlpy scikit 和 Orange 但找不到任何约束聚类算法
clusteranalysis
kmeans
pybrain
DBSCAN
如何确定数据点的两个分区(聚类)是否相同?
I have n某个任意空间中的数据点 我将它们聚类 我的聚类算法的结果是一个由 int 向量表示的分区l长度n将每个点分配给一个簇 的价值观l范围从 0 到 可能 n 1 Example l 1 1 1 1 0 0 2 6 是一个分区n
c
python
Algorithm
MATLAB
clusteranalysis
具有非常大矩阵的 K 均值
我必须在一个非常大的矩阵 大约 300 000x100 000 个值 超过 100Gb 上执行 k 均值聚类 我想知道我是否可以使用 R 软件或 weka 来执行此操作 我的计算机是一台多处理器 具有 8GB 内存和数百 GB 可用空间 我
r
clusteranalysis
Weka
kmeans
mahout
如何对 SQL 中存储的附近纬度和经度位置进行分组
我正在尝试分析英国自行车事故的数据 以找到统计黑点 这是另一个网站的数据示例 http www cycleinjury co uk map 我目前正在使用 SQLite 来存储大约 100k 的纬度 经度位置 我想将附近的位置分组在一起 这
sql
SQLite
machinelearning
clusteranalysis
datamining
R:在朋友组中最佳地共享 Cookie
我正在使用 R 编程语言 假设有 100 人 每个人都用 1 100 开始的 ID 表示 每个人都可以与其他人成为朋友 数据集可以用图形 网络格式表示 如下所示 Set the seed for reproducibility set se
r
Graph
clusteranalysis
dynamicprogramming
igraph
如何展开使用 R 中的 igraph 包制作的社区图
尝试在推文数据中查找社区 不同单词之间的余弦相似度形成邻接矩阵 然后 我根据该邻接矩阵创建了图 图表的可视化是这里的任务 Document Term Matrix dtm DocumentTermMatrix tweets adjust t
r
clusteranalysis
igraph
graphvisualization
给定成对距离且簇数未知的聚类?
我有一组对象 obj1 obj2 obj3 objn 我已经计算了所有可能对的成对距离 距离存储在n n matrix M with Mij之间的距离obji and objj 那么自然就可以看到M是一个对称矩阵 现在我希望对这些对象执行无
Algorithm
machinelearning
clusteranalysis
具有最小尺寸约束的聚类算法
我有一组数据聚类成k组 每个簇的最小大小限制为m 我已经对数据进行了一些重新聚类 所以现在我得到了这组点 每个点都有一个或多个更好的簇 但不能单独切换 因为它会违反大小限制 Goal 最小化每个点到其聚类中心的距离总和 受 最小簇大小 m
Algorithm
clusteranalysis
如何使用 ggplot 绘制 T-SNE 聚类图
以下是使用 IRIS 数据的 t SNE 代码 library Rtsne iris unique lt unique iris Remove duplicates iris matrix lt as matrix iris unique
r
ggplot2
clusteranalysis
tidyverse
如何在不删除 R 中存在 NA 的行的情况下执行聚类
我有一个数据 其元素中包含一些 NA 值 我想做的是执行聚类而不删除行NA 存在的地方 我明白那个gower距离测量单位daisy允许这种情况 但为什么我下面的代码不起作用 我欢迎 雏菊 以外的其他选择 plot heat map with
r
clusteranalysis
Bioconductor
python中的k-means:确定哪些数据与每个质心相关联
我一直在使用scipy cluster vq kmeans用于进行一些 k 均值聚类 但想知道是否有一种方法可以确定每个数据点 假定 与哪个质心相关联 显然你可以手动执行此操作 但据我所知 kmeans 函数不会返回此值 有一个功能kmea
python
scipy
clusteranalysis
kmeans
KMeans 聚类超过 500 万个向量
我遇到了一个真正的问题 我需要对 500 万个向量进行一些 Kmeans 聚类 每个向量包含大约 32 列 我尝试了 Mahout 它需要 Linux 而我在 Windows 上 我无法使用 Linux 操作系统和任何类型的模拟器 谁能建议
Algorithm
clusteranalysis
«
1
2
3
4
5
6
7