Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
寻找簇的中心
我有以下问题 进行抽象以找出关键问题 我有 10 个点 每个点与其他点有一定距离 我想要 能够找到簇的中心 即与其他点的成对距离最小的点 令 p j p k 表示点 j 和 k 之间的成对距离p i 是簇的中心点 iff p i s t m
Algorithm
clusteranalysis
datamining
如何将彼此“接近”的纬度/经度点分组?
我有一个用户提交的纬度 经度点的数据库 并且正在尝试将 接近 点分组在一起 接近 是相对的 但目前看来约为 500 英尺 起初 我似乎只能按前 3 个小数位具有相同纬度 经度的行进行分组 大约是一个 300x300 的盒子 了解当您远离赤道
sql
database
Geolocation
LOCATION
clusteranalysis
在 GPU 支持下对高维数据进行更快的 Kmeans 聚类
我们一直在使用 Kmeans 来对日志进行聚类 典型的数据集有 10 mill 具有 100k 特征的样本 为了找到最佳 k 我们并行运行多个 Kmeans 并选择轮廓得分最佳的一个 在 90 的情况下 我们最终得到的 k 介于 2 到 1
tensorflow
machinelearning
PySpark
clusteranalysis
kmeans
KMeans 对不平衡数据进行聚类
我有一组包含 50 个特征 c1 c2 c3 的数据 行数超过 80k 每行包含标准化数值 范围 0 1 它实际上是一个标准化的虚拟变量 其中一些行只有很少的特征 3 4 即如果没有值则分配 0 大多数行大约有 10 20 个特征 我使用
python
clusteranalysis
kmeans
datascience
featureengineering
哪里可以找到可靠的 K-medoid(不是 k-means)开源软件/工具? [关闭]
Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我正在学习 K medoids 算法 所以如果我提出不恰当的问题 我很抱歉 据我所知 K medoid
opensource
clusteranalysis
kmeans
使用 scikit 包在 Python 中绘制集群区域的边界
这是我处理 3 个属性 x y 值 中的数据聚类的简单示例 每个样本代表其位置 x y 及其所属变量 我的代码发布在这里 x np arange 100 200 1 y np arange 100 200 1 value np random
python
matplotlib
scikitlearn
clusteranalysis
kmeans
R 中的聚类分析:确定最佳聚类数
如何选择最佳的聚类数量来进行 k 均值分析 绘制以下数据的子集后 多少个簇比较合适 如何进行聚类树突分析 n 1000 kk 10 x1 runif kk y1 runif kk z1 runif kk x4 sample x1 lengt
r
clusteranalysis
kmeans
Scikit Learn - K-Means - 肘部 - 标准
今天我想学习一些关于 K means 的知识 我已经了解该算法并且知道它是如何工作的 现在我正在寻找正确的 k 我发现肘部准则作为检测正确的 k 的方法 但我不明白如何将它与 scikit learn 一起使用 在 scikit learn
python
machinelearning
scikitlearn
clusteranalysis
kmeans
Javascript 中的 k 均值聚类实现? [关闭]
Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我需要 k means 聚类算法的 Javascript 实现 我只有一维数据 很少超过 100 个项目
javascript
clusteranalysis
kmeans
我很难理解 OPTICS 聚类算法中排序的概念
我很难理解 OPTICS 聚类算法中排序的概念 如果有人对顺序给出逻辑和直观的解释 并解释什么 我将不胜感激res order下面的代码做了什么以及什么是可靠性图 可以通过命令 plot res 获得 library dbscan set
clusteranalysis
DBSCAN
opticsalgorithm
哪种数据聚类算法适合检测时间序列事件中未知数量的聚类?
这是我的场景 考虑在不同地点和时间发生的一组事件 例如 考虑有人在高空记录暴风雨期间城市中的雷击 就我的目的而言 闪电是瞬时的 只能击中某些位置 例如高层建筑 还可以想象每次雷击都有一个唯一的 ID 以便以后可以参考该雷击 这个城市大约有1
Algorithm
languageagnostic
clusteranalysis
Java机器学习库可以商用吗? [关闭]
Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 有谁知道我可以将其用于商业产品的优秀 Java 机器学习库吗 不幸的是 Weka 和 Rapidmin
Java
machinelearning
clusteranalysis
Classification
如何对搜索引擎关键词进行聚类?
从 Google Analytics 中 我有一个 长 关键字列表 人们在搜索引擎中使用这些关键字来查找我的网站 我想找到 核心关键词 假设的例子 java online training learning java scala train
Java
clusteranalysis
keyword
如何在 k 均值中使用欧氏距离以外的不同距离公式
我正在处理纬度经度数据 我必须根据两点之间的距离进行聚类 现在两个不同点之间的距离是 ACOS SIN lat1 SIN lat2 COS lat1 COS lat2 COS lon2 lon1 6371 我想在 R 中使用 k 均值 有什
r
machinelearning
clusteranalysis
datamining
kmeans
有效地将相似的数字分组在一起[重复]
这个问题在这里已经有答案了 可能的重复 一维数数组聚类 https stackoverflow com questions 11513484 1d number array clustering 我有一个数字数组 例如 1 20 300 4
Algorithm
Math
languageagnostic
statistics
clusteranalysis
估计/选择 DBSCAN 的最佳超参数
我需要根据不同介词的分布找到自然出现的名词类别 如施事 工具 时间 地点等 我尝试使用 k means 聚类 但帮助较少 效果不佳 我正在寻找的类有很多重叠 可能是因为类的非球状形状和 k means 中的随机初始化 我现在正在使用 DBS
datamining
clusteranalysis
DBSCAN
将树形图导出为 R 中的表格
我想将 hclust dendrogram 从 R 导出到数据表中 以便随后将其导入到另一个 自制 软件中 str unclass fit 提供了树状图的文本概述 但我正在寻找的实际上是一个数字表 我查看了 Bioconductor ctc
r
clusteranalysis
dendrogram
hclust
使用 scikit learn 对通过 networkx 生成的图进行谱聚类
我有一个 3000x50 特征向量矩阵 我使用以下方法获得了一个相似度矩阵sklearn metrics pairwise distances作为 相似度矩阵 现在我用了networkx使用上一步中生成的相似度矩阵创建一个图G nx fro
clusteranalysis
scikitlearn
partitioning
networkx
spectral
计算聚类的 F 度量
谁能帮我计算一下F measure的总和吗 我知道如何计算召回率和精度 但不知道对于给定的算法如何计算一个 F 测量值 举个例子 假设我的算法创建m集群 但我知道有n相同数据的聚类 由另一个基准算法创建 我找到了一份 pdf 但它没有用 因
clusteranalysis
datamining
precisionrecall
贪心聚类算法速度提升
我正在尝试在 python 中实现一个非常简单的贪婪聚类算法 但很难优化它的速度 该算法将采用距离矩阵 找到具有最多小于预定距离截止值的分量的列 并将行索引 具有小于截止值的分量 存储为簇的成员 簇的质心是列索引 然后 从距离矩阵中删除每个
python
performance
clusteranalysis
1
2
3
4
5
6
...8
»