Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
在Python中根据值的接近程度对值进行聚类(机器学习?)[重复]
这个问题在这里已经有答案了 我有一个在一组对象上运行的算法 该算法产生一个分值 该分值指示集合中元素之间的差异 排序后的输出是这样的 1 1 5 6 1 5 10 22 23 23 50 51 51 52 100 112 130 500 5
python
machinelearning
clusteranalysis
datamining
K-Medoids / K-Means 算法。两个或多个簇代表之间距离相等的数据点
我一直在研究和学习基于分区的聚类算法 例如 K means 和 K Medoids 我了解到 与 K 均值相比 K 中心点对异常值的鲁棒性更强 然而 我很好奇如果在分配数据点期间 两个或多个簇代表在数据点上具有相同的距离 会发生什么 您将把
Algorithm
Distance
datamining
kmeans
对于数据密集型应用程序,Java+Redis 与普通 Java 的效率比较?
将 Redis 与 Java 结合使用来用 Java 开发数据密集型应用程序 例如数据挖掘 是否有帮助 对于大量数据的类似操作 与普通 Java 相比 它是否运行得更快或消耗更少的内存 编辑 我的问题主要是关于在单机上运行 例如 用于处理大
Java
Redis
datamining
如何使用python从公共谷歌表格中获取数据?
我正在尝试获取以下 google 工作表的不同工作表中存在的 COVID 19 数据 g sheet 可供公众使用 URL 仅返回第一个工作表 我想抓取所有工作表 任何人都可以提供帮助吗 这是谷歌表格链接 https docs google
python
webscraping
googlesheets
datamining
googlesheetsapi
字节 vs 字符 vs 单词 - n-gram 的粒度是什么?
至少可以考虑 3 种类型的 n gram 来表示文本文档 字节级 n 元语法 字符级 n 元语法 词级 n 元语法 我不清楚应该使用哪一个来完成给定的任务 聚类 分类等 我在某处读到 当文本包含拼写错误时 字符级 n gram 优于单词级
NLP
datamining
textmining
NGram
有哪些技术/工具可以发现文本块中的常见短语?
假设我有 100000 封电子邮件正文 其中 2000 封包含任意常见字符串 例如 the Quick Brown Fox Jumps Over the Lazy Dog 或 Lorem ipsum Dolor Sit Amet 我可以 应
NET
datamining
如何对 SQL 中存储的附近纬度和经度位置进行分组
我正在尝试分析英国自行车事故的数据 以找到统计黑点 这是另一个网站的数据示例 http www cycleinjury co uk map 我目前正在使用 SQLite 来存储大约 100k 的纬度 经度位置 我想将附近的位置分组在一起 这
sql
SQLite
machinelearning
clusteranalysis
datamining
Matlab 中的高效分类
我有一张尺寸为 RGB 的图像uint8 576 720 3 我想将每个像素分类为一组颜色 我已经使用rgb2lab从RGB空间到LAB空间 然后删除L层 所以现在是double 576 720 2 由AB组成 现在 我想将其分类为我在另一
performance
MATLAB
machinelearning
Classification
datamining
Weka GUI - 内存不足,无法加载?
我过去也曾加载过同样的 Weka 安装 我只是尝试加载 Weka GUI 双击图标 但出现以下错误 我该如何修复它 OutOfMemory Not enough memory Please load a smaller dataset or
machinelearning
datamining
Weka
数据挖掘学习(二)——数据探索与清洗
笔者是一个痴迷于挖掘数据中的价值的学习人 希望在平日的工作学习中 挖掘数据的价值 找寻数据的秘密 笔者认为 数据的价值不仅仅只体现在企业中 个人也可以体会到数据的魅力 用技术力量探索行为密码 让大数据助跑每一个人 欢迎直筒们关注我的公众号
数据挖掘
datamining
决策树的实现原理与matlab代码
很久不写博客了 感觉很长一段时间只是一味的看书 疏不知一味地看书 写代码会导致自己的思考以及总结能力变得衰弱 所以 我决定还是继续写博客 废话不多说了 今天想主要记录数据挖掘中的决策树 希望能够将自己的理解写得通俗易懂 决策树是一种对实例分
datamining
模型评估中测试集的选择方法
前言 对训练好的模型进行评估 目的是为了测试我们所训练的模型是否拥有好的泛化能力 为此 需使用一个 测试集 来测试学习器对新样本的判别能力 然后以测试集上的 测试误差 作为泛化误差的近似 通常我们假设测试样本也是从样本真实分布中独立同分布采
Bigdata
Evaluate
datamining
«
1
2
3