在Python中根据值的接近程度对值进行聚类(机器学习?)[重复]

2023-12-07

我有一个在一组对象上运行的算法。该算法产生一个分值,该分值指示集合中元素之间的差异。

排序后的输出是这样的:

[1,1,5,6,1,5,10,22,23,23,50,51,51,52,100,112,130,500,512,600,12000,12230]

如果您将这些值放在电子表格上,您会发现它们组成了组

[1,1,5,6,1,5] [10,22,23,23] [50,51,51,52] [100,112,130] [500,512,600] [12000,12230]

有没有办法以编程方式获取这些分组?

也许有一些使用机器学习库的聚类算法?还是我想太多了?

我看过 scikit 但他们的例子对于我的问题来说太先进了......


不要对一维数据使用聚类

聚类算法是为多变量数据设计的。当你有一维数据时,sort它,并寻找最大差距。这是微不足道的并且fast在 1d 中,在 2d 中不可能。如果您想要更高级的东西,请使用核密度估计 (KDE) 并寻找局部最小值来分割数据集。

这个问题有很多重复:

  • 一维数数组聚类
  • 对一维数据进行最佳聚类?
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在Python中根据值的接近程度对值进行聚类(机器学习?)[重复] 的相关文章

  • 错误:process_executor.py:702: ... 当一些作业被分配给执行器时,工作人员停止了。这可能是由于工作超时太短造成的

    根据主题中的错误 修复方法是什么 环境 Python 3 9 或 3 10 Windows 10 x64 使用时出现错误joblib https joblib readthedocs io en latest 对于并行处理 result c
  • python sys.path 故障排除

    python 文档位于http docs python org library sys html http docs python org library sys html比如说sys path is 从环境变量 PYTHONPATH 以及
  • 此 TypeError 消息中提到的“代码对象”是什么?

    在尝试使用Python时exec声明 我收到以下错误 TypeError exec arg 1 must be a string file or code object 我不想传递字符串或文件 但什么是代码对象 如何创建一个 创建代码对象的
  • 如何返回 cost, grad 作为 scipy 的 fmin_cg 函数的元组

    我怎样才能使 scipy 的fmin cg使用一个返回的函数cost and gradient作为元组 问题是有f对于成本和fprime对于梯度 我可能必须执行两次操作 非常昂贵 grad and cost被计算 此外 在它们之间共享变量可
  • 反编译Python 3.9.2的PYC文件[重复]

    这个问题在这里已经有答案了 目前 我有一个 3 9 2 版本的 python 的 PYC 文件 P S 这适用于所有 3 9 及更高版本 我正在尝试反编译 PYC 文件 但它显示错误 因为 uncompyle6 或者更确切地说 新版本 de
  • 按边距(“全部”)值列对 Pandas 数据透视表进行排序

    我试图根据 pandas 数据透视表中的行总和对最后一列 边距 aggrfunc 进行降序排序 我知道我在这里错过了一些简单的东西 但我无法弄清楚 数据框 数据透视表 WIDGETS DATE 2 1 16 2 2 16 2 3 16 Al
  • Mypy 无法从文字列表推断项目的类型

    我有一个变量x和一个文字列表 例如 0 1 2 我想转换x这些文字之一 如果x在列表中 我将其退回 否则我返回一个后备值 from typing import Literal Set Foo Literal 0 1 2 foos Set F
  • 使用 Django 将文件异步上传到 Amazon S3

    我使用此文件存储引擎在上传文件时将文件存储到 Amazon S3 http code welldev org django storages wiki Home http code welldev org django storages w
  • 创建上下文后将 jar 文件添加到 pyspark

    我正在笔记本上使用 pyspark 并且不处理 SparkSession 的创建 我需要加载一个包含一些我想在处理 rdd 时使用的函数的 jar 您可以使用 jars 轻松完成此操作 但在我的特定情况下我无法做到这一点 有没有办法访问sp
  • Python HMAC:类型错误:字符映射必须返回整数、None 或 unicode

    我在使用 HMAC 时遇到了一个小问题 运行这段代码时 signature hmac new key secret key msg string to sign digestmod sha1 我收到一个奇怪的错误 File usr loca
  • pandas 相当于 np.where

    np where具有向量化 if else 的语义 类似于 Apache Spark 的when otherwise数据帧方法 我知道我可以使用np where on pandas Series but pandas通常定义自己的 API
  • 如何查找或安装适用于 Python 的主题 tkinter ttk

    过去 3 个月我一直在制作一个机器人 仅用代码就可以完美运行 现在我的下一个目标是为它制作一个 GUI 但是我发现了一些障碍 主要的一个是能够看起来不像一个 30 年前的程序 我使用的是 Windows 7 我仅使用 Python 3 3
  • 在Raspberry pi上升级skimage版本

    我已经使用 Raspberry Pi 2 上的 synaptic 包管理器安装了 python 包 然而 skimage 模块版本 0 6 是 synaptic 中最新的可用版本 有人可以指导我如何将其升级到0 11 因为旧版本中缺少某些功
  • 如何指示 urwid 列表框的项目数多于当前显示的项目数?

    有没有办法向用户显示 urwid 列表框在显示部分上方 下方有其他项目 我正在考虑类似滚动条的东西 它可以显示条目的数量 或者列表框顶部 底部的单独栏 如果这个行为无法实现 有哪些方法可以实现这个通知 在我的研究过程中 我发现这个问题 ht
  • 无法通过 Python 子进程进行 SSH

    我需要通过堡垒 ssh 进入机器 因此 该命令相当长 ssh i
  • minizinc python 安装

    我通过 anaconda 提示符在 python 上安装了 minizinc 就像其他软件包一样 pip install minizinc 该软件包表示已成功安装 我可以导入该模块 但是 我正在遵循基本示例https minizinc py
  • 如何给URL添加变量?

    我正在尝试从网站收集数据 我有一个 Excel 文件 其中包含该网站的所有不同扩展名 F i www example com example2 我有一个脚本可以成功从网站中提取 HTML 但现在我想为所有扩展自动执行此操作 然而 当我说 s
  • Django 管理器链接

    我想知道是否有可能 如果可以的话 如何 将多个管理器链接在一起以生成受两个单独管理器影响的查询集 我将解释我正在研究的具体示例 我有多个抽象模型类 用于为其他模型提供小型的特定功能 其中两个模型是DeleteMixin 和GlobalMix
  • 将 Keras 集成到 SKLearn 管道?

    我有一个 sklearn 管道 对异构数据类型 布尔 分类 数字 文本 执行特征工程 并想尝试使用神经网络作为我的学习算法来拟合模型 我遇到了输入数据形状的一些问题 我想知道我想做的事情是否可能 或者我是否应该尝试不同的方法 我尝试了几种不
  • 如何(安全)将 Python 对象发送到我的 Flask API?

    我目前正在尝试构建一个 Flask Web API 它能够在 POST 请求中接收 python 对象 我使用 Python 3 7 1 创建请求 使用 Python 2 7 运行 API 该 API 设置为在我的本地计算机上运行 我试图发

随机推荐

  • 旋转轴刻度标签

    我不知道如何在 X 轴上旋转文本 它是一个时间戳 因此随着样本数量的增加 它们会越来越近 直到重叠 我想将文本旋转 90 度 这样当样本靠得更近时 它们就不会重叠 下面是我所拥有的 它工作正常 但我不知道如何旋转 X 轴文本 import
  • 计算每年两个日期之间的天数

    我有一个数据框 每行都有开始日期和结束日期 我想计算两个日期之间的天数并按年份分割 所以从这里开始 id lt c 1 2 3 start lt as Date c 01 01 2015 01 01 2016 07 01 2015 form
  • JWT 的安全性如何

    我知道这个问题不是什么新鲜事 可能已经在互联网上讨论过 我是新手 但经过一些研究 我同意它是安全的 因为匿名可以嗅探令牌但无法在其上附加任何内容 我计划将 JWT 存储在 HTML5Storage 中 并解码有效负载以获取一些不敏感信息 D
  • WCF IErrorHandler 扩展未返回指定的故障

    希望有一些 WCF 向导能够发现我的错误 我正在尝试通过 RESTful JSON WCF 服务上基于 IErrorHandler 的行为扩展来设置全局错误处理程序 该方法被修饰如下 OperationContract WebGet Uri
  • 用户脚本隐藏跨域 iframe 的子节点

    我想通过 Tampermonkey 用户脚本隐藏其中包含一些单词的注释 作为一个例子 我尝试应用一个脚本 UserScript name Hide CNN match http www cnn com require http ajax g
  • 我可以将 varbinary 的最大大小设置为 2 MB 吗?

    据我所知 您可以 手动 定义的最大值是8000 gt varbinary 8000 据我所知 这意味着8000 bytes gt 7 8125 KByte 是否可以将 max 设置为2 MB 类似的东西varbinary 2097152 或
  • 通过其内部字段获取枚举

    有带有内部字段的枚举 类似地图 现在我需要通过其内部字段获取枚举 写了这个 package test Test enum to test enum public enum TestEnum ONE 1 TWO 2 THREE 3 priva
  • node.js 相当于 python 的 if __name__ == '__main__' [重复]

    这个问题在这里已经有答案了 我想检查我的模块是否被包含或直接运行 我怎样才能在node js中做到这一点 Node js 文档描述另一种方法来做到这一点 这可能是首选方法 当文件直接从 Node 运行时 require main 将设置为其
  • 配置:错误:C编译器无法创建可执行文件-Buildozer kivy到android调试

    输入我的问题 他们可以跳过它 您好 我正在尝试编译 apk 应用程序 但由于缺少我的系统未带来的库和应用程序以及 buildozer 和 kivy 要求中未提及的库和应用程序 我总是遇到很多问题 在安装了很多库来解决以前的问题后 我陷入了这
  • 如何使用 WordPress 链接多个 CSS 文件

    我知道要链接您的 WordPress 主目录style css您使用的文件 然而 我有相当多的 CSS 文件需要链接到主 PHP 文件 例如滑块 图片框等 我不太确定我会怎么做 因为仅适用于名为的样式表styles css我的其他样式表都有
  • Java方法声明中参数的最大数量

    Java 中的方法可以拥有的最大参数数量是多少 为什么 我在 64 位 Windows 系统上使用 Java 1 8 StackOverflow 上所有关于此问题的答案都说技术限制是 255 个参数 但没有具体说明原因 准确地说 静态为 2
  • 使用字典将 alamofire 中的 JSON 数据解析为数组

    我正在尝试解析来自 alamorefire 的 JSON 数据 如下所示 import UIKit import Alamofire import SwiftyJSON class ViewController UIViewControll
  • Ruby 中的字符串和符号有什么区别?

    Ruby 中的字符串和符号有什么区别 什么时候应该使用其中一种 主要区别在于表示单个值的多个符号是相同的 而字符串则不然 例如 irb main 007 0 gt test object id gt 83618 irb main 008 0
  • @property 与 ARC 的定义:强还是保留?

    使用 Xcode 4 2 和 ARC 我注意到自动生成的代码NSManagedObject属性仍然是这样的 property nonatomic retain NSString someString 1 不应该retain现在被替换为str
  • Spring值注入无法从属性中获取值

    我有一堂这样的课 Component public class FaultsConfiguration private int interval Autowired public FaultsConfiguration Value faul
  • Raphael 路径调整大小并相对于容器移动

    我正在尝试缩放 移动使用 Raphael api 创建的 SVG 路径 我希望路径能够整齐地适合容器 无论容器有多大 我已经搜索了参考资料 网络 但我仍然在努力让它发挥作用 如果有人能告诉我为什么这不起作用 我会很高兴 这个小提琴向你展示了
  • 如何生成以文本作为 ytick 标签的绘图

    我刚刚开始了解 Python 库pandas and matplotlib 你能举例说明如何生成与此类似的图吗matplotlib 右侧的 y 轴列出了数据实例的名称 下面的 x 轴代表与每个实例相关的一些值 数据采用 csv 格式 类似于
  • 更改android中应用程序标题的字体

    我有一个字体 我想更改 android 中操作栏标题的字体 有没有办法设置这样的标题字体 this setTitle myTitle toUpperCase this setTypefaceofTitle tf 这不是复制问题 此链接上的那
  • 将 long 解析为负数

    code public class Main public static void main String a long t 24 1000 3600 System out println t 25 System out println 2
  • 在Python中根据值的接近程度对值进行聚类(机器学习?)[重复]

    这个问题在这里已经有答案了 我有一个在一组对象上运行的算法 该算法产生一个分值 该分值指示集合中元素之间的差异 排序后的输出是这样的 1 1 5 6 1 5 10 22 23 23 50 51 51 52 100 112 130 500 5