不同长度的时间序列数据的聚类

2024-04-22

我有不同系列长度的时间序列数据。我想根据 DTW 距离进行聚类，但找不到与之相关的 ant 库。sklearn给出直接错误，而 tslearn kmeans 给出错误答案。

我的问题是如果我用零填充它就可以解决，但我不确定这在聚类时填充时间序列数据是否正确。

欢迎提出有关时间序列数据的其他聚类技术的建议。

max_length = 0

for i in train_1:
    if(len(i)>max_length):
        max_length = len(i)
print(max_length)

train_1 = sequence.pad_sequences(train_1, maxlen=max_length)
km3 = TimeSeriesKMeans(n_clusters = 4, metric="dtw",verbose = False,random_state = 0).fit(train_1)

print(km3.labels_)

您可以尝试定制 k-means（聚类算法）或其他算法。源代码可以在 sklearn 库中轻松获得。填充确实不是一个很好的选择，因为它会改变问题本身。您还可以使用 tslearn 和 pyclustering（用于最佳集群）作为替代方案，但请记住使用 DTW 距离而不是欧几里德距离。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

TimeSeries

clusteranalysis

kmeans

不同长度的时间序列数据的聚类的相关文章

基于定义的时间间隔（bin）的时间序列平均值

这是我的数据集的示例我想每 10 秒根据时间即 ts 计算一次 bin 平均值您能否提供一些提示以便我可以继续就我而言我想平均每 10 秒的时间 ts 和 Var 比如我会得到Var和ts从0到10秒的平均值我将得到另一个 Va
MongoDB 作为时间序列数据库

我正在尝试使用 mongodb 作为时间序列数据库并且想知道是否有人可以建议如何最好地针对该场景进行设置时间序列数据与股票价格历史非常相似我收集了来自不同机器的各种传感器的数据有数十亿个时间戳的值我想问以下问题最好来自数据库而不
如何在 R 中创建具有特定 MA（或 q）项的 ARIMA 模型

我无法确定使用 arima stats 创建 ARMA 模型的特定方法该模型具有特定的 MA 项而这些项不仅仅由最大数指定我的意思是我需要指定一个 AR 1 MA 1 4 模型该模型应该产生截距 AR1 项 MA1 项和 MA4
pandas 六个月的日期范围

所以这是我的数据框 PatientNumber QT Answer Answerdate DiagnosisDate 1 1 transferring No 2017 03 03 2018 05 03 2 1 preparing food
不同长度的时间序列数据的聚类

我有不同系列长度的时间序列数据我想根据 DTW 距离进行聚类但找不到与之相关的 ant 库 sklearn给出直接错误而 tslearn kmeans 给出错误答案我的问题是如果我用零填充它就可以解决但我不确定这在聚类时填充时间序
使用 Python Pandas 使用每日数据计算月平均值

我有一个包含四列的文本文件年月日和雪深这是 1979 年至 2009 年 30 年期间的每日数据我想使用 pandas 计算 360 个 30 年 X 12 个月个人月平均值即隔离 1979 年 1 月 1979 年 2 月
贪心聚类算法速度提升

我正在尝试在 python 中实现一个非常简单的贪婪聚类算法但很难优化它的速度该算法将采用距离矩阵找到具有最多小于预定距离截止值的分量的列并将行索引具有小于截止值的分量存储为簇的成员簇的质心是列索引然后从距离矩阵中删除每个
计算聚类的 F 度量

谁能帮我计算一下F measure的总和吗我知道如何计算召回率和精度但不知道对于给定的算法如何计算一个 F 测量值举个例子假设我的算法创建m集群但我知道有n相同数据的聚类由另一个基准算法创建我找到了一份 pdf 但它没有用因
多周期持久化、向量化、时间序列python

我有一个包含每日值的 DataFrame 并且我正在使用各种方法来预测未来两周的值作为一个基础的天真的预测我只想简单地说今天的价值是未来两周的最佳预测例如的值01 Jan 2012 is 100 那么我想要预测02 Jan 201
分组时间序列（面板）数据的交叉验证

我使用面板数据随着时间的推移我观察许多单位例如人对于每个单元我都有相同固定时间间隔的记录当将数据分为训练集和测试集时我们需要确保这两个集是不相交的并且顺序的即训练集中的最新记录应该在测试集中最早的记录之前参见例如此博客文章
Apache Spark MLLib - 使用 IDF-TF 向量运行 KMeans - Java 堆空间

我正在尝试从大文本文档集合 TF IDF 向量在 MLLib 上运行 KMeans 文档通过 Lucene 英语分析器发送稀疏向量由 HashingTF transform 函数创建无论我使用的并行程度如何通过合并函数 KMea
从彩色背景中提取黑色对象

人眼很容易辨别black来自其他颜色但是计算机呢我在普通的A4纸上打印了一些色块由于组成彩色图像有青色品红色和黄色三种墨水所以我设置每个块的颜色C 20 C 30 C 40 C 50 以及其余两种颜色是 0 这是我的源图像的第一列
如何在data.table中编写累积计算

顺序累积计算我需要进行时间序列计算其中每行计算的值取决于上一行计算的结果我希望能够利用data table 实际问题是水文模型累积水平衡计算在每个时间步长增加降雨量并减去径流和蒸发作为当前水量的函数该数据集包括不同的流域和场景
将毫秒时间戳解析为 R 中的时间

我以前曾问过这个问题但我找不到确切的答案如果我有一个代表自午夜以来的毫秒数的数字例如 34200577 我如何将其转换为 R 时间在午夜构造一个基线时间添加给定的毫秒一旦转换为秒并解释为时间 R gt as POSIXct as
Java机器学习库可以商用吗？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有谁知道我可以将其用于商业产品的优秀 Java 机器学习库吗不幸的是 Weka 和 Rapidmin
在两列上使用 Rollapply

我正在尝试做类似我要求的事情here https stackoverflow com questions 4472691 calculate returns over period of time不幸的是我无法解决这个问题这是我的数据框
如何设置K-means openCV c++的初始中心

我正在尝试使用 OpenCv 和 Kmeans 对图像进行分割我刚刚实现的代码如下 include opencv2 objdetect objdetect hpp include opencv2 highgui highgui hpp i
Pandas 时间序列数据索引从字符串到浮点[重复]

这个问题在这里已经有答案了有人知道如何将字符串输出转换为浮点数吗我正在尝试创建单独的数据框 Month and day of the week 基于时间戳索引这df index strftime输出一个字符串但我需要一个float基
哪里可以找到可靠的 K-medoid（不是 k-means）开源软件/工具？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在学习 K medoids 算法所以如果我提出不恰当的问题我很抱歉据我所知 K medoid
计算熊猫数据帧几个月的总和

我有一个 pandas 数据框如下所示 ID Year R1 R1 f KAR1 20201001 1 5 KAR1 20201101 2 6 KAR1 20201201 3 7 KAR1 20210101 4 8 KAR1 202102

随机推荐

THREE.js 导入的模型不应用面部纹理

我正在尝试导入使用 THREEJS 导出器从搅拌机导出的模型到目前为止模型已加载并出现在我的场景中并且正确应用了材质汽车应为黄色玻璃应为透明但它并没有将我的纹理应用到以 tga 形式保存的汽车上如果我不将纹理包含在模型所在的服
为什么使用工厂而不是“新”？

我正在看书其中指出 EMF 编程模型强烈鼓励但不要求使用工厂来创建对象而不是简单地使用 new 运算符创建对象为什么鼓励使用工厂new 您的答案不必是特定于 EMF 的只要它与 Java 有关即可您可以阅读 Effective
ng-repeat 没有 HTML 元素（这次真的没有任何）

我想要得到类似的东西 Line 1 br Line 2 br Line 3 br Line 4 br Line 5 br 使用 ng repeat 各行之间不应有任何分隔符除了 br 这是一个硬编码的简单指令 br HTML p p ap
如何在 Webpack 中正确使用命名空间 Typescript

我正在使用 webpack 开发一个新项目这是我第一次尝试使用这个工具自从 1 年以来我一直使用 typescript 针对 angularJS 1 5 进行开发并且从未遇到过与命名空间相关的任何问题 src App Core Ht
在 Win 7 上安装 Python 2.7 32 位：没有注册表项？

我已从 python org 下载了 Python 2 7 2 Windows x86 32 位 MSI 并将其安装在 64 位 Windows 7 系统上一切正常至少命令行解释器启动并运行但安装过程不会创建任何PythonWindo
`fgetc()` 可能返回 `EOF` 的所有原因是什么？

当然fgetc 回报EOF when 文件结尾 or an 输入错误 occurs 这就是全部吗这是否意味着没有更多数据可用 FILE inf int ch while ch fgetc inf EOF if feof inf puts
Android中AIDL的实时示例和使用？

我想知道aidl 的实时示例及其使用我研究了有关此主题的android 开发人员博客我无法在实时世界中实现这一点谁能举个例子告诉我 AIDL用于以某种格式共享数据 primitive and parcelable 与其他应用程序现实
使用 Adobe Air 证书签署 Android Native apk

我需要帮助使用为 Adob e Air 生成的现有 p12 证书来签署 Android 本机应用程序几年前应用程序在 Adob e Air 中完成签名并发布到 Google Play 现在当从 Adob e Air 迁移到 Andr
通过 CSS 注入 HTML

我需要基本上设置content来自 CSS 的 HTML 内容我目前正在执行以下操作 myclass content img src 然而我看到的不是图像而是文字 img src hello png 如何使用 CSS 注入任意 HTM
在数据库中存储条件逻辑表达式/规则

如何使用 RDBMS 存储逻辑表达式我标记对象并希望能够基于这些标记构建事实陈述这些可能被视为虚拟标签 Tags new for sale used offer Rule second hand goods new or used an
限制 TinyMCE 编辑器中的键盘快捷键

试图找到在 TinyMCE 编辑器的 jQuery 版本中禁用单个键盘快捷键的位置目前允许的快捷方式列表是 ctrl z Undo ctrl y Redo ctrl b Bold ctrl i Italic ctrl u Underlin
如何将 Visual Studio 中的结构打包为包含 uint32_t 的 24 位？

我正在尝试将现有应用程序从 32 位 ARM 微控制器移植到桌面平台例如 Microsoft Windows GCC 在 ARM 上使用我能够使用 32 位 MinGW 编译器在 Windows 上成功编译该应用程序但是我使用 Mic
如何让内部控件不覆盖主控件的事件？

我有一个UserControl其中包含一些内部控件像这样的东西现在当我在我的项目中使用它时我想要every如果单击我的控件点会引发相同的单击事件就像其他控件一样但问题是我的处理程序在另一个项目中仅当我单击背景上的某个位置而
AWS：找不到 iam 的实例元数据

我正在尝试在我的 ec2 实例上设置 elasticsearch s3 快照它失败并出现以下错误 nested NotSerializableExceptionWrapper sdk client exception The reques
如何同时远程连接到多个 Glassfish 4+ 实例？

我正在寻找一种从基于 Swing 的独立客户端 JDK7 SE 同时连接到 Glassfish 4 JDK7 EE 的多个实例的方法我通过以下方式成功连接到单个实例这就是初始上下文的构造 private void connect Str
我可以检查安装的 Indy 版本吗？

我需要使用最新的 Indy 组件库版本我可以通过某些源代码命令或任何其他技巧来获取库版本以确保我使用正确的库我知道我正在使用indy 160 bpl 这是我的 Delphi XE2 将鼠标移动到组件栏上时所说的内容我从中获取的最新
Spring事务中是否需要异常处理？

我对事务的异常处理有疑问为了清楚地说明我的问题我想展示我的配置
fn 和 fn* 有什么区别？

在 Clojure 中 fn 和 fn 有什么区别当我在语法中引用使用宏创建的函数时我看到 fn 例如在 REPL 中 user gt inc fn p1 342 343 auto clojure core inc p1 342 3
JavaFX 滚动表更新性能随着时间的推移而降低

我有一个 TableView 显示最后 N 个项目顶部的新项目从底部删除项目等似乎发生的情况是 CPU 负载随着时间的推移而增加导致同一台计算机上的其他 X 应用程序变得缓慢平台详细信息 Redhat 6 7 32 位 Java
不同长度的时间序列数据的聚类

我有不同系列长度的时间序列数据我想根据 DTW 距离进行聚类但找不到与之相关的 ant 库 sklearn给出直接错误而 tslearn kmeans 给出错误答案我的问题是如果我用零填充它就可以解决但我不确定这在聚类时填充时间序

不同长度的时间序列数据的聚类

不同长度的时间序列数据的聚类 的相关文章

随机推荐

热门标签

不同长度的时间序列数据的聚类的相关文章