在巨大的事件流中寻找差距？

2024-02-02

我的 PostgreSQL 数据库中有大约 100 万个事件，其格式如下：

id        |   stream_id     |  timestamp
----------+-----------------+-----------------
1         |   7             |  ....
2         |   8             |  ....

大约有 50,000 个独特的流。

我需要找到任意两个事件之间的时间超过特定时间段的所有事件。换句话说，我需要找到在特定时间段内没有事件的事件对。

例如：

a b c d   e     f              g         h   i  j k
| | | |   |     |              |         |   |  | | 

                \____2 mins____/

在这种情况下，我想找到 (f, g) 对，因为这些是紧邻间隙的事件。

我不在乎查询是否慢，即对于 100 万条记录，如果需要一个小时左右就可以了。然而，数据集将继续增长，所以希望如果它很慢，它也能正常扩展。

我也有 MongoDB 中的数据。

执行此查询的最佳方式是什么？

您可以使用lag() http://www.postgresql.org/docs/current/static/functions-window.html根据stream_id对分区进行窗口函数，stream_id按时间戳排序。这lag()函数使您可以访问分区中以前的行；如果没有滞后值，则它是前一行。因此，如果stream_id 上的分区按时间排序，则前一行是该stream_id 的前一个事件。

SELECT stream_id, lag(id) OVER pair AS start_id, id AS end_id,
       ("timestamp" - lag("timestamp") OVER pair) AS diff
FROM my_table
WHERE diff > interval '2 minutes'
WINDOW pair AS (PARTITION BY stream_id ORDER BY "timestamp");

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sql

MongoDB

Algorithm

postgresql

Bigdata

在巨大的事件流中寻找差距？的相关文章

从 mongodb 集合中查找前 20 个文档

我想在一个 Jframe 上显示集合中的前 20 条记录在另一个框架上显示接下来的 20 条记录我是 MongoDB 的新手请提出查询以查找前 20 个和后 20 个文档在 MongoDB shell 上您可以执行以下操作 db c
使用 FileTable 通过 SQL INSERT 创建子目录

之前我请求如何在一个目录中创建一个目录FileTable不使用文件 I O API https stackoverflow com q 10483906 175679 我现在想为刚刚创建的父目录创建一个子目录在插入期间如何分配我的父母
在 SQL 中如何获得整数的最大值？

我试图从 MySQL 数据库中找出整数有符号或无符号的最大值有没有办法从数据库本身提取这些信息是否有我可以使用的内置常量或函数标准 SQL 或 MySQL 特定的 At http dev mysql com doc refman
value >= all(select v2 ...) 产生与 value = (select max(v2) ...) 不同的结果

Here https stackoverflow com questions 17026651 query from union of joins 17027784 noredirect 1 comment24611997 17027784
融合元组以查找等价类

假设我们有一个包含 k 个元素的有限域 D d1 dk 我们认为 S 是 D n 的子集即一组形式的元组其中 ai 在 D 中我们希望使用 S 2 D n 的子集即一组形式的元组其中 Ai 是 D 的子集来紧凑地表示它
SQL Server - SQL 替换整个数据库中所有表中的所有列

这是一个很遥远的事情我猜这个问题没有简单的答案但是我继承了一个数据库其中填充了一些可怕的数据许多包含描述的行都有回车符这意味着当我们 BCP 输出数据时它会带有回车符我的问题有没有办法在 MS SQL Server 中对整
我们可以使用sql列出MS Access数据库中的所有表吗？

我们可以使用 sql 找到 ms access 中的所有表吗就像我们在 sql server 中所做的那样 select from sys tables 在sqlite中 SELECT FROM sqlite master where t
更高效的 LINQ 查询

有人可以帮我将此查询循环变成高效的 Linq 查询吗我将其加载到 TreeView 中因此必须附加每个项目包含也非常低效延迟加载项目也不起作用事实上这个查询访问数据库的次数比应有的要多 public IQueryable
Postgres 从 10 升级到 12：pg_upgrade 由于存在所需库而失败

usr pgsql 12 bin pg upgrade gt b usr pgsql 1 pgsql 10 pgsql 12 gt b usr pgsql 10 bin gt B usr pgsql 12 bin gt d var lib
将数据表传递到存储过程。有没有更好的办法？

数据表可以以某种方式传递到 SQL Server 2005 或 2008 中吗我知道标准方法似乎是将 XML 传递给 SP 并且可以通过某种方式轻松地将数据表转换为 XML 来实现这一点将 NET 对象传递到 SP 怎么样那可能吗我
使用 Mongo Native Query 解析 MongoDB DBRef 数组并处理已解析的文档

我的 MongoDB 集合由 2 个主要集合组成 1 Maps id ObjectId 542489232436657966204394 fileName importFile1 json territories ref territori
PostgreSQL WHERE 计数条件

我在 PostgreSQL 中有以下查询 SELECT COUNT a log id AS overall count FROM Log as a License as b WHERE a license id 7 AND a licens
MongoDB中批量FindAndModify的解决方案

我的用例如下我在 mongoDB 中有一组文档我必须发送这些文档进行分析文件格式如下 id ObjectId 517e769164702dacea7c40d8 日期 1359911127494 状态可用其他字段我有一个阅读器进程
LEFT JOIN 比 INNER JOIN 快得多

我有一张桌子 MainTable 有超过 600 000 条记录它通过第二个表连接到自身 JoinTable 在父子类型关系中 SELECT Child ID Parent ID FROM MainTable AS Child JOIN
机器人探索算法

我正在尝试为机器人设计一种算法试图找到位于未知位置的旗帜该旗帜位于一个包含障碍物的世界中机器人的任务是夺取旗帜并将其带到他的基地代表他的起始位置机器人在每一步只能看到有限的邻域他事先不知道世界是什么样子但他有无限的内存来存储已
使用 Javascript/Node.js 在代码内执行 mongoimport

node js javascript 中是否有任何库可供个人使用mongoimport在代码中据我了解 mongoimport 有点像 exe 您必须先执行它然后才能使用其文本输入环境是否可以在我的代码中执行 mongoimport
关于逻辑/算法的想法以及如何防止线程写入 Sql Server 中的竞争

我有以下逻辑 public void InQueueTable DataTable Table int incomingRows Table Rows Count if incomingRows gt RowsThreshold async
如何重置 SQL Server 中表的 IDENTITY 列？ [复制]

这个问题在这里已经有答案了我怎样才能重置我的IDENTITY我已经填充的表中的列我尝试过类似的方法但它不起作用 WITH TBL AS SELECT ROW NUMBER OVER ORDER BY profile id AS RN
parent_id 是外键（自引用）并且为 null？

浏览 Bill Karwin 的书 SQL Antipatterns 第 3 章 Naive Trees 邻接表父子关系有一个注释表的示例 CREATE TABLE Comments comment id SERIAL PRIMARY
如何统计订单总价？

我有这些表 Orders id status user id address id 1 await 1 1 products id name price quantity 1 test1 100 5 2 test2 50 5 order p

随机推荐

在 FB 上实时启动应用程序时收到“此应用程序处于开发模式”

我认为我一切都正确但我的应用程序尚未上线它说这个应用程序处于开发模式我猜这就是他们过去所说的沙盒模式但我不知道在哪里将其从开发模式中取消有人可以帮帮我吗提前致谢 onkar 发布的解决方案对我不起作用我认为自从 onkar
在 D3 力布局链接中间显示箭头

我正在使用 D3 绘制力导向图这与此示例非常相似 http bl ocks org mbostock 1153292 http bl ocks org mbostock 1153292 我试图将箭头放在链接的中间而不是末端玩attr r
Android Mediamuxer moovatom

我正在使用录制设备屏幕Mediacodec and Mediamuxerapi 一切都很好现在我想在录制时流式传输该文件但直到muxer停止并且 moovatom 被写入文件末尾所以我的问题是甚至可以使用Mediamuxer为目的如
为什么 malloc 中的内存不归零？

我在书中读过动态内存分配器维护进程的虚拟区域内存称为堆详细信息因系统而异但是不失一般性我们将假设堆是一个区域零需求内存在未初始化之后立即开始 bss 区域并向上增长向更高的地址所以我很困惑为什么堆中的内存没有初始化为零
Excel VBA 使用 Workbook.Open 并显示 Dir(Directory) 的结果

这看起来很简单我已经让它工作了多次但是在我的 Dir 调用迭代目录和打开当前文件之间有些东西不断中断这是相关代码 SourceLoc C ExcelWIP TestSource SourceCurrentFile Dir Sou
面向对象的实现策略

我目前正在 Squeak 环境中学习 Smalltalk 并且正在阅读 Squeak A Quick Trip To ObjectLand 我带着一些 Python 和 Java 的先验知识进入了面向对象范式书中第 36 页的这句话让我想
如何使用 FFMPEG 获取视频尺寸[重复]

这个问题在这里已经有答案了我的目标是将视频文件传递给 FFMPEG 并获取其尺寸作为输出我怎样才能实现这一目标谁能帮我提供示例代码吗 public void GetVideoInfo string input set up the p
通知所有组成员 GitLab 中失败的管道

目标是让每个人都能收到每个失败管道的通知由他们自行决定目前我们任何人都可以在这个项目分支上运行管道并且管道的创建者会收到一封电子邮件而其他人则不会我尝试将通知级别设置为watch and custom with failed p
Mockito - 如何模拟/验证接受新对象的方法调用？

我有一个想要测试的方法 method1 它根据提供的参数创建一个对象并调用另一个方法 method2 所以我模拟 method2 它接受一个对象 sampleObj public void method1 booleanParam if b
似乎“border-box”不适用于“a”标签的内联块

我正在尝试整合box sizing但似乎不起作用任何人都可以帮助我理解这里的问题现场演示 https jsfiddle net 3gwebtrain b45qjhh5 a display inline block background
如何在 Puppet 2.7 中将数组转换为逗号分隔的字符串

我正在使用 Puppet 2 7 我需要将数组转换为逗号分隔列表 hosts fqdn host1 host2 host3 我需要将其转换为所需的结果 host1 host2 host3 我猜 Puppet 3 2 提供了 lambda 表
在 VB.NET 中使用带有命名空间的 LINQ

我有这个 XML 文件
O(N) 排列识别

这个答案 https stackoverflow com a 36818947 2642059通过比较两个字符串的内容来确定它们是否是排列如果它们包含相同数量的每个字符那么它们显然是排列这是在O N time 但我不喜欢这个答案因为
像渐变一样将图像淡入透明

我希望将图像背景图像淡化为透明以便实际上可以看到其后面的内容由于透明度只能勉强看到显然我可以使用 PNG 图像来实现它但是每次我想要更改开始 gt 停止透明度点时我都需要要求我的图形设计师更改图像也许我想要更多的颜色或
shouldStartLoadWithRequest 永远不会被调用

我研究了又研究仍然不明白为什么 shouldStartLoadWithRequest 从未被调用我的页面加载良好并且调用了一些 UIWebview 委托协议方法请从下面的我的代码中找到相关片段在我的 m 中综合我的 webview
在 React 中更新数组

我来自 Angular 1 x 希望使用 React Redux 更新无序列表在 console log 中我看到数组正在更新但它似乎没有绑定到 DOM 我有以下内容在输入的 onKeyPress 上我有一个推送到消息数组的函数
在 jQuery 插件中调用其他插件

为了清理我的代码我想在我的实际 jQuery 插件中使用子插件但实际上没有发生任何事情提前谢谢作为一个简单的例子请看下面的代码 function fn funct function so far it seems to run t
快速旋转 UIImageView 动画

我正在尝试制作 180 度旋转的动画UIImageView在斯威夫特 UIView animateWithDuration 1 0 animations gt Void in self arrowImageView transform CG
为什么 PHPmailer 不发送附件？

我一直致力于使用 PHPmailer 创建文件上传表单以作为附件发送我终于可以发送电子邮件了但没有发送附件这是我的 HTML 表单
在巨大的事件流中寻找差距？

我的 PostgreSQL 数据库中有大约 100 万个事件其格式如下 id stream id timestamp 1 7 2 8 大约有 50 000 个独特的流我需要找到任意两个事件之间的时间超过特定时间段的所有事件换句话说我

在巨大的事件流中寻找差距？

在巨大的事件流中寻找差距？ 的相关文章

随机推荐

热门标签

在巨大的事件流中寻找差距？的相关文章