如何编写一个选择查询或服务器端函数来从许多数据点生成一个整洁的时间流图？

2024-04-06

注意：我正在使用图形数据库（具体来说是 OrientDB）。这让我可以自由地用 javascript 或 groovy 编写服务器端函数，而不是仅限于使用 SQL 来解决这个问题。*

注 2：由于这是一个图形数据库，因此下面的箭头只是描述数据流。我实际上并不需要在查询中返回箭头。箭头代表关系。*

我有以时间流方式表示的数据；即，EventC 在 EventB 之后发生，EventB 在 EventA 之后发生，等等。该数据来自多个源，因此它不是完全线性的。它需要聚集在一起，这就是我遇到的问题。

目前数据看起来像这样：

#     |  event   |  next
--------------------------
12:0  |  EventA  |  12:1
12:1  |  EventB  |  12:2
12:2  |  EventC  |  
12:3  |  EventA  |  12:4
12:4  |  EventD  |

其中“下一个”是时间流中下一个事件的 out() 边缘。在图表上，结果看起来像：

EventA-->EventB-->EventC
EventA-->EventD

由于这些数据需要聚合在一起，我需要合并重复的事件但保留它们的边缘。换句话说，我需要一个选择查询，该查询将导致：

        -->EventB-->EventC
EventA--|
        -->EventD

在此示例中，由于 Event 和 Event 均在 Event 之后发生（只是在不同时间），因此选择查询将显示 EventA 的两个分支，而不是两个单独的时间流。

EDIT #2

如果要将一组附加数据添加到上面的数据中，使用 EventB->EventE，生成的数据/图表将如下所示：

#     |  event   |  next
--------------------------
12:0  |  EventA  |  12:1
12:1  |  EventB  |  12:2
12:2  |  EventC  |  
12:3  |  EventA  |  12:4
12:4  |  EventD  |  
12:5  |  EventB  |  12:6
12:6  |  EventE  |  

EventA-->EventB-->EventC
EventA-->EventD
EventB-->EventE

我需要一个查询来生成一棵树，例如：

                    -->EventC
        -->EventB--|
        |           -->EventE
EventA--|
        -->EventD

编辑 #3 和 #4

这里显示的数据带有边缘，与上面的“下一”列相反。我还在此处添加了几个附加列，希望能够消除有关数据的任何混淆：

#     |  event   |    ip_address    |       timestamp     |   in   |  out  |
----------------------------------------------------------------------------
12:0  |  EventA  |  123.156.189.18  | 2015-04-17 12:48:01 |        |  13:0 |
12:1  |  EventB  |  123.156.189.18  | 2015-04-17 12:48:32 |  13:0  |  13:1 |
12:2  |  EventC  |  123.156.189.18  | 2015-04-17 12:48:49 |  13:1  |       |
12:3  |  EventA  |  103.145.187.22  | 2015-04-17 14:03:08 |        |  13:2 |
12:4  |  EventD  |  103.145.187.22  | 2015-04-17 14:05:23 |  13:2  |       |
12:5  |  EventB  |  96.109.199.184  | 2015-04-17 21:53:00 |        |  13:3 |
12:6  |  EventE  |  96.109.199.184  | 2015-04-17 21:53:07 |  13:3  |       |

像这样保存数据以保留每个单独的事件和会话流（由 IP 地址标记）。

TL;DR

有很多事件，其中一些是重复的，需要将它们全部组织成一个整洁的时间流程图。

天啊。

经过一个多星期的努力，我想我终于有了一个工作功能。这并未针对性能进行优化（噢，循环！），但在我可以提高性能的同时暂时完成了工作。生成的 OrientDB 服务器端函数（用 javascript 编写）：

功能：

// Clear previous runs
db.command("truncate class tmp_Then");
db.command("truncate class tmp_Events");

// Get all distinct events
var distinctEvents = db.query("select from Events group by event");

// Send 404 if null, otherwise proceed
if (distinctEvents == null) {
  response.send(404, "Events not found", "text/plain", "Error: events not found" );
} else {
  var edges = [];

  // Loop through all distinct events
  distinctEvents.forEach(function(distinctEvent) {
    var newEvent = [];
    var rid = distinctEvent.field("@rid");
    var eventType = distinctEvent.field("event");

    // The main query that finds all *direct* descendents of the distinct event
    var result = db.query("select from (traverse * from (select from Events where event = ?) where $depth <= 2) where @class = 'Events' and $depth > 1 and @rid in (select from Events group by event)", [eventType]);

    // Save the distinct event in a temp table to create temp edges
    db.command("create vertex tmp_Events set rid = ?, event = ?", [rid, event]);
      edges.push(result);
    });

  // The edges array defines which edges should exist for a given event
  edges.forEach(function(edge, index) {
    edge.forEach(function(e) {
      // Create the temp edge that corresponds to its distinct event
      db.command("create edge tmp_Then from (select from tmp_Events where rid = " + distinctEvents[index].field("@rid") + ") to (select from tmp_Events where rid = " + e.field("@rid") + ")");
    });
  });

  var result = db.query("select from tmp_Events");
  return result;
}

要点：

临时表似乎是必要的。我尝试在没有临时表（类）的情况下执行此操作，但我不确定是否可以完成。我需要模拟原始数据中不存在的边缘。
Traverse 对于编写主查询非常有帮助。遍历一个事件来找到它的直接、独特的后代是相当简单的。
能够用 Javascript 编写存储过程真是太棒了。这对于 SQL 来说将是一场噩梦。
omfg 循环。我计划对此进行优化并继续使其变得更好，希望其他人能够找到它的用处。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sql

graphdatabases

orientdb

如何编写一个选择查询或服务器端函数来从许多数据点生成一个整洁的时间流图？的相关文章

从表中选择行，其中另一个表中具有相同 id 的行在另一列中具有特定值

在 MySQL 中如果我们有两个表 comments key value 1 foo 2 bar 3 foobar 4 barfoo and meta comment key value 1 1 2 1 3 2 4 1 我想得到来自以下人
使用函数的 SQL 查询 - 如何获取列表的最大计数

如何查询 MAXIMUM COUNT 交易次数我的代码如下 SELECT customer id COUNT customer id FROM rental GROUP BY customer id HAVING MAX COUNT cu
SQLite SQL 查询出现问题[重复]

这个问题在这里已经有答案了我正在尝试在 SQLite 3 中运行以下查询 SELECT DISTANCE latitude longitude AS distance FROM country WHERE id NOT LIKE HAVI
就SQL注入而言，哪种sql查询更安全

我有两个 SQL 查询正在尝试更新sup and opp每次调用查询时值分别为 1 和 1 第一个查询 query update disc set sup sup opp opp where did did int sup getnoof
将用户定义的表类型从 VBA 传递到 SQL

我的任务是创建一个 Excel 电子表格作为 SQL 数据库的前端以及一些对数据执行复杂计算的 C 我的老板想要前端作为电子表格而计算对于 VBA 来说似乎太复杂了目前检索数据集的存储过程运行良好然后用户将在 Excel 中编辑
一张表中按最大日期过滤重复行的 SQL 查询

我有一个 SQL 数据库 persons 它具有基于 IDNum 列的重复条目我需要查询条目并仅根据最新创建日期显示行或重复条目这是查询 SELECT IDNum PersonPGUID CreatedDateTime FirstNam
使用来自另一个的 SELECT 更新表，但字段为 SUM(someField)

基本上我有这样的事情 UPDATE Table SET Table col1 other table col1 FROM Table INNER JOIN other table ON Table id other table id 问题是
使用 Proc sql 和 Teradata 在 SAS 中编写高效查询

编辑这是一组更完整的代码它准确地显示了下面的答案所发生的情况 libname output data files jeff let DateStart 01Jan2013 d let DateEnd 01Jun2013 d proc s
如何检查一个值是否已经存在以避免重复？

我有一个 URL 表但我不想要任何重复的 URL 如何使用 PHP MySQL 检查给定 URL 是否已在表中如果您不想重复可以执行以下操作添加唯一性约束 use REPLACE http dev mysql com doc ref
如何在审计触发器中使用system_user但仍使用连接池？

我想做以下两件事在我的数据库表上使用审计触发器来识别哪个用户更新了什么使用连接池来提高性能对于 1 我在数据库触发器中使用 system user 来识别进行更改的用户但这阻止我执行需要通用连接字符串的 2 有没有一种方法可以让我充
SQL Android 错误：没有这样的表

因此每次我在位于 AddContacts 类中的 EditText 字段中输入数据时我的对话框都会显示我已成功添加信息但在日志 cat 中却显示没有这样的表 contactsTable 我认为错误出在我的数据库类中的 onCreate
主键默认可以为NULL吗？为什么这样描述呢？

我有一张桌子当我describe这是 mysql gt DESC my table Field Type Null Key Default Extra contact id int 11 NO PRI NULL auto incremen
SQL Server 每年的第一个星期一

如何使用 T SQL 查找一年中的第一个星期一这是 ngruson 发布的链接中的示例 http sqlbump blogspot nl 2010 01 first monday of year html http sqlbump bl
如何授予 SQL Server 代理访问权限以便能够写入/修改系统文件？

我的工作有一个存储过程运行 BCP 来查询一些数据如果我单独运行 QUERYOUT 命令它就会起作用但是如果我尝试在作业中运行它它会创建文件但挂起并且数据永远不会放入文件中这会永远挂起所以我通常终止 BCP exe 我的
Android 中读取未提交的事务

我正在进行大量数据库操作这会向我的数据库添加大约 10 000 条记录由于这可能需要很长时间因此最好使用事务 db startTransaction do write operations db setTransactionSucce
从java运行sqlplus脚本的简单方法

我有包含 sqlplus 特定脚本的 sql 文件它包括或作为语句终止符执行存储过程的 EXEC 等我需要从 java jdbc 执行此脚本而不需要 sqlplus sql ant任务 maven sql插件无法处理不同的终止符
MySQL 5：我的 GROUP BY 字段的顺序重要吗？

Peeps 我的 MySQL 查询中有一些聚合计算字段我的 GROUP BY 子句是动态生成的具体取决于用户在 Web 表单中选择的选项很好奇 GROUP BY 子句中列出的字段顺序是否会对计算产生任何影响例如 SUM AVERA
MySQL Tinybit(1) 通过视图的列

我有一个连接 2 个表的视图其中一个表具有表示布尔值的tinyint 1 类型的列该表在连接时并不总是有条目因此当行丢失时视图需要采用 0 false 值我希望视图公开 TINYINT 1 类型且 NOT NULL 类型的列因为它
从 SQL 数据库获取日期时间

我的数据库表中有一个 DateTime 记录我编写一个查询从数据库中获取它 string command2 select Last Modified from Company Data where Company Name Descrip
火鸟删除速度很慢

我正在做这个简单的交易 DELETE FROM ominve01 WHERE CVE OBS IN SELECT CVE OBS FROM minve01 M WHERE M FECHA DOCU lt 31 12 2010 OR FECH

随机推荐

网格列不起作用？ [复制]

这个问题在这里已经有答案了我有这个标记
未捕获的类型错误：$(...).fullCalendar 不是函数(...)

document ready function page is now ready initialize the calendar calendar fullCalendar put your options and callbacks h
在 iOS 8 上自定义 UISegmentedControl

iOS 7 和 8 似乎使自定义 UISegmentedControl 的旧方法不再完全起作用我一直像过去一样设置分隔线图像和所有内容但似乎有一些以前的 iOS 版本中不存在的新状态因此出现了一些奇怪的视觉效果这是我正在使用的代码
具有自定义配置的 UICollectionView 列表 - 如何将单元格中的更改传递到视图控制器？

我已经实现了UICollectionView自定义列表UICollectionViewCell and UIContentConfiguration使用新的iOS 14API 我一直在关注这个教程 https swiftsenpai com
hashMap、List 和 Set 的数据结构

任何人都可以指导我深入了解所使用的数据结构以及它是如何在 Util Collection 页面的列表集合和映射中实现的在面试中大多数问题都是关于算法的但我从未在任何地方看到过实现细节有人可以分享一下信息吗要了解 Java 如何实
我可以从应用程序中抛出哪些内置 .NET 异常？

如果我需要从应用程序中引发异常我可以使用哪些内置 NET 异常类他们都是公平的游戏吗我什么时候应该自己导出 See 创建和抛出异常 http msdn microsoft com en us library ms173163 aspx
给定关键字在 Scala 3 或 dotty 中如何工作？

我正在浏览 Scala 3 文档他们介绍了given被认为是 Scala 2 替代品的关键字implicit 代码在这里 trait Ord T def compare x T y T Int def x T lt y T compare
面向对象的 Javascript 与纯 jQuery 和 .data 存储

我当前的编程风格是 OO javascript 使用 John Resig 的 Class extend 函数 http ejohn org blog simple javascript inheritance http ejohn org
Chrome 中的 css 反转过滤器

I have BODY webkit filter invert 100 moz filter invert 100 ms filter invert 100 o filter invert 100 filter invert 100 an
我可以在没有 Mac 的情况下获得“开发者证书”和“配置文件”吗？ [复制]

这个问题在这里已经有答案了可能的重复如何在没有 Apple 硬件的情况下将 Phonegap 应用程序部署到 iPhone iPhone Mac https stackoverflow com questions 6339945 how
拒绝访问 Kiosk 程序进程

我有一个信息亭应用程序并且必须禁用任务管理器总是要防止关闭程序由用户但有些用户需要任务管理器来关闭挂起的程序任何帮助都将被适当然而我确信Windows中有一个功能可以防止关闭程序的进程就像当一个人试图杀死一个程序时一样运行DLL过
我正在尝试使用 Provider 和 Firebase 流式传输模型列表，并将字段值设置为我的应用程序中的另一个模型

我正在使用 Flutter Provider 和 Firebase 构建一个生产力应用程序我目前有许多流我从 Firestore 中获取集合并将它们转换为模型列表我遇到一个问题当我尝试创建任务模型列表时我返回一个空列表在 Fir
R data.table：如何从 tibble 到 data.table 再到 tibble 返回？

我主要使用中的表格tibble格式来自tidyverse 但对于某些步骤我使用data table包裹我想看看转换的最佳方法是什么数据表回到tibble 我明白那个data table有一些巧妙的功能setDT https rdrr i
Systemd 服务启动失败

我试图让 NodeJS 服务器在启动时运行因此我创建了以下 systemd 单元文件 Unit Description TI SensorTag Communicator After network target Service Exec
单个servlet如何处理来自客户端的多个请求

单个 servlet 如何处理以用户请求形式出现的多个客户端请求基于单例设计模式我知道我们创建了单个 servlet 实例但是单个 servlet 如何处理数百万个请求也对其中涉及的线程感到困惑此外是否有任何浏览器规范或设置在这
使用 MultipleOutputs 写入 MapReduce 中的 HBase

我目前有一个 MapReduce 作业它使用 MultipleOutputs 将数据发送到多个 HDFS 位置完成后我使用 HBase 客户端调用在 MR 之外将一些相同的元素添加到一些 HBase 表中使用 TableOutp
是否有针对数据库结构更改的版本控制系统？

我经常遇到以下问题我对项目进行一些更改需要在数据库中添加新表或列我修改数据库并继续我的工作通常我记得写下更改以便可以在实时系统上复制它们然而我并不总是记得我改变了什么也不总是记得把它写下来因此我对实时系统进行了推送但
快速自定义警报（UIAlertView）

如何使用 Swift 创建自定义警报我尝试翻译 Objective c 的指南但加载了全屏布局为了简单起见我可以加载带有透明背景的新布局我尝试这样做 listaalertviewcontroller view background
JavaScript 确认对话框

我想在删除按钮上添加一个确认对话框询问用户是否可以删除所选项目如果不是则不会发生任何事情否则应执行 url 我知道如何通过一些 Javascript 代码来实现这一点但我正在寻找一种代码更少的解决方案我的意思是例如 a href
如何编写一个选择查询或服务器端函数来从许多数据点生成一个整洁的时间流图？

注意我正在使用图形数据库具体来说是 OrientDB 这让我可以自由地用 javascript 或 groovy 编写服务器端函数而不是仅限于使用 SQL 来解决这个问题注 2 由于这是一个图形数据库因此下面的箭头只是描述数据流

如何编写一个选择查询或服务器端函数来从许多数据点生成一个整洁的时间流图？

天啊。

功能：

要点：

如何编写一个选择查询或服务器端函数来从许多数据点生成一个整洁的时间流图？ 的相关文章

随机推荐

热门标签

如何编写一个选择查询或服务器端函数来从许多数据点生成一个整洁的时间流图？的相关文章