在查询结果sql中插入额外的行

2023-12-24

给定一个包含不规则时间戳条目的表，必须以固定的 5 分钟间隔插入“中断”（关联的数据可以/将为 NULL ）。

我正在考虑获取开始时间，创建一个具有窗口函数的子查询，并向开始时间添加 5 分钟间隔 - 但我只能想到使用 row_number 来增加值。

WITH data as(
select id, data,
cast(date_and_time as double) * 1000 as time_milliseconds
from t1), -- original data

start_times as(
select id, MIN(CAST(date_and_time as double) * 1000) as start_time
from t1
GROUP BY id
), -- first timestamp for each id

boundries as (
SELECT T1.id,(row_number() OVER (PARTITION BY T1.id ORDER BY T1.date_and_time)-1) *300000 + start_times.start_time
as boundry
from T1
INNER JOIN start_times ON start_times.id= T1.id
) -- increment the number of 5 min added on each row and later full join boundries table with original data

然而，这限制了原始数据表中 id 的行数，并且如果时间戳分散，行数无法覆盖需要添加的 5 分钟间隔量。

样本数据：

initial data:

 |-----------|------------------|------------------|
 |   id      |     value        |    timestamp     |
 |-----------|------------------|------------------|
 |     1     |    3             |    12:00:01.011  | 
 |-----------|------------------|------------------|
 |     1     |    4             |    12:03:30.041  |
 |-----------|------------------|------------------|
 |     1     |    5             |    12:12:20.231  |
 |-----------|------------------|------------------|
 |     1     |    3             |    15:00:00.312  |

data after my query:

 |-----------|------------------|------------------|
 |   id      |     value        | timestamp (UNIX) |
 |-----------|------------------|------------------|
 |     1     |    3             |    12:00:01      | 
 |-----------|------------------|------------------|
 |     1     |    4             |    12:03:30      |
 |-----------|------------------|------------------|
 |     1     |    NULL          |    12:05:01      |  <-- Data from "boundries"
 |-----------|------------------|------------------|
 |     1     |    NULL          |    12:10:01      |  <-- Data from "boundries"
 |-----------|------------------|------------------|
 |     1     |    5             |    12:12:20      |
 |-----------|------------------|------------------|
 |     1     |    NULL          |    12:15:01      |  <-- Data from "boundries"
 |-----------|------------------|------------------|
 |     1     |    NULL          |    12:20:01      |  <-- Data from "boundries"
 |-----------|------------------|------------------|  <-- Jumping directly to 15:00:00 (WRONG! :( need to insert more 5 min breaks here )
 |     1     |    3             |    15:00:00      |

我正在考虑在 HIVE 中创建一个临时表，并用代表从数据表的开始时间到结束时间的 5 分钟间隔的 x 行填充它，但我找不到任何方法来实现这一点。

有什么使用“for循环”的方法吗？任何建议，将不胜感激。

Thanks

您可以尝试计算当前时间戳与下一个时间戳之间的差异，除以 300 以获得范围数，生成一串长度为 num_ranges 的空格，分解以生成行。

Demo:

with your_table as (--initial data example
select stack (3,
1,3 ,'2020-01-01 12:00:01.011', 
1,4 ,'2020-01-01 12:03:30.041',
1,5 ,'2020-01-01 12:20:20.231' 
) as (id ,value ,ts )
)


select id ,value, ts, next_ts,
        diff_sec,num_intervals,
       from_unixtime(unix_timestamp(ts)+h.i*300) new_ts, coalesce(from_unixtime(unix_timestamp(ts)+h.i*300),ts) as calculated_timestamp
from
(
 select id ,value ,ts, next_ts, (unix_timestamp(next_ts)-unix_timestamp(ts))  diff_sec,  
 floor((unix_timestamp(next_ts)-unix_timestamp(ts))/300 --diff in seconds/5 min
                                         ) num_intervals
from
(  
select id ,value ,ts, lead(ts) over(order by ts) next_ts
  from your_table
) s
)s
  lateral view outer posexplode(split(space(cast(s.num_intervals as int)),' ')) h as i,x --this will generate rows

Result:

id  value   ts                      next_ts                 diff_sec    num_intervals   new_ts              calculated_timestamp
1   3       2020-01-01 12:00:01.011 2020-01-01 12:03:30.041 209          0              2020-01-01 12:00:01 2020-01-01 12:00:01
1   4       2020-01-01 12:03:30.041 2020-01-01 12:20:20.231 1010         3              2020-01-01 12:03:30 2020-01-01 12:03:30
1   4       2020-01-01 12:03:30.041 2020-01-01 12:20:20.231 1010         3              2020-01-01 12:08:30 2020-01-01 12:08:30
1   4       2020-01-01 12:03:30.041 2020-01-01 12:20:20.231 1010         3              2020-01-01 12:13:30 2020-01-01 12:13:30
1   4       2020-01-01 12:03:30.041 2020-01-01 12:20:20.231 1010         3              2020-01-01 12:18:30 2020-01-01 12:18:30
1   5       2020-01-01 12:20:20.231 \N                      \N           \N             \N                  2020-01-01 12:20:20.231

添加了额外的行。我保留了所有中间列以用于调试目的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sql

hive

timestamp

HiveQL

daterange

在查询结果sql中插入额外的行的相关文章

ORACLE 在立即执行中批处理 DDL 语句

我正在尝试在一个 Execute Immediate 语句中运行多个 ddl 语句我认为这会很简单但看来我错了想法是这样的 declare v cnt number begin select count into v cnt from
为什么我的查询在参数化后会中断？

我有 2 张桌子 Sales and Product Sales可以将产品存储为Idn or Name 传统设计和Type列指定实际type与之相关 Product等是连接的子集表into这个表来获取真实的数据在这个例子中 Produc
Postgresql 和 jsonb - 将键/值插入多级数组

非常类似于这个帖子 https stackoverflow com questions 58959678 postgresql add key to each objects of an jsonb array 但我很难适应他们的解决方案
分组依据检索 3 个值

我有以下查询 SELECT Cod MIN Id AS id Min MAX Id AS id Max retrieve value in the middle COUNT AS Tot FROM Table a NOLOCK GROUP
在旧版本的 MySQL (<5.5.0) 中模拟 TO_SECONDS()

出于性能和简单性的原因我想以秒的形式获取 MySQL 3 x 服务器中 DATETIME 列的内容或者实际上任何数字类型我只是想在使用 UNIX TIMESTAMP 时避免所有明显的时区问题 the我表中的日期确实来自不同的区域设置
EF4 和 SQL Server 2000

我使用 EF4 和 SQL Server 2005 开发了我的网站但当转移到临时站点时发现他们使用 SQL Server 2000 现在我收到此错误我认为该错误与 SQL Server 2000 有关 Incorrect syntax
MySQL 中有“connect by”替代方案吗？

如果我使用 Oracle 有connect by可用于创建分层查询的关键字目前我正在一个项目中使用MySQL 我想知道是否有替代方案connect by在 MySQL 中我尝试过谷歌但到目前为止还没有结果我想要实现的是通过一个查询从
Linq 选择与另一个表中的 ID 相等的项目

我不确定这怎么可能但我有两个表我想通过表 1 的值从表 2 中获取值表 1 有一个名为 rank 的外键它是int 表 2 有一个名为 name 的值它是string 现在表 1 的排名与表 2 的 ID 相关所以当我说 v
如何手动设置auto_increment的下一个值？

我手动向表中添加了一些行并且还手动设置了 ID 自动增量现在当我尝试通过我的应用程序将新行添加到数据库表中时我收到错误创建的 ID 值已存在如何手动设置下一个ID值例如在表中我必须有ID 那么如何告诉PostgreSQL 下
sql查询中case语句中的布尔值

我在选择查询中使用 case 语句类似这样 Select col1 col2 isActive case when col3 abc then 1 else 0 end col4 from
日常 MySQL（部分和过滤）复制的最佳实践？

我有一个相当大的数据库有超过 40 个表我只需要复制几个表 5 并且每个表也被过滤我正在寻找一些复制这些数据的最佳实践每天就足够了我可以只选择几个表并为每个表包含一些 WHERE 子句我正在考虑为每个表启动 mysqldump
通过字符串操作预防 PHP SQL 注入[重复]

这个问题在这里已经有答案了可能的重复 PHP 中防止 SQL 注入的最佳方法 https stackoverflow com questions 60174 best way to prevent sql injection in php
TSQL：无法对 COUNT(*) 执行聚合函数 AVG 来查找一天中最繁忙的时间

考虑一个保存日志数据的 SQL Server 表重要的部分是 CREATE TABLE dbo CustomerLog ID int IDENTITY 1 1 NOT NULL CustID int NOT NULL VisitDate
xQuery LIKE 运算符？

有没有办法以与 SQL 相同的方式使用 XQuery 执行 LIKE 操作我不想构造一些 startswith endswith 和 contains 表达式我想要实现的目标的示例 for x in user where x first
PostgreSQL & regexp_split_to_array + 取消嵌套

我有这样的绳子测试1 纽约 X 测试 2 芝加哥 Y 测试 3 宾夕法尼亚州哈里斯堡 Z 我需要的结果是 Column1 Column 2 Column3 Test 1 new york X Test 2 chicago Y Test 3
法语和西班牙语的特殊字符可以保存在 varchar 中吗？

法语和西班牙语中有普通英语中不使用的特殊字符重音元音等 varchar 是否支持这些字符或者我需要一个 nvarchar 吗注我愿意NOT希望讨论我是否应该使用 nvarchar 还是 varchar 您在谈论什么 SQL 实现我
在bigquery中比较两个表的有效方法

我有兴趣比较两个表是否包含相同的数据我可以这样做 standardSQL SELECT key1 key2 FROM SELECT table1 key1 table1 key2 table1 column1 table2 column1
过滤项目来源

通过此代码我设置了数据网格的 ItemsSource 不过我有更多的 wpf 控件来过滤数据网格例如从时间范围过滤数据网格我可以为此编写一个新查询但这似乎没有必要因为数据已经可用我只需要过滤它最好的方法是什么我能得到的任何
SQL 查询结果为字符串（或变量）

是否可以将SQL查询结果输出到一个字符串或变量中我的php和mysql不好假设我有数据库 agents 其中包含列 agent id agent fname agent lname agent dept 使用此查询 sql SELECT
Solr 增量导入不起作用

我使用的是solr 4 2 请注意完全导入有效但增量导入却无效增量导入不会给出任何错误但不会获取任何更改这是数据配置文件

随机推荐

根据条件过滤并收集对象

在java 8中根据一些过滤条件收集emp对象在主课中 List
使用 NLTK 查找不完整句子中的主语

我有一个产品列表我试图将其分类他们将用不完整的句子来描述例如固态硬盘外壳硬盘驱动器电缆 1TB硬盘 500GB 硬盘厂家翻新如何使用 python 和 NLP 获得诸如 Housing Cable Drive Drive 之类
如何在异步函数中使用“yield”？

我想使用生成器产量和异步函数我读这个话题 https stackoverflow com questions 231767 what does the yield keyword do in python 并编写了下一个代码 import
将 Django 模板继承与 ngroute 一起使用 - 如果我想覆盖 `
` 之外的块，`
` 会去哪里？

这是我的base html
如何清理sqlite数据库？

我想知道如何清理 sqlite 数据库我在命令提示符下尝试对整个数据库使用语法 MANUAL VACUUM 命令 sqlite3 database name VACUUM 但它给出的错误是 near database name synta
比 double 更精确的数字数据类型？

Java中是否有一种数据类型可以比十进制数更精确地存储十进制数double 是的使用java math BigDecimal http download oracle com javase 1 4 2 docs api java math
SQL 中 DECLARE 和 SET 的区别

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案使用 SQL 或更具体地说 MySQL 的 DECLARE 和 SET 有什么区别看起来两者都可以设置变量我读过 MySQL 文档但
如何仅授予某些用户对子文件夹的权限[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我在我的服务器上拥有 root 权限并且我想向其特定组和用户授予权限有一种情况有目录树 dir1 subdir1 subdir2 s
User.Identity.Name 返回用户名而不是名称

我想在 LoginPartial 当前我正在使用的导航栏中显示用户名而不是用户名User Identity GetUserName 对于 userName 但现在我想显示当前用户的名称 LoginPartial 由 Startup Auth
更改分组 UITableView 内单元格的角半径

经过几个小时的谷歌搜索后我想知道是否可以更改圆角半径grouped UITableView I tried hourTable layer cornerRadius 5 0 但似乎一切都没有改变确保将表格视图的子视图与您的代码一起剪辑
move_uploaded_file() 无法将文件从 tmp 移动到 dir

我一直在寻找解决方案但找不到答案我创建了一个图像上传表单它与 ajaxform 插件一起运行但它仍然没有上传到目录 error log 说 move uploaded file 无法将文件从 tmp 移动到 dir 然后在前端显示上
ICanHas.is - 可以在模板中放置 while 循环吗？

假设我有一个元素并且想在其中放入不定数量的项目基于用户的选择有没有办法创建允许某种 while 循环的 ICanHaz 模板例如 ul for i 0 i lt numOfLi i li stuff li ul icanhaz 小
使用控制器作为语法定义和访问 $rootScope

我在使用时遇到问题controller as当我需要定义 rootScope 变量值时该过程由 2 个主要阶段组成用户未登录因此当他处理登录表单时我将在 rootScope 内定义他的个人数据如姓名和 ID LoginContro
Java中如何调用另一个类中的方法？

目前我有两节课课堂班级和学校班级我想在 School 类中编写一个方法从课堂类中调用 public void setTeacherName String newTeacherName 课堂 java public class clas
如何在 google API v3 中搜索特定文件夹内的文件

由于我使用的是 google api v3 所以我必须使用 fileList 而不是使用父级和子级列表所以现在我想搜索特定文件夹内的文件列表所以有人可以建议我该怎么做这是我用来搜索文件的代码 private String search
如何将文件文档发送到打印机并进行打印？

这是基本前提我的用户单击一些小玩意然后一个 PDF 文件就会出现在他的桌面上有什么方法可以让我将此文件发送到打印机队列并将其打印到本地连接的打印机吗 string filePath filepathisalreadysethere S
glfwSetCursorPosCallback 在另一个类中运行

我真的被困住了我有 mainWindow 并在主游戏循环中执行以下操作 poll for input glfwPollEvents this gt controls gt handleInput window world gt getPl
致命错误：调用未定义的函数socket_create()

我的代码是这样的 if this gt master socket create AF INET SOCK STREAM SOL TCP lt 0 die socket create failed reason socket strerro
从 SwiftUI 列表访问底层 UITableView

Using a List视图有没有办法访问并因此修改底层UITableView对象而不重新实现整个List as a UIViewRepresentable 我尝试过初始化List在我自己的范围内UIViewRepresentable
在查询结果sql中插入额外的行

给定一个包含不规则时间戳条目的表必须以固定的 5 分钟间隔插入中断关联的数据可以将为 NULL 我正在考虑获取开始时间创建一个具有窗口函数的子查询并向开始时间添加 5 分钟间隔但我只能想到使用 row number 来增加值

在查询结果sql中插入额外的行

在查询结果sql中插入额外的行 的相关文章

随机推荐

热门标签

在查询结果sql中插入额外的行的相关文章