如何在 BigQuery 中通过每个用户的线性插值来填充不规则缺失的时间序列值？

2024-03-29

我有丢失的数据时间序列价值观不规律对于每个用户，我想使用 BigQuery 标准 SQL 通过线性插值以一定的间隔对其进行转换。

+------+---------------------+-------+
| name |        time         | value |
+------+---------------------+-------+
| Jane | 2020-11-14 09:01:00 |     3 |
| Jane | 2020-11-14 09:05:00 |     5 |
| Jane | 2020-11-14 09:07:00 |     1 |
| Jane | 2020-11-14 09:09:00 |     8 |
| Jane | 2020-11-14 09:10:00 |     4 |
| Kay  | 2020-11-14 09:01:00 |     7 |
| Kay  | 2020-11-14 09:04:00 |     1 |
| Kay  | 2020-11-14 09:05:00 |    10 |
| Kay  | 2020-11-14 09:09:00 |     6 |
| Kay  | 2020-11-14 09:10:00 |     7 |
+------+---------------------+-------+

我想将其转换如下：

+------+---------------------+-------+-----------------+
| name |        time         | value |                 |
+------+---------------------+-------+-----------------+
| Jane | 2020-11-14 09:01:00 | 3     |                 |
| Jane | 2020-11-14 09:02:00 | 3.5   | <= interpolaetd |
| Jane | 2020-11-14 09:03:00 | 4     | <= interpolaetd |
| Jane | 2020-11-14 09:04:00 | 4.5   | <= interpolaetd |
| Jane | 2020-11-14 09:05:00 | 5     |                 |
| Jane | 2020-11-14 09:06:00 | 3     | <= interpolaetd |
| Jane | 2020-11-14 09:07:00 | 1     |                 |
| Jane | 2020-11-14 09:08:00 | 4.5   | <= interpolaetd |
| Jane | 2020-11-14 09:09:00 | 8     |                 |
| Jane | 2020-11-14 09:10:00 | 4     |                 |
| Kay  | 2020-11-14 09:01:00 | 7     |                 |
| Kay  | 2020-11-14 09:02:00 | 5     | <= interpolaetd |
| Kay  | 2020-11-14 09:03:00 | 3     | <= interpolaetd |
| Kay  | 2020-11-14 09:04:00 | 1     |                 |
| Kay  | 2020-11-14 09:05:00 | 10    |                 |
| Kay  | 2020-11-14 09:06:00 | 9     | <= interpolaetd |
| Kay  | 2020-11-14 09:07:00 | 8     | <= interpolaetd |
| Kay  | 2020-11-14 09:08:00 | 7     | <= interpolaetd |
| Kay  | 2020-11-14 09:09:00 | 6     |                 |
| Kay  | 2020-11-14 09:10:00 | 7     |                 |
+------+---------------------+-------+-----------------+

我可以问你一些聪明的解决方案吗？

补充：这是一个应用问题这个计算器问题 https://stackoverflow.com/questions/64816885/how-to-fill-irregularly-missing-values-with-linear-interepolation-in-bigquery。它非常相似但不同之处在于该数据是时间序列数据，它的名称为每个用户.

谢谢。

以下是 BigQuery SQL

#standardSQL
select name, time,
    ifnull(value, start_value 
      + (end_value - start_value) / timestamp_diff(end_tick, start_tick, minute) * timestamp_diff(time, start_tick, minute)
    ) as value_interpolated
from (
    select name, time, value,
    first_value(tick ignore nulls ) over win1 as start_tick,
    first_value(value ignore nulls) over win1 as start_value,
    first_value(tick ignore nulls ) over win2 as end_tick,
    first_value(value ignore nulls) over win2 as end_value,
    from (
        select name, time, t.time as tick, value
        from (
            select name, generate_timestamp_array(min(time), max(time), interval 1 minute) times
            from `project.dataset.table`
            group by name
        )
        cross join unnest(times) time 
        left join `project.dataset.table` t 
        using(name, time)
    )
    window 
        win1 as (partition by name order by time desc rows between current row and unbounded following),
        win2 as (partition by name order by time rows between current row and unbounded following)
)

如果适用于您问题中的样本数据 - 输出是

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sql

googlebigquery

interpolation

missingdata

如何在 BigQuery 中通过每个用户的线性插值来填充不规则缺失的时间序列值？的相关文章

返回年份数组作为年份范围

我正在尝试查询一个包含以下内容的表character varying 年份列并将这些年份作为逗号分隔的年份范围字符串返回年份范围将由数组中存在的连续年份确定不连续的年份年份范围应以逗号分隔数据类型的原因是character var
交换 ms-sql 表

我想以尽可能最好的方式交换到桌子我有一个 IpToCountry 表并根据导入的外部 CSV 文件每周创建一个新表我发现进行切换的最快方法是执行以下操作 sp rename IpToCountry IpToCountryOld go
ORACLE：未找到数据——但数据存在

调试包过程当实际上有数据时却找不到数据仅测试 SELECT SELECT trim trailing from GL SECURITY as DUMMY FROM b2k user b2k WHERE sms username FUCH
在SQL中，如何通过查找与某一列相等的所有行来更新表的每一行，然后将另一列设置为彼此相等

所以基本上这就是伪代码但我不知道如何在 SQL 中执行此操作请帮忙 for each row in table1 loop through each row in table 2 if table1 s row column 1 tab
如何将列中的天数添加到 DB2 中的当前日期？

我正在编写此 SQL 来动态计算一定的天数如下所示但我不知道如何让它工作因为我不断收到错误 select Current Date Dynamic numbr of days calculation here from TableNa
获取一组记录之间的时间差

我有一个具有以下结构的表 ID ActivityTime Status 19 2013 08 23 14 52 1 19 2013 08 23 14 50 1 19 2013 08 23 14 45 2 19 2013 08 23 14 3
无重复组合的交叉连接

我知道这个问题与这个问题非常相似对称交叉连接 https stackoverflow com questions 12490244 symmetric cross join还有这个 sql 中交叉连接的组合不是排列 https stac
MySQL 跨表计数(*) 查询帮助

SELECT name COUNT AS count FROM t1 t2 WHERE t2 id t1 id GROUP BY t2 id 我想从 t1 获取名称以及 t2 中 id 与 t1 相同的行数到目前为止我已经得到了上面的内容
JDBC 时间戳和日期 GMT 问题

我有一个 JDBC 日期列如果我使用 getDate 则会得到 date 仅部分2009 年 10 月 2 日但如果我使用 getTimestamp 我会得到完整的 date 2009 年 10 月 2 日 13 56 78 890 这正
如何在Oracle中从表中选择列，*？

我正在创建很多脚本有时为了检查表是否根据我的需要进行更新我会即时编写几个 SELECT 语句在 SQL SERVER 中你可以这样写 SELECT Column1 FROM MY TABLE 出于可见性原因这很有用但是这似乎在 O
如何在事务中使用链接服务器插入远程表？

我的链接服务器设置正确我能够执行以下查询插入远程服务器表 SELECT FROM 本地服务器表然而当我做同样的事情时交易内开始传输插入远程服务器表 SELECT FROM 本地服务器表提交交易我收到类似的错误用于
每行中非空列的计数

我有一个包含 4 列的表在第 5 列中我想存储前 4 列中有多少个非空列的计数例如其中 X 是任意值 Column1 Column2 Column3 Column4 Count X X NULL X 3 NULL NULL X X 2
如何根据条件删除结果以计算平均值

我有下面的架构对其的快速解释是鲍勃评分为 5 5 詹姆斯评分 1 5 梅西百货评分高达 5 5 逻辑如果我是 A 请查找我屏蔽的所有人查阅所有电影评论任何留下电影评论且 personA 已屏蔽的人请将其从计算中删除计算电影的平
如何在 SQL Server 中保持数据行内

我正在尝试找出如何检测数据是否在VARCHAR n SQL Server 2008 中的列存储在行内或行外有谁知道如何做到这一点另外如果我们需要数据有没有办法将数据保持在行中要查看某个值是行内还是行外您可以使用DBCC PAGE
SQL Server中的列级与表级约束？

A 列级 GO CREATE TABLE Products ProductID INT CONSTRAINT pk products pid PRIMARY KEY ProductName VARCHAR 25 GO b 表层 CREATE
对于返回超过1个值的SQL select，当Id为GUID时它们如何排序？

我想知道 SQL Server 如何对查询返回的数据进行排序并且各个表的 Id 列都是 uniqueidentifier 类型我在创建所有 GUID 时使用 NHibernate GuidComb 并执行以下操作 Sheet sheet
SQL Server 批量插入 - “批量加载数据转换错误”

bulk insert dbo A FROM d AData csv WITH FIELDTERMINATOR ROWTERMINATOR n 将批量数据插入数据库时在检查可疑数据后我遇到了无法解释的错误消息 4867 16 级状态
BigQuery - 预定查询更新通知电子邮件

有没有办法将计划查询通知电子邮件更新为自定义内容默认情况下它是创建者的电子邮件但是这通常是没有真正电子邮件收件人的服务帐户例如通过 terraform 配置我们将拥有一个服务帐户我们希望将电子邮件通知目标从 SA 更新为支持
Magento 设置脚本中的 ALTER TABLE 不使用 SQL

乔纳森戴 https stackoverflow com users 336905 jonathan day says 更新不应采用以下形式 SQL命令我没遇到过任何 DDL 或 DML 语句不能通过 Magento 的配置执行结
RANK() OVER PARTITION 并重置 RANK

如何获得在分区更改时重新启动的 RANK 我有这张表 ID Date Value 1 2015 01 01 1 2 2015 01 02 1

随机推荐

spring-boot-devtools 重新加载多模块 Maven 项目更改

重新加载多模块maven项目更改 Setting 想象一个多模块 Maven 项目项目结构是 pom xml parentpom pom xml submodule 1 pom xml submodule 2 pom xml submod
如何为材质按钮设置渐变背景？

我目前正在使用此代码但背景没有改变它仍然显示强调色作为背景
WebStorm 可以设置自动换行吗？我需要默认设置所有文件都应该自动换行

有什么方法可以为所有新现有文件设置自动换行吗我需要默认将所有文件设置为自动换行如记事本提前致谢设置首选项编辑一般在编辑器中使用软包装此设置影响所有文件您可以通过以下方式禁用或启用每个文件的此选项直到其关闭查看活跃
MVC5 上的 ReactJS.Net 无法解决依赖关系

我正在尝试设置一个 ASP Net MV5 应用程序来使用ReactJS Net http reactjs net 包括服务器端渲染和捆绑不幸的是它因以下异常而失败 React dll 中发生 React TinyIoC TinyIoC
通过另一个对象数组过滤对象数组

我想通过另一个对象数组过滤对象数组我有 2 个这样的对象数组 const array id 1 name a1 sub id 6 name a1 sub id 2 name a2 sub null id 3 name a3 sub id
传单自定义图标在缩放时调整大小。性能图标与 divicon

我试图在放大传单时调整自定义图标的大小我为此想出了两种解决方案一个使用L Icon标签另一个使用L divIcon 在这两个示例中为了便于阅读我仅设置了 1 个标记和组 Method 1 using L Icon 用标记进行分组
无法使用 jQuery.load 将外部页面加载到我页面的 div 中

我无法将外部 html 页面加载到我页面的 div 中我的 Jquery 代码是 document ready function var url http www google com get url function response
Pandas：根据更复杂的标准选择和修改数据框

我在看this https stackoverflow com questions 38802675 create bool mask from filter results in pandas and this https stackov
如何更改默认的 Google Cloud 用户名？

我是 Google Cloud Platform GCP 的新手我尝试创建一个新的虚拟机但默认用户名很烦人比如说我的 Gmail 是电子邮件受保护 cdn cgi l email protection 用户名将为 example
Recyclerview水平扑克牌效果

我正在尝试制作简单的纸牌游戏我需要展示桌子上的一副纸牌水平地用户可以通过单击选择任意数量的卡片理想情况下当使用单击任何卡时卡应比其他卡稍微抬高一点另外卡片不是完全可见的它们是部分可见的例如this https d2gg9evh
PHP 计数数组中的值

我有这样的代码 span Mali Oglasi span p p 如何计算数组内的特定值例如我想计算有多少结果i
递归赋值

def swap aList if len aList 0 return 0 elif len aList 1 print aList 0 return aList 0 return aList 0 swap aList 2 aList a
创建并使用 Babel 插件而不将其设为 npm 模块

在我的项目中我使用带有 require 钩子的 Babel 6 我需要加载我编写的自定义 babel 插件但是我真的需要先使用 npm 发布我的插件然后将插件名称包含在我的主项目中吗 babelrc 有没有办法直接加载插件代码换句话
将SQL Server 2005查询结果导出到SQL INSERT语句？

SQL Server 2005 中有没有一种简单的方法可以将查询结果导出到 SQL INSERT 语句我正在考虑如何使用数据库资源管理器将现有存储过程编写到新查询窗口中我们希望将一些数据从开发数据库转移到生产数据库我了解链接服务器但
Maven 构建错误 - 无法执行目标 org.apache.maven.plugins:maven- assembly-plugin:2.5.5

我正在尝试使用 Maven 构建项目不幸的是我没有使用maven的经验所以我有点无助这很可能是由 riak 子模块引起的这是带有代码的 github 存储库 YCSB https github com LordFazole YCSB
如何将网格设置为 Items 控件的模板？

我正在尝试创建一个ItemsControl使用网格作为其ItemsPanel以这样的方式它有两列其中第一列宽度是该列中最宽项目的宽度并且具有显示所有项目所需的尽可能多的行基本上我想要以下内容但不知何故在一个ItemsContro
使用 Rails 更新附加到 Postgresql 中的文本列

预先感谢您对此提供的任何帮助我有一个 Rails 模型其中包含 postgresql 文本列我想追加即mycolumn mycolumn newdata 数据添加到现有列我想要生成的 sql 如下所示 update MyOjbs
Akka 2：如何暂停消息处理？

在我使用 Akka 掌握 Actor 模型的过程中出现了很多问题这是另一张假设我们有一个 Actor 由于某些业务逻辑或可用资源它必须在给定时间内停止处理消息可能发生这种情况的情况可能是节流可能有一个发送电子邮件的 Actor
gcc 可以配置为不打印警告/错误消息中的完整路径吗？

当 gcc 打印出警告或错误时它会显示包含错误的文件的完整路径是否有一个标志可以将输出缩短为仅文件名这仅取决于您如何调用 gcc tmp c gcc Wall bad c bad c 1 warning return type def
如何在 BigQuery 中通过每个用户的线性插值来填充不规则缺失的时间序列值？

我有丢失的数据时间序列价值观不规律对于每个用户我想使用 BigQuery 标准 SQL 通过线性插值以一定的间隔对其进行转换 name time value Jane 2020 11 14 09 01 00 3 Jane 2020 11

如何在 BigQuery 中通过每个用户的线性插值来填充不规则缺失的时间序列值？

如何在 BigQuery 中通过每个用户的线性插值来填充不规则缺失的时间序列值？ 的相关文章

随机推荐

热门标签

如何在 BigQuery 中通过每个用户的线性插值来填充不规则缺失的时间序列值？的相关文章