如何在 BigQuery 标准 SQL 中获取数组的切片？

2023-12-29

在 BigQuery 中，我有一个表，其中包含path像这样的列：

ID .     | Path
---------+----------------------------------------
1        | foo/bar/baz
2        | foo/bar/quux/blat

我希望能够在正斜杠上分割路径（/）并选择一个或多个路径部分，然后重新连接它们。

在 PostgreSQL 中，这很简单：

select array_to_string((regexp_split_to_array(path, '/'))[1:3], '/')

但BigQuery似乎没有任何类型的范围偏移或数组切片功能。

以下是 BigQuery 标准 SQL

#standardSQL
SELECT id, path,
  (
    SELECT STRING_AGG(part, '/' ORDER BY index) 
    FROM UNNEST(SPLIT(path, '/')) part WITH OFFSET index 
    WHERE index BETWEEN 1 AND 3
  ) adjusted_path
FROM `project.dataset.table`

您可以使用问题中的示例数据来测试、玩上面的内容，如下例所示

#standardSQL
WITH `project.dataset.table` AS (
  SELECT 1 id, 'foo/bar/baz/foo1/bar1/baz1/' path UNION ALL
  SELECT 2, 'foo/bar/quux/blat/foo2/bar2/quux2/blat2' 
)
SELECT id, path,
  (
    SELECT STRING_AGG(part, '/' ORDER BY index) 
    FROM UNNEST(SPLIT(path, '/')) part WITH OFFSET index 
    WHERE index BETWEEN 1 AND 3
  ) adjusted_path
FROM `project.dataset.table`

有结果

Row     id      path                                        adjusted_path    
1       1       foo/bar/baz/foo1/bar1/baz1/                 bar/baz/foo1     
2       2       foo/bar/quux/blat/foo2/bar2/quux2/blat2     bar/quux/blat

如果由于某种原因你想让你的查询“内联/相似”到你在 PostgreSQL 中使用的 (array_to_string((regexp_split_to_array(path, '/'))[1:3], '/')) - 你可以引入 SQL UDF（我们将其命名为ARRAY_SLICE）如下例所示

#standardSQL
CREATE temp  FUNCTION ARRAY_SLICE(arr ARRAY<STRING>, start INT64, finish INT64) 
RETURNS ARRAY<STRING> AS (
  ARRAY(
    SELECT part FROM UNNEST(arr) part WITH OFFSET index 
    WHERE index BETWEEN start AND finish ORDER BY index
  )
);
SELECT id, path, 
  ARRAY_TO_STRING(ARRAY_SLICE(SPLIT(path, '/'), 1, 3), '/') adjusted_path
FROM `project.dataset.table`

显然，如果应用到相同的样本数据 - 你会得到相同的结果

#standardSQL
CREATE temp  FUNCTION ARRAY_SLICE(arr ARRAY<STRING>, start INT64, finish INT64) 
RETURNS ARRAY<STRING> AS (
  ARRAY(
    SELECT part FROM UNNEST(arr) part WITH OFFSET index 
    WHERE index BETWEEN start AND finish ORDER BY index
  )
);
WITH `project.dataset.table` AS (
  SELECT 1 id, 'foo/bar/baz/foo1/bar1/baz1/' path UNION ALL
  SELECT 2, 'foo/bar/quux/blat/foo2/bar2/quux2/blat2' 
)
SELECT id, path, 
  ARRAY_TO_STRING(ARRAY_SLICE(SPLIT(path, '/'), 1, 3), '/') adjusted_path
FROM `project.dataset.table`   

Row     id      path                                        adjusted_path    
1       1       foo/bar/baz/foo1/bar1/baz1/                 bar/baz/foo1     
2       2       foo/bar/quux/blat/foo2/bar2/quux2/blat2     bar/quux/blat

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

googlebigquery

如何在 BigQuery 标准 SQL 中获取数组的切片？的相关文章

以有效的方式从 BigQuery 读取到 Spark 中？

使用时BigQuery 连接器 https cloud google com hadoop examples bigquery connector spark example要从 BigQuery 读取数据我发现它首先将所有数据复制到 G
Google BigQuery 另存为表

我用 Google BigQuery 运行了这个查询 SELECT repo id count as count FROM TABLE DATE RANGE githubarchive day events TIMESTAMP 2015 0
导出BQ表时是否可以指定CSV引号字符？

我使用以下命令导出表bq extract destination format CSV compression GZIP noprint header table table
将大型 CSV 加载到 Google BigQuery 时出错

将大型 CSV 加载到 bigquery 时出现错误我在网上阅读的所有地方都发现压缩文件有 5GB 大小限制但 CSV 没有限制加载操作中的 BigQuery 错误处理作业 bqjob r3016bbfad3037f 0000015
Bigquery 取消或停止尚未启动的批量查询作业 (Status.State = "PENDING")

如果由于某种原因想要停止取消尚未启动的批量查询作业 Status State PENDING 是否可以这样做使用的库 net Google Apis Bigquery v2 1 5 0 122 beta BigQuery 现在支持取消
Bigquery dbt_external_tables 外部数据配置

使用 dbt external tables 包时我需要一些帮助我意识到在 GCS 中的 csv 中有些行似乎有换行符这在尝试查询由宏创建的表时会导致一些问题有时手动配置外部表时 BigQuery UI 有两个选项允许锯齿行
如何在 BigQuery 中将列数据拆分为每 6 个字符并形成行

我需要将列数据拆分为每 6 个字符 Input col1 col2 d1 X11 F11 1000KG123456 d2 X22 F22 3500Kabcdefgh Expecting col1 col2 d1 X11 d1 F11 d1
Firebase 中的每用户会话分布表

这是第二篇文章我的后续文章第一篇文章 https stackoverflow com questions 48670590 session duration distribution table in firebase 查看 Fireba
如何使用 python 将字典写入 Dataflow 中的 Bigquery

我正在尝试从 GCP 存储中读取 csv 将其转换为字典然后写入 Bigquery 表如下所示 p ReadFromText gs bucket file csv beam ParDo BuildAdsRecordFn WriteToB
Google BigQuery Python 客户端使用错误的凭据

当我尝试在 BigQuery 中查询表时收到未授权错误我已经设置 os environ GOOGLE APPLICATION CREDENTIALS
从字符串到日期的日期格式

我正在使用上传的 csv 进行日期格式化其中日期是具有以下格式的字符串 10 30 2021 8 41 PM 我试图在谷歌大查询中将其更改为 mm dd yyyy 但不断收到错误消息提示无效日期或无效日期时间我尝试过使用子字符串
Firebase 导出到 BigQuery：保留群组查询

Firebase 通过 Firebase 远程配置提供拆分测试功能但缺乏使用用户属性实际上具有任何属性过滤群组部分中的保留的能力为了寻求此问题的解决方案我正在寻找 BigQuery 因为 Firebase Analytics 提供
第一天安装者的原始 BigQuery 日志数据

我对 StandardSQL 相当陌生想要导出在给定日期 2017 年 6 月 1 日安装的用户的原始 BigQuery 日志数据以及安装日期 D0 D20 当天和之后前 3 周的会话数据 StandardSQL SELECT use
使用 #standardSQL 在 BigQuery 上运行异步 JS 函数

既然 BigQuery 在 standardSQL 上支持异步我如何转换此 legacySQL 函数以在 standardSQL 上运行 legacySQL SELECT SUM s FROM js SELECT FLOOR RAND 1
如何合并两个 id 列，识别哪些行属于同一组相关 ID

我有 2 个独立创建收集的 ID 列我试图通过根据两个 ID 列之一确定哪些行属于同一相关 id 组的一部分从而将这两个 ID 列合并为一个我会根据一些规则考虑行的相关性 1 如果一个LOAN在多行中具有相同的值则它们属于同一组
是否可以统计 JSON 列中每个键出现的次数？

我有一个 BigQuery 表其中有一列其中包含 JSON 我想输出每个键在列中出现的次数然后按计数降序排序与所有键关联的值是1 每个对象都有已知有限数量的键但我宁愿不依赖它以防最大的对象发生变化总体而言键的数量是已知有
BigQuery 未显示链接的 Firebase Analytics 事件日志的任何数据集

我将我的帐户链接到 Big Query 但 Firebase Analytics 事件不会自动加载到 BigQuery 中显示未找到数据集警告我的工作进度附在下面请查收 I have getting firebase Analyt
使用 TABLE_DATE_RANGE 时如何获取表名称

我想使用 TABLE DATE RANGE 获取每日统计信息如下所示 Select count tableName FROM TABLE DATE RANGE appengine logs appengine googleapis com
谷歌的Dremel是什么？它与 MapReduce 有什么不同？

谷歌的 Dremel 是此处描述 http research google com pubs pub36632 html Dremel 和 Mapreduce 有什么区别 Dremel http research google com pu
Big Query - 将数组/json 对象转置为列

这个问题是这两个问题的延续 Bigquery 将数组转置为列 https stackoverflow com q 64346504 7463780 大查询将特定字段转置为列 https stackoverflow com q 643983

随机推荐

Kafka Confluence HTTP Sink Connector 的开源替代品 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我想将数据从 Kafka 主题推送到 REST 端点非企业版且未使用融合的 kafka 托管服务我
在 Inno Setup 中使用 HTTP 请求获取 www/web 内容

有人可以告诉我如何在 Inno Setup Script 中获取 Pascal 代码中的 www 内容吗 Regards Tomasz Use WinHttpRequest class https learn microsoft com e
logback.xml 中有没有办法通过 classpath: 指定文件日志目的地，而不需要绝对路径？

我在 logback xml 配置文件中添加了这个附加程序
Android中实现双击按钮

如何在 Android 中实现双击按钮我应该使用 OnDoubleTapListener 吗 int i 0 btn setOnClickListener new OnClickListener Override public void
SwiftMailer 无法与主机 smtp.mailgun.org 建立连接 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 If i use transport Swift SmtpTransport newInstance localhost 25 然后就可以
带 --jars 的 Spark-Submit YARN-CLASS 不起作用？

我正在尝试通过以下命令向 CDH 纱线集群提交 Spark 作业我尝试了几种组合但都不起作用我现在所有的 poi jar 都位于我的本地 root 以及 HDFS user root lib 中因此我尝试了以下操作 spark su
用于替换实时站点上的 JavaScript 文件以进行测试的浏览器扩展

我正在寻找一个浏览器扩展 Firefox Chrome 允许替换实时网站上的 Javascript 文件以进行一些测试黑客攻击基本上它应该采用一个 URL 并加载另一个 URL 本地或 HTTP 开发服务器上任何想法 Try htt
Android使用动画增长LinearLayout

我正在尝试使用动画使布局出现在屏幕上这个想法是布局将从 0 高度开始并增长到 100 我在这方面确实遇到了麻烦需要一些帮助由于某种原因没有执行动画这是我的动画 XML 文件
对于 Backbone 的深度数据结构有什么建议吗？

我对 Backbone 感到很头疼我有一个指定记录的集合其中有子记录例如外科医生有预定的手术手术有设备某些设备有消耗品需求气体液体等如果我有一个 Backbone 集合surgeons 那么每个外科医生都有一个模型但他的
如何将数字格式化为 xxx-xx-xxxx？

我正在从存储过程中查询社会安全号码数据我想在存储过程中将其格式化为社会安全号码如何在 Oracle 中将 xxxxxxxxx 格式化为 xxx xx xxxx 使用 TO CHAR 格式化 SSN SELECT TO CHAR 0123
在 MSTest 中如何检查最后一个测试是否通过（在 TestCleanup 中）

我正在使用 MSTest 在 Selenium 中创建 Web 测试并且希望每次测试失败时都截取屏幕截图但我不想每次测试通过时都截取屏幕截图我想做的是将屏幕截图功能放入 TestCleanup 方法并在测试失败时运行它但如果测试通过
Play 框架与 Scala 和 PostgreSQL 的最佳数据访问选项是什么？

我们有早期的经验和大量可重用的代码组件大部分是使用 Spring MVC Hibernate PostgreSQL 数据库完成的但最近我们计划启动一个新项目我们决定将 Play 框架与 Scala 一起使用我们是 Scala Pl
Orient-db 正则表达式修饰符

我正在使用 orient db 数据库并且遇到正则表达式模式匹配问题我确实需要在请求中存在不区分大小写的修饰符但不知何故它无法按我的预期工作 Query select from UserAccounts where email MAT
vscode 无法打开弧度（Linux、Manjaro）

打开 R 脚本并单击Run Source然后我得到 The terminal process home xxx miniconda3 bin radiant failed to launch exit code 1 以及终端窗口中的按摩 T
动态方法名称（Objective-C）

我有几种方法如下所示 void methodA void methodB void methodC 它们的使用取决于某些条件现在我想动态使用它们我尝试了以下方法 NSString methodName if flag A method
异常：android.view.InflateException：二进制 XML 文件行 #20：膨胀类 net.simonvt.datepicker.DatePicker 时出错

我正在开发我正在使用的 Android 应用程序simonvtdatepicker 库因为向后兼容但我在开发者控制台崩溃报告中看到有 3 个关于此相同错误的报告但我在正在运行的设备中尝试过所以这真的很奇怪请支持这个为什么它如此奇怪并
分发管理到期？

目前我的 Distribution Managed 已过期现在我的问题是我是否需要撤销它然后创建一个新的我有点困惑因为我在创建新证书下找不到该特定证书那么我需要用它做什么呢我已经创建了一个新的分发证书但对分销管理的了解又如何呢
如何将项目与弹性容器的开始和居中对齐？ [复制]

这个问题在这里已经有答案了 I have this plunker http plnkr co edit gZHmQJa4OlEJTksjLHYm p preview this plunker http plnkr co edit JFRN
导入错误：没有名为 mako.template 的模块

我的 foobar py 文件中的这行代码 from mako template import 结果是导入错误没有名为 mako template 的模块我怎样才能解决这个问题两个都help modules and repr mak
如何在 BigQuery 标准 SQL 中获取数组的切片？

在 BigQuery 中我有一个表其中包含path像这样的列 ID Path 1 foo bar baz 2 foo bar quux blat 我希望能够在正斜杠上分割路径并选择一个或多个路径部分然后重新连接它们在 Postgr

如何在 BigQuery 标准 SQL 中获取数组的切片？

如何在 BigQuery 标准 SQL 中获取数组的切片？ 的相关文章

随机推荐

热门标签

如何在 BigQuery 标准 SQL 中获取数组的切片？的相关文章