在 RedShift 中将值拆分为多行

2024-02-12

如何将字段（例如 CSV 字符串）拆分为多行的问题已经得到解答：将值拆分为多行 https://stackoverflow.com/questions/13159526/split-values-over-multiple-rows.

然而，这个问题涉及 MSSQL，并且答案使用了 RedShift 没有等效项的各种功能。

为了完整起见，这是我想做的一个示例：

当前数据：

| Key | Data     |
+-----+----------+
| 1   | 18,20,22 |
| 2   | 17,19    |

所需数据：

| Key | Data     |
+-----+----------+
| 1   | 18       |
| 1   | 20       |
| 1   | 22       |
| 2   | 17       |
| 2   | 19       |

现在，我可以建议针对 CSV 字段中元素数量较小、有界的情况采取一种解决方法：对所有可能的数组位置使用 split_part 和 union，如下所示：

SELECT Key, split_part(Data, ',', 1) 
FROM mytable
WHERE split_part(Data, ',', 1) != ""
    UNION
SELECT Key, split_part(Data, ',', 2) 
FROM mytable
WHERE split_part(Data, ',', 2) != ""
-- etc. etc.

然而，这显然效率很低，并且不适用于较长的列表。

关于如何做到这一点有更好的想法吗？

EDIT:

关于行相乘还有一个有点类似的问题：在 Redshift 中拆分行 https://stackoverflow.com/questions/22779150/splitting-rows-in-redshift。但是我不知道如何在这里应用这种方法。

EDIT 2:

可能的重复：红移。将逗号分隔的值转换为行 https://stackoverflow.com/questions/25112389/redshift-convert-comma-delimited-values-into-rows。但没什么新鲜的 - @Masashi Miyazaki 的答案与我上面的建议类似，并且遇到了同样的问题。

这是 Redshift 的答案，它每行最多可处理 10000 个值。

设置测试数据

create table test_data (key varchar(50),data varchar(max));
insert into test_data
    values
      (1,'18,20,22'),
      (2,'17,19')
;

code

with ten_numbers as (select 1 as num union select 2 union select 3 union select 4 union select 5 union select 6 union select 7 union select 8 union select 9 union select 0)
  , generted_numbers AS
(
    SELECT (1000 * t1.num) + (100 * t2.num) + (10 * t3.num) + t4.num AS gen_num
    FROM ten_numbers AS t1
      JOIN ten_numbers AS t2 ON 1 = 1
      JOIN ten_numbers AS t3 ON 1 = 1
      JOIN ten_numbers AS t4 ON 1 = 1
)
  , splitter AS
(
    SELECT *
    FROM generted_numbers
    WHERE gen_num BETWEEN 1 AND (SELECT max(REGEXP_COUNT(data, '\\,') + 1)
                                 FROM test_data)
)
  , expanded_input AS
(
    SELECT
      key,
      split_part(data, ',', s.gen_num) AS data
    FROM test_data AS td
      JOIN splitter AS s ON 1 = 1
    WHERE split_part(data, ',', s.gen_num) <> ''
)
SELECT * FROM expanded_input
order by key,data;

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 RedShift 中将值拆分为多行的相关文章

案例陈述以确定我是否应该结合

我目前想做某种条件联合给出以下示例 SELECT age name FROM users UNION SELECT 25 AS age Betty AS name 假设我只想在用户计数 gt 2 时合并第二个语句否则不合并两者总之
如何将字符串拆分为新行并保留空白行？

给出 ruby 代码 aaaa nbbbb n n split n 这输出 aaaa bbbb 我希望输出包含由 n n 我想要的结果是 aaaa bbbb 获得这个确切结果的最简单最好的方法是什么我建议使用lines代替split为了
与 FOREIGN KEY 约束冲突

我有两张桌子学术界 CREATE TABLE dbo R ACADEMIE ID ACADEMIE dbo IDENTIFIANT NOT NULL LC ACADEMIE CODE dbo LIBELLE COURT NOT NULL
使用 xmlagg 时出现子查询错误和太多值

我在连接许多大型表中的所有数据时遇到问题我昨天对此提出了问题但不幸的是 listagg 似乎不是一个好的选择链接子查询返回多行 https stackoverflow com questions 54651144 subquery r
当我输入 dateadd 或 datediff 代码时，我总是收到此错误“ORA-00904“DATEADD”无效标识符。”

我有一个大学项目并且有一个包含入院和出院日期属性的患者表我需要删除超过 7 年的记录我使用了以下代码 delete from patient where dis date gt datedadd yy 7 getdate 我收到错误
如何对 SQL Server Express 进行实时更改

我一直在使用 VS studio 开发一个 ASP NET Web 应用程序我正在使用 SQL Server Express 在开发过程中我一直在我的服务器上测试我的网络应用程序每次我需要更新数据库时我都会简单地删除旧数据库位于我
在 Doctrine DQL 中选择 count() ，并使用左连接多对多单向关系，其中用户没有关系特定组

情况我尝试在 DQL 中为不属于特定组的用户选择 count 标准ManyToMany之间的单向关系User and Group实体来自FOSUserBundle and SonataUserBundle 系统 Symfony 2 5 D
在 SQL Server SELECT 语句中使用 CASE 时消除 NULL

我有一份大而混乱的报告要写它连接了 5 个表一个表中有一列用于多个不同的值本质上是一个标签列其中标签根据用户想要使用的各种元数据的类型以创造性的方式使用因此我对报告的查询返回 3 个几乎相同的行仅标签列有所不同例如
优化 LINQ 查询 - 如何缩短执行时间？

我想知道是否有一个好的方法来优化我的 LINQ 查询我正在使用类似于以下内容的 LINQ 查询从数据库检索数据 PKs is a list of integers var import context table Where x gt P
Netezza SQL 将 VARCHAR 转换为二进制字符串

我有一个位图存储为VARCHAR在内特扎需要转换一下VARCHAR转换为 Netezza 中的二进制字符串输入 Netezza col 值 VARCHAR 0xFFFFFFFFFFFFFFFF 期望的输出 VARCHAR gt 1111
将 5 gig 文件导入表时出错

我正在尝试批量插入表 use SalesDWH go BULK INSERT dbo npi FROM S tmp npi csv WITH FIELDTERMINATOR ROWTERMINATOR n lastrow 200 first
DB2 - 如何在 IBM System i Access for Windows GUI Tool 中使用参数运行即席选择查询

我想使用我声明的变量在 IBM System I Navigator tool for DB2 中运行一些临时选择语句例如在 SQL Server 世界中我可以在 SQL Server Management Studio 查询窗口中轻
如何限制mySQL中的搜索和替换字符串

我用它来搜索和替换 mySQL 中的字符串 UPDATE products SET prodname REPLACE prodname S S 这些产品包含诸如 TYLENOL TABS 100 S 之类的字符串我想将其转换为 TYLEN
如何在此查询中获取以 KM 为单位的距离

salons Salon select salons gt selectRaw 6371 acos cos radians cos radians lat cos radians lng radians sin radians sin ra
MySQL如何在没有过程/函数的情况下执行命令块

我尝试在 MySQL Workbench 上运行一段 SQL 命令就像在 SQL Server 上一样但它告诉我声明在此位置无效我在网上看到了各种这样的例子我真的不明白为什么会出现这个错误一些提示代码其中 SQL Serve
QGIS 和 PostGIS（地图点（美国地图上的纬度和经度以及半径）

我安装了QGIS和PostGIS 我想在美国地图上以 100 英里为半径显示 200 个点我已将纬度和经度导入 PostGIS 数据库中所以我有三个字段地址纬度经度 1 我需要将纬度和经度字段转换为点或几何字段吗如果是这样怎么办
表被指定两次作为 INSERT 的目标和单独的数据源

我做了这个查询但它给了我错误就像标题中一样 INSERT INTO data waktu vaksinasi id binatang id vaksin tanggal vaksin status vaksin VALUES 1 1 S
如何使用索引更改表的列？

我想将带有某些索引的表中 a 列的列大小从 varchar 200 更改为 varchar 8000 我应该如何进行既然是VARCHAR你正在增加尺寸然后简单地ALTER TABLE ALTER COLUMN https learn m
SQL Server 为什么索引不与 OR 一起使用

我一直在研究索引并试图了解它们是如何工作的以及如何使用它们来提高性能但我错过了一些东西我有下表 Person Id Name Email Phone 1 John E1 P1 2 Max E2 P2 我正在尝试找到对列进行索引的最佳方法
SQL查询中的Python列表作为参数[重复]

这个问题在这里已经有答案了我有一个 Python 列表比如说 l 1 5 8 我想编写一个 SQL 查询来获取列表中所有元素的数据例如 select name from students where id IN THE LIST l

随机推荐

Facebook 聊天 API - php

我已经成功通过 xmpp 协议登录 Facebook 我使用了 facebook 文档中提供的 PHP 代码
自定义ipython笔记本的欢迎页面

我可以自定义 iPython 笔记本服务器版本 2 3 的登录页面吗我的意思是在起始页类似于 http localhost 8888 tree 我想显示欢迎来到 John Doe 的 i Py 笔记本或修改现有横幅这可能吗您可以
Mac OS X /bin/bash：python：在某些 IDE 中找不到命令

当我编译的时候test py 一个非常简单的Python文件在Sublime Text或CodeRunner中我收到错误 bin bash python command not found 然后我输入python test py在终端应
Swing Worker 模态对话框不会关闭

我有一个 SwingWorker 线程它启动一个模式对话框从侦听启动的 StateValue 的属性更改侦听器并且 swing 工作线程继续执行其工作但是看起来 did 方法没有被调用因为它是在 EDT 上调用的但 swing
Numpy 数组到 TFrecord

我正在尝试通过张量流对象检测 API 训练自定义数据集数据集包含 40k 训练图像和标签采用 numpy ndarray 格式 uint8 训练数据集形状 2 40000 23456 和标签形状 1 0 3 我想为此数据集生成 tfre
如何升级pip3？

I want to use python3 5 for development but many times when I install the module for python 3 5 it always fails The term
派生类型中的可变长度数组

我主要使用 Python 进行科学编程并没有大量的 Fortran 90 95 经验对于我的一个项目我想定义一个派生类型并为该类型重载一堆运算符至关重要的是我希望派生类型的变量之一成为可变长度的数组至少我在代码的不同部分需要两
删除 tar 生成的尾随空字符

我正在尝试压缩一些文件并通过 php passthru 命令将它们传递给用户问题是尽管 tar 文件应该只有 2k 大小但它始终是 10240 有趣的数字对吗所以我把它分解为 sh 4 1 tar czf test wc c 102
iPhone 上针对 RTL 语言的翻转布局

这是我的问题我已将我的应用程序本地化为阿拉伯语它实际上与常规本地化略有不同因为我有不同的目标每种语言一个在模拟器上由于自动布局和约束的前导尾随部分视图被正确翻转但我似乎无法在设备上获得相同的结果 AutoLayout RT
bash 创建带有序列号的目录

我正在创建一个在 OS X 上运行的脚本该脚本将由新手用户经常运行因此希望通过每次创建一个新的目录结构并在最后一个上使用 n 1 来保护目录结构 target001下一次运行创建target002 到目前为止我有 lastDir fin
重置按钮处理点击后执行 Javascript 操作

如何立即执行某项操作after an
EF Core 查询存储过程映射到类型

我有一个项目需要查询数据库并将结果返回到 Web api 有几个由数据库管理员即时创建的存储过程它们有一个 UI 用于创建存储过程的定义及其名称而 Web API 服务仅调用该 SP 并应返回结果根据下面的代码我无法将返回对象获取到
我在 for 循环中使用 let 关键字给出了语法错误：意外的标识符

我在 for 循环中使用 let 关键字如下所示 for let methd1 in servUrl let methd methd1 for let pth1 in servUrl methd let pth pth1 app meth
有没有办法使用 cron 重新启动 pm2 进程，但前提是它尚未运行？

我想通过 PM2 重新启动我的 Node Js 应用程序 pm2 restart app js 使用 crontab 但仅当应用程序尚未运行时例如如果我的服务器崩溃并重新启动并且 pm2 没有重新启动即使它正在运行上面的命令也会重新
TensorFlow的map_fn仅在CPU上运行

我在尝试获取 TensorFlow 时遇到了一个奇怪的问题map fn在我的 GPU 上运行这是一个最小的损坏示例 import numpy as np import tensorflow as tf with tf Session as
Log4net 日志记录不适用于并行线程

我在随机数上使用基本的 Parallel Foreach 循环来使用 log4net 记录数字本身这是我在并行线程上记录 5000 条消息的代码 Logger logger new Logger var numbers Enumerabl
Javascript 中是否按顺序执行相等的超时？

假设我这样做 setTimeout foo 0 setTimeout bar 0 我可以确定 foo 会在 bar 之前开始执行吗如果我使用 1 10 或 100 的超时值代替 0 会怎么样简单的实验表明在超时值相等的情况下超时目标
XElement 添加一个 xmlns

我正在使用 Linq to XML 创建一个新的 XML 文件我从现有的 XML 文件中获取该文件的某些部分我为此使用以下代码 var v2 new XDocument new XDeclaration 1 0 utf 16 new X
使用 Mongoose 更新 _id = :id 的记录

我正在尝试使用 Mongoose 更新现有记录插入可以但更新不行这是我的片段 app post submit function req res var my visit new models visits date req body
在 RedShift 中将值拆分为多行

如何将字段例如 CSV 字符串拆分为多行的问题已经得到解答将值拆分为多行 https stackoverflow com questions 13159526 split values over multiple rows 然而这个

在 RedShift 中将值拆分为多行

在 RedShift 中将值拆分为多行 的相关文章

随机推荐

热门标签

在 RedShift 中将值拆分为多行的相关文章