REGEXP_REPLACE 捕获组

2024-01-05

我想知道是否有人可以帮助我了解如何使用 Hive 的 regexp_replace 函数来捕获正则表达式中的组并在替换字符串中使用这些组。

我正在解决一个涉及日期修改的示例问题。在此示例中，我的目标是获取与 SimpleDateFormat 解析不兼容的字符串日期，并进行一些小的调整以使其兼容。日期字符串（如下所示）需要在字符串中的偏移符号 (+/-) 前面添加“GMT”。

因此，给定输入：

  '2015-01-01 02:03:04 +0:00' 
  -or-
  '2015-01-01 02:03:04 -1:00'

我想要输出：

  '2015-01-01 02:03:04 GMT+0:00'
  -or-
  '2015-01-01 02:03:04 GMT-1:00'

这是一个我“认为”可行的语句的简单示例，但我得到了奇怪的输出。

蜂巢查询：

select regexp_replace('2015-01-01 02:03:04 +0:00', ' ([+-])', ' GMT\1');

实际结果：

2015-01-01 02:03:04 GMT10:00

请注意，“\1”应该输出匹配的组，而是用数字“1”替换匹配的组。

有人可以帮助我理解在替换字符串中引用/输出匹配组的正确方法吗？

Thanks!

Hive 支持的正则表达式反向引用符号（至少在 0.14 中是这样，我想我记得在 0.13.x 中也是这样）似乎是$1对于捕获组 1，$2对于捕获组 2 等。看起来它基于（甚至可能由其实现）Matcher 类中的 ReplaceAll 方法 http://docs.oracle.com/javase/7/docs/api/java/util/regex/Matcher.html#replaceAll%28java.lang.String%29。这是该文档的相关部分：

如上所述，美元符号可以被视为对捕获的子序列的引用，并且反斜杠用于转义替换字符串中的文字字符。

所以我认为你想要的是这样的：

select regexp_replace('2015-01-01 02:03:04 +0:00', ' ([+-])', ' GMT$1');

例如：

hive> select regexp_replace('2015-01-01 02:03:04 +0:00', ' ([+-])', ' GMT$1');
OK
2015-01-01 02:03:04 GMT+0:00
Time taken: 0.072 seconds, Fetched: 1 row(s) 
hive> select regexp_replace('2015-01-01 02:03:04 -1:00', ' ([+-])', ' GMT$1');
OK
2015-01-01 02:03:04 GMT-1:00
Time taken: 0.144 seconds, Fetched: 1 row(s)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

REGEXP_REPLACE 捕获组的相关文章

HDFS 中的文件数量与块数量

我正在运行单节点 hadoop 环境当我跑的时候 hadoop fsck user root mydatadir block 我真的对它给出的输出感到困惑 Status HEALTHY Total size 998562090 B Tot
使用基于 DFA（线性时间）正则表达式捕获组：可能吗？

是否可以使用基于 DFA 的正则表达式实现捕获组同时保持相对于输入长度的线性时间复杂度直觉上我认为不是因为子集构造过程不知道它可能落在哪个捕获组内但这是我第一次意识到这可能是一个潜在的问题所以我不知道是否可以使用基于 DFA 的
如何编写 Clojure 宏来从字符串创建正则表达式？

我正在创建一个方便的宏部分便利在于可以仅使用字符串来指定正则表达式而不是使用 re 表示法我无法弄清楚的一部分是如何让宏获取字符串并将其重写为 Clojure 正则表达式例如生成 re 符号我认为这是一个语法转义问题我的第一
如何使用正则表达式将字符串分成相同字符的组？

我有一个这样的字符串 var string AAAAAAABBBCCCCCCDD 并喜欢将字符串分割成这种格式的数组 same characters gt same group 使用正则表达式 Array AAAAAAA BBB CCCCC
使用正则表达式模式查找 -name 并使用 cp 替换文件名

目前我正在使用该命令cron复制 data从源到目标路径 find source path name data exec cp target path 源码结构为 source path category1 001 data source
JS用正则表达式替换数字

我有元素的标识符如下所示 form book 1 2 3 我想要的是用其他值替换该标识符中的第二个数字我将函数 match 与以下正则表达式一起使用 var regexp d d d 但它返回我包含的数组 1 2 3 2 因此当我尝试
使用FFMpeg确定视频类型，然后进行转换？

我正在尝试以编程方式确定文件的真实类型看来我必须使用 FFMPeg 来实现这一点我想确定上传的文件实际上是否是 MP4 或 FLV 对于 Flash 视频或 WebM 对于 HTML5 我知道 FFMPeg 中的 i 运算符但我不知
正则表达式获取包含某些字符但不包含其他字符的单词

我想要的是一个正则表达式它可以获取包含例如字符的单词a并且不包含字符b and c 在我看来以下内容完成了一半的工作 bc 但我想要言语并含有a这里不考虑使用消极的前瞻性确保我们要捕获的单词没有b nor c 然后匹配该单词是否
处理 oozie 工作流程中的循环

我有一个 oozie 用例用于检查输入数据可用性并根据数据可用性触发 MapReduce 作业所以我编写了一个 shell 脚本来检查输入数据并在 oozie 中为其创建了一个 ssh 操作输入数据检查的重试次数和重试间隔应该是可配
正则表达式可以与 C++ 中的字符数组一起使用吗

我正在开发一个无法使用字符串库文件的程序而是使用字符数组我能够使用正则表达式并且想知道是否有办法使用正则表达式和字符数组甚至正则表达式和单个字符我问的原因是当我尝试在匹配中使用我的 char 数组时 xUtility 会抛出一堆来
如何添加 Java 正则表达式实现中缺少的功能？

我是 Java 新手作为一名 Net 开发人员我非常习惯Regex Net 中的类 Java 实现Regex 正则表达式还不错但它缺少一些关键功能我想为 Java 创建自己的帮助器类但我想也许已经有一个可用的了那么是否有任何
使用 Grep 查找两个短语之间的文本块（包括短语）

是否可以使用 grep 来高亮所有以以下内容开头的文本 mutablePath CGPathCreateMutable 并以以下内容结尾 CGPathAddPath skinMutablePath NULL mutablePath 这两个短
Bash 正则表达式——似乎无法匹配任何 \s \S \d \D \w \W 等

我有一个脚本试图从 gparted 获取信息块我的数据如下所示 Disk dev sda 42 9GB Sector size logical physical 512B 512B Partition Table msdos Number
从字符串中提取电子邮件地址

我有一个像这样的字符串 Francesco Renga lt email protected cdn cgi l email protection gt 我只需要提取电子邮件即电子邮件受保护 cdn cgi l email protec
用于验证网络路径的正则表达式 PHP、jQuery、JavaScript、Ruby

尝试找出用于验证网络路径的正则表达式即 comp xyz or comp or comp x y z storage或者所有部分都更长的东西但希望能够传达其要点我目前拥有的是一个简单的输入字段用户可以通过它传递信息事情是我不希望他
名称节点处于安全模式

我提到了这些问题名称节点处于安全模式无法离开 https stackoverflow com questions 15803266 name node is in safe mode not able to leave and SafeM
文本在指定长度后分割，但不要使用 grails 打断单词

我有一个长字符串需要将其解析为长度不超过 50 个字符的字符串数组对我来说棘手的部分是确保正则表达式找到 50 个字符之前的最后一个空格以便在字符串之间进行彻底的分隔因为我不希望单词被切断 public List
如何使用正则表达式验证 1-99 范围？

我需要验证一些用户输入以确保输入的数字在 1 99 范围内含这些必须是整数 Integer 值允许前面加 0 但可选有效值 1 01 10 99 09 无效值 0 007 100 10 5 010 到目前为止我已经制定了以下正则
如何确保 re.findall() 停止在正确的位置？

这是我的代码 a import re re findall r lt title gt lt title gt a 结果是 title aaa
Apache hadoop 版本 2.0 与 0.23

Hadoop 的版本和发行版太多让我很困惑我有几个问题 Apache Hadoop 1 x 是从 0 20 205 开始的 Apache Hadoop 2 0 是从 0 22 还是 0 23 开始根据这个blogpost http b

REGEXP_REPLACE 捕获组

regex

Hadoop

hive

regexpreplace

REGEXP_REPLACE 捕获组的相关文章

HDFS 中的文件数量与块数量

使用基于 DFA（线性时间）正则表达式捕获组：可能吗？

如何编写 Clojure 宏来从字符串创建正则表达式？

如何使用正则表达式将字符串分成相同字符的组？

使用正则表达式模式查找 -name 并使用 cp 替换文件名

JS用正则表达式替换数字

使用FFMpeg确定视频类型，然后进行转换？

正则表达式获取包含某些字符但不包含其他字符的单词

处理 oozie 工作流程中的循环

正则表达式可以与 C++ 中的字符数组一起使用吗

如何添加 Java 正则表达式实现中缺少的功能？

使用 Grep 查找两个短语之间的文本块（包括短语）

Bash 正则表达式——似乎无法匹配任何 \s \S \d \D \w \W 等

从字符串中提取电子邮件地址

用于验证网络路径的正则表达式 PHP、jQuery、JavaScript、Ruby

名称节点处于安全模式

文本在指定长度后分割，但不要使用 grails 打断单词

如何使用正则表达式验证 1-99 范围？

如何确保 re.findall() 停止在正确的位置？

Apache hadoop 版本 2.0 与 0.23

随机推荐

可以将嵌入图像提取到文件中吗？

linux批量重命名目录并从名称中删除#字符

我需要释放从 UIGraphicsGetCurrentContext() 返回的上下文吗？

Laravel - 1066 关系中的表/别名不唯一

写入一个或多个点的频率高于为指标配置的最大采样周期

Python，如何在 lambda 中展开元组？

CSRF验证失败。请求被中止。当我发送 POST 请求时

REGEXP_REPLACE 捕获组

REGEXP_REPLACE 捕获组 的相关文章

随机推荐

REGEXP_REPLACE 捕获组的相关文章