我的表中有一些数据,例如:
id,params
123,utm_content=doit|utm_source=direct|
234,utm_content=polo|utm_source=AndroidNew|
使用 regexp_extract 获取所需数据:
id,channel,content
123,direct,doit
234,AndroidNew,polo
使用的查询:
Select id, REGEXP_extract(lower(params),'(.*utm_source=)([^\|]*)(\|*)',2) as channel, REGEXP_extract(lower(params),'(.*utm_content=)([^\|]*)(\|*)',2) as content from table;
它显示错误“* 悬挂元字符”并返回错误代码 2
有人可以帮忙吗?
请注意,在hive
,你需要加倍反斜杠。
你的正则表达式应该看起来像
(.*utm_content=)([^|]*)(\\|*)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)