我在 Hive 中运行一个简单的查询,生成以下输出(以及一些其他附加列。
|------|-----------------------------------------------------------|
| col1 | col2 |
|------|-----------------------------------------------------------|
| A | {"variable1":123,"variable2":456,"variable3":789} |
|------|-----------------------------------------------------------|
| B | {"variable1":222,"variable2":333,"variable3":444} |
--------------------------------------------------------------------
我需要能够解析 json 字符串并在 SELECT 语句本身期间提取每个标记的值,以便我可以合并 WHERE 语句以仅返回字符串中对我有价值的部分。
所以我的最终输出可能如下所示:
|------------------------------------------|
| col1 |variable1 | variable2 | variable3 |
|------------------------------------------|
| A | 123 | 456 | 789 |
|------------------------------------------|
| B | 222 | 333 | 444 |
--------------------------------------------
我尝试使用示例中指定的参数结构使用各种函数,包括 SPLIT 和 GET_JSON_OBJECT 但所有返回错误,例如:
No matching method for class org.apache.hadoop.hive.ql.udf.UDFJson
with (struct<...>, string). Possible choices: _FUNC_(string, string)
有人可以告诉我我想做的事情是否可行,或者解释一下我哪里出错了?
提前致谢