我尝试过 Amazon 为 EMR 实例提供的 JSON SerDe,如果您需要将 JSON 字典字段寻址/映射到列,它会非常有效。但是我无法弄清楚如何对 JSON 数组执行相同的操作。例如,如果有一个 JSON 数组如下:
[23123.32, "文本文本", { "key1": "value1" } ]
有没有办法将数组的第一个元素映射到 Hive 表中的列?嵌入的字典字段怎么样?
我一直在努力解决同样的问题,直到我在 github 上找到了这个 serde -https://github.com/rcongiu/Hive-JSON-Serde启动 hive 后,只需使用“add jar”命令将其包含进来,它就会像魅力一样工作。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)