我有一个如下表:
User:String Alias:String
JohnDoe John
JohnDoe JDoe
Roger Roger
我想将用户的所有别名分组在一个数组中,在一个新表中,如下所示:
User:String Alias:array<String>
JohnDoe [John, JDoe]
Roger [Roger]
我不知道如何使用 HiveQL 来做到这一点。我必须为此编写一个 UDF 吗?
Thanks !
查看内置聚合函数 https://cwiki.apache.org/Hive/languagemanual-udf.html#LanguageManualUDF-BuiltinAggregateFunctions%2528UDAF%2529 collect_set
.
select
User,
collect_set(Alias) as Alias
from table
group by User;
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)