我遇到一种情况,需要将记录插入到特定的 Hive 表中。
其中一列需要是自动递增的序列号(即在任何时间点都必须严格遵循[max.value + 1]规则).
记录从许多并行的 Hive 作业插入到这个特定的表中,这些作业每天、每周、每月批量运行。
现在,我有这些问题:
将 org.apache.hadoop.hive.contrib.udf.UDFRowSequence (http://svn.apache.org/repos/asf/hive/trunk/contrib/src/java/org/apache/hadoop/hive/contrib/udf/UDFRowSequence.java http://svn.apache.org/repos/asf/hive/trunk/contrib/src/java/org/apache/hadoop/hive/contrib/udf/UDFRowSequence.java)是正确的
选择?
我怎样才能做到线程安全,因为并行作业也是
参与插入记录?
注意:我发现了这篇有用的帖子(hive 在一定数量后自动递增 https://stackoverflow.com/questions/38949699/hive-auto-increment-after-certain-number)我继续关注,但不得不提出一个新的,因为(1)该问题的答案已经被接受,因此可能会失去社区的关注,并且(2)我的情况包括线程安全序列号生成。
None
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)