我正在尝试了解如何从 Hive 表中删除重复记录。
我的 Hive 表:“dynpart”,其中包含以下列:Id、名称、技术
Id Name Technology
1 Abcd Hadoop
2 Efgh Java
3 Ijkl MainFrames
2 Efgh Java
我们可以在选择查询中使用“Distinct”等选项,但选择查询只是从表中检索数据。谁能告诉我如何使用删除查询从 Hive 表中删除重复的行。
当然,不建议或不是在 Hive 中删除/更新记录的标准。但我想了解我们如何做到这一点。
可以使用insert overwrite语句来更新数据
insert overwrite table dynpart select distinct * from dynpart;
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)