我查看了 sqoop 导出操作提供的选项,但找不到任何处理不良记录的选项。例如,在大量记录中,偶尔可能会出现一个字符,而该字符应该是数字。有没有一种方法可以在 sqoop 中处理这些情况,而不会导致作业失败并在文件中提供错误记录。
Sqoop 目前期望导出的数据是干净的,并且不提供处理损坏数据的设施。您可以使用 MR/Pig/Hive 作业清理数据,然后再使用 Sqoop 导出数据。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)