我需要以 .csv 格式输出我的 hadoop 结果。
我该怎么做?
我的代码:https://github.com/studhadoop/xml/blob/master/XmlParser11.java
我应该简单地在我的代码中包含 csvoutputFormat 吗?
我正在使用mapreduce API
myjob.sh
bin/hadoop jar /var/root/ALA/ala_jar/clsperformance.jar ala.clsperf.ClsPerf /user/root/ala_xmlrpt/Amrita\ Vidyalayam\,\ Karwar_Class\ 1\ B_ENG.xml /user/root/ala_xmlrpt-outputshell4
bin/hadoop fs -get /user/root/ala_xmlrpt-outputshell4/part-r-00000 /Users/jobsubmit
cat /Users/jobsubmit/part-r-00000 /Users/jobsubmit/output.csv
SOLUTION
是的,我失踪了>在猫里
cat /Users/jobsubmit/part-r-00000> /Users/jobsubmit/output.csv
您可以使用文本输出格式。默认的键/值分隔符是制表符。您可以通过在驱动程序中设置属性“mapred.textoutputformat.separatorText”来更改分隔符。
conf.set("mapred.textoutputformat.separatorText", ",");
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)