我如何以csv格式输出hadoop结果

2023-11-23

我需要以 .csv 格式输出我的 hadoop 结果。 我该怎么做? 我的代码:https://github.com/studhadoop/xml/blob/master/XmlParser11.java

我应该简单地在我的代码中包含 csvoutputFormat 吗? 我正在使用mapreduce API

myjob.sh

bin/hadoop jar /var/root/ALA/ala_jar/clsperformance.jar ala.clsperf.ClsPerf /user/root/ala_xmlrpt/Amrita\ Vidyalayam\,\ Karwar_Class\ 1\ B_ENG.xml  /user/root/ala_xmlrpt-outputshell4

bin/hadoop fs -get /user/root/ala_xmlrpt-outputshell4/part-r-00000 /Users/jobsubmit


cat /Users/jobsubmit/part-r-00000 /Users/jobsubmit/output.csv

SOLUTION

是的,我失踪了>在猫里

cat /Users/jobsubmit/part-r-00000> /Users/jobsubmit/output.csv

您可以使用文本输出格式。默认的键/值分隔符是制表符。您可以通过在驱动程序中设置属性“mapred.textoutputformat.separatorText”来更改分隔符。

conf.set("mapred.textoutputformat.separatorText", ",");
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

我如何以csv格式输出hadoop结果 的相关文章

  • spring依赖注入会创建单例对象吗?

    spring内部是如何管理这些对象的呢 单例对象什么时候创建和销毁 默认情况下 Spring bean 基本上是单例的 Spring 将为每个类创建一个实例 并且通常会在 Spring 初始化时执行此操作 然而 这几乎是无限可定制的 Spr
  • 读取时 R 中的内存错误.xlsx

    我正在使用以下 R 代码 也利用 Java 参数来增加内存 library xlsx options java parameters Xmx1g library XLConnect NiVe lt read xlsx version1 xl
  • 如何将背景图像设置到 JPanel 中的 JTextArea

    我想在JTextArea 我在谷歌上查找过 但没有结果 背景可能是一个标志 我也想知道如何设置背景的分辨率 我的包中只有一门课 我有一个 MySQL 连接器驱动程序作为参考库 我的工作台是 Eclipse 使用 Fat jar 插件导出 j
  • 在准备好的语句中使用“like”通配符

    我正在使用准备好的语句来执行 mysql 数据库查询 我想实现基于某种关键字的搜索功能 为此我需要使用LIKE关键字 我知道的就这么多 我以前也使用过准备好的语句 但我不知道如何使用它LIKE因为从下面的代码中我将在哪里添加 keyword
  • 从枚举返回计算值

    我的问题有两个而且很简单 按原样误解枚举 这个想法在我的代码中缺少一些重要的抽象 代码示例 其中oprt calc x y 无法编译 有警告cannot find symbol public enum Operation PLUS publ
  • IntelliJ,无法启动简单的 Web 应用程序:无法 ping 本地主机上的服务器:1099

    我正在尝试按照本教程在 IntelliJ 中制作一个简单的 Web 应用程序 http wiki jetbrains net intellij Creating a simple Web application for Tomcat in
  • JTable 使用行号?

    我正在创建一个程序 其工作原理如下Microsoft Excel 在JAVA中 我的问题是如何将行号放在每行旁边JTable 我已经看到它在其他 Java 程序中工作 我只是不知道如何将它包含在我的程序中 谷歌给了我这个网站 http ti
  • Spring 在使用 JUnit 的单元测试中不自动装配

    我使用 JUnit 测试以下 DAO Repository public class MyDao Autowired private SessionFactory sessionFactory Other stuff here 正如您所看到
  • Java 将字符串拆分为单词逗号和句号

    我一直在使用myString split s 得到每个单词 但现在我想把逗号和句号也分开 例如 妈妈总是说生活就像一盒巧克力 你永远不知道会得到什么 to Mama always said life was like a box of ch
  • 如何设置鼠标监听器的优先级

    我有一个带有列表和按钮的面板 名单已定MouseAdapter with mouseClick 我添加到面板MouseAdapter with mousePressed and mouseReleased and MouseMotionAd
  • SLF4J 日志级别作为参数[重复]

    这个问题在这里已经有答案了 我们希望使用 SLF4J 但我们发现的一件事是您无法将级别指定为参数 即 Logger log Level INFO messsage 你必须这样做 logger info message 这使得无法通过方法传递
  • Web 服务器上的身份验证和授权 ?

    我正在构建一个 Android 应用程序 它与 apache tomcat 上的 Web 服务器进行通信 Web 服务器采用 JAVA EE 构建 目前 为了进行身份验证和授权 我使用用户名 密码 为了管理会话 我使用令牌 因此 当用户登录
  • 如何在类图中对自定义异常关联进行建模?

    Reading here http www jguru com faq view jsp EID 62790 似乎使用泛化来建模自定义异常类很常见 它没有提到的是我如何对与可能引发自定义异常的类的关联进行建模 请注意 我并不是在问如何在引发
  • 远程数据库的“com.mysql.jdbc.exceptions.jdbc4.CommunicationsException:通信链路故障”

    我尝试连接到远程 MySQL 数据库 但失败并收到此错误 com mysql jdbc exceptions jdbc4 CommunicationsException Communications link failure 困惑的是 当我
  • Gradle 将多个依赖项提取到不同的目录

    我正在尝试将多个依赖项提取到不同的目录中 我尝试了以下方法 configurations cppDependencies dependencies cppDependencies com group artifact1 1 0 cppDep
  • Log4j 不打印完整的堆栈跟踪

    我检查了 SO 中的所有答案 但没有一个真正帮助我 我的 Log4j 属性文件 log4j rootLogger debug console file log4j appender console org apache log4j Cons
  • 异常中的错误代码与异常层次结构

    您认为在异常中使用错误代码来指定错误类型可以吗 请看一下这段代码 public class MyException extends Exception public static final String ERROR CODE INVALI
  • 如何在JavaFX中获得狭窄的进度条?

    正如标题所说 我需要制作一个细进度条 我用过这个 progressBar setMaxHeight 0 1 progressBar setPrefHeight 0 1 但这行不通 有人有想法吗 你必须搞乱样式才能让它变小 我真的建议看看ca
  • 如何用java实现FTP?

    我正在使用 FTP 我必须在客户端将消息嵌入到图像文件中 并且我必须将其发送到服务器 在服务器端我必须检索图像文件并然后我将检索该消息 我已经完成了嵌入消息并使用密码学和隐写术技术检索消息 我正在寻找如何将该文件从客户端传输到服务器 我必须
  • 我可以在Java中设置枚举起始值吗?

    我使用枚举来创建一些常量 enum ids OPEN CLOSE OPEN 值为零 但我希望它为 100 这可能吗 Java 枚举与 C 或 C 枚举不同 后者实际上只是整数的标签 Java 枚举的实现更像是类 它们甚至可以有多个属性 pu

随机推荐

  • 从 Perl 创建的文本文件有行长度限制吗?

    在编写 Perl 脚本时 我需要在文件的一行中仅写入以逗号分隔的用户名 这就是为什么我想知道 txt 文件中行的最大大小是否有任何限制 文本文件就像任何其他文件一样 换行符与任何其他字符一样 因此仅适用通常的文件大小限制 旧文件系统上的 4
  • 接收远程推送通知时打开视图控制器

    我正在使用 Storyboard 当用户收到远程推送通知时 我想始终打开相同的视图 即使应用程序位于后台或打开 我需要呈现的视图是故事板中设置的初始视图控制器之后的四个视图 我读过这篇文章 如何将响应通知的模态视图显示为新窗口 无父VC 当
  • 直接包含文本的元素的 jQuery 选择器?

    我能够使用 contains选择器 但我的问题是 如果一个元素包含一个包含它仍然返回的文本的元素 例如 div contains test 将选择下面的两个 div div something else div test div div f
  • 为什么将 EntityState 设置为 Detached 会清空 List 类型的属性?

    首先使用实体 框架代码 我有类似的东西 public class Foo public int Id get set public List
  • 将字符串中的字母与数字分开

    我正在处理这样的字符串 125A12C15 我需要在字母和数字之间的边界处将它们分开 例如这个应该成为 125 A 12 C 15 在Python中是否有比逐个位置检查它并检查它是字母还是数字 然后相应地连接更优雅的方法 例如 此类事情的内
  • HTML 未在 Django 文本字段中呈现

    我试图使用 markdown 来避免在 wiki 表单中输入 HTML 但由于某种原因 表单显示的是 HTML 代码而不是预期的格式 我的视图函数如下 from django shortcuts import render to respo
  • 将环境变量设置为较大的值 - >“参数列表太长”

    在 bash 脚本中 我设置了一个环境变量来包含 100 万个字符的字符串 我这样做是这样的 export LG XXXXXXX 1 million X s 在此之后 我可以毫无问题地回显它 即 echo LG 但是 在此之后我尝试在脚本内
  • 停止php处理文件

    有什么方法可以让 php 停止处理文件并使其只处理已经解析的部分 我的意思是这样的
  • VSCODE 在保存时通过格式插入空格

    VSCODE 似乎在我的 html 代码中到处插入空格 我检查了设置 导致它的原因如下 editor formatOnSave true Example 如何配置它以停止插入空格 我有以下一组 editor formatOnSave fal
  • Python套接字连接超时

    我有一个套接字 我想在连接时超时 这样如果它无法连接 我可以取消整个操作 但它也想使用不需要超时的套接字的 makefile 有没有一种简单的方法可以做到这一点 或者这会是一件困难的事情吗 python 是否允许在连接后重置超时 以便我可以
  • Java:声明多维数组而不指定数组的大小(例如 new int[10][] )

    我一直试图弄清楚这里到底发生了什么 我只是想弄清楚我在下面评论的这两行代码正在做什么 我发现这个程序没有声明数组的完整维度 而不是 new int 10 5 它只是决定不通过说 new int 10 来声明它 就像第二个数组长度并不重要 将
  • 在不使用 UDF 和 CLR 的情况下,从 T-SQL 中的字符串中删除所有空白字符的好方法是什么?

    NET 函数string Trim 修剪相当广泛的空白字符集 如何以最佳方式 T SQL 模拟这种确切的行为 LTRIM and RTRIM仅修剪空格字符是不够的 这对于 SQL CLR 来说很容易 但这并不总是可行 而且调用成本也相当高
  • 之前的图像大小在 DOM 中

    在将图像放入 DOM 之前如何获取图像大小 var imgLoad img imgLoad attr src ImageGallery ImagesList index new Date getTime imgLoad unbind loa
  • 如何快速重新加载 ui 视图的内容

    我有一个视图控制器 其中有滚动视图 并且滚动视图有一个视图 因此 视图有很多按钮和标签 这些按钮和标签的显示取决于来自 api 的数据 按下后我有一个按钮 我想重新加载视图 它的内容 简单的黑客之一NOT推荐的方法是 self view s
  • TensorFlow 中使用稀疏标签进行多标签图像分类?

    我想对 n 个类别执行多标签图像分类任务 我为每个图像提供了稀疏标签向量 并且每个标签向量的每个维度当前都以这种方式编码 1 0 gt Label true Image属于这个类 1 0 gt Label false 图像不包含此类 0 0
  • 如何在 JavaScript 中返回值

    我有一个 JavaScript 函数 function myFunction value1 value2 value3 Do stuff and value2 somevalue2 to return value3 somevalue3 t
  • Ruby 企业版与 Ruby 1.9

    我计划建立一个简单的 CMS 网站 用户可以在其中提交和查看包含视频 照片和文本的帖子 我想要做出的一个决定是在 Ruby Enterprise Edition 和 Ruby 1 9 之间进行选择 我关心的事情按顺序 性能和可扩展性 与现有
  • 如何在JBOSS 5中启用远程调试?

    如何在 JBoss 5 中启用远程调试 JBoss 4 中的常用语句 set JAVA OPTS Xdebug Xnoagent Xrunjdwp transport dt socket address 8787 server y susp
  • 如何在后台线程中创建 WPF 控件?

    我有创建后台线程来执行某些操作的方法 在这个后台线程中我创建对象 但是这个对象在运行时创建时给了我一个例外 调用线程必须是 STA 因为许多 UI 组件都需要它 我知道我必须使用 Dispatcher 来向 UI 反映某些内容 但在本例中
  • 我如何以csv格式输出hadoop结果

    我需要以 csv 格式输出我的 hadoop 结果 我该怎么做 我的代码 https github com studhadoop xml blob master XmlParser11 java 我应该简单地在我的代码中包含 csvoutp