org.apache.hadoop.mapred.FileAlreadyExistsException

2024-03-13

我试图在 Hadoop 中运行示例程序here http://hadoop.apache.org/common/docs/r0.20.2/mapred_tutorial.html#Example%3A+WordCount+v1.0

当我尝试运行它时,我得到一个 org.apache.hadoop.mapred.FileAlreadyExistsException

emil@psycho-O:~/project/hadoop-0.20.2$ bin/hadoop jar jar_files/wordcount.jar org.myorg.WordCount jar_files/wordcount/input jar_files/wordcount/output
11/02/06 14:54:23 INFO jvm.JvmMetrics: Initializing JVM Metrics with processName=JobTracker, sessionId=
11/02/06 14:54:23 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same.
Exception in thread "main" org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory file:/home/emil/project/hadoop-0.20.2/jar_files/wordcount/input already exists
    at org.apache.hadoop.mapred.FileOutputFormat.checkOutputSpecs(FileOutputFormat.java:111)
    at org.apache.hadoop.mapred.JobClient.submitJobInternal(JobClient.java:772)
    at org.apache.hadoop.mapred.JobClient.submitJob(JobClient.java:730)
    at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:1249)
    at org.myorg.WordCount.main(WordCount.java:55)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
    at java.lang.reflect.Method.invoke(Method.java:597)
    at org.apache.hadoop.util.RunJar.main(RunJar.java:156)
emil@psycho-O:~/project/hadoop-0.20.2$ 

我从 /home/emil/project/hadoop-0.20.2/jar_files/wordcount/input 获取输入文件 file01 和 file02。当我用谷歌搜索时,我发现这样做是为了防止重复执行相同的任务。但就我而言,是输入文件导致了异常。 我的命令有什么问题吗,因为我没有看到任何关于字数问题有相同错误的帖子。 我是java新手。

这可能是什么原因?


我遇到了同样的问题。我花了一段时间才弄清楚发生了什么事。主要问题是您无法附加调试器来找出正在传递的值。

您在代码中使用 args[0] 作为输入,使用 args[1] 作为输出文件夹。

现在,如果您使用新框架,在 Tool 类的 run 方法中使用命令行,则 args[0] 是正在执行的程序的名称,在本例中为 WordCount。

args[1] 是您指定的输入文件夹的名称,该文件夹由程序映射到输出文件夹,因此您会看到异常。

所以解决办法是:

使用 args[1] 和 args[2]。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

org.apache.hadoop.mapred.FileAlreadyExistsException 的相关文章

  • 如何在 IDEA Intellij 上使用 Spring-boot 自动重新加载

    我写了一个基于Spring boot tomcat freemarker的项目 我运行成功 但是每当我修改一些模板和java类时 我必须重新启动服务器或使用Intellij上的 重新加载更改的类 菜单才能使更改生效 浪费很多时间 然后我尝试
  • 在 jTextfield 中禁用“粘贴”

    我有一个用 Swing awt 编写的应用程序 我想阻止用户将值粘贴到文本字段中 有没有办法在不使用动作监听器的情况下做到这一点 您可以使用 null 参数调用 setTransferHandler 如下所示 textComponent s
  • 如何作为应用程序发布到页面?

    所以 我有一个应用程序 Facebook 应用程序实体 并且我有一个页面 我想使用应用程序通过java代码 通过restfb或任何其他建议 发布到页面 看起来我错过了页面授予应用程序发布权限的阶段 不知道该怎么做 谢谢你们 乌里 您只能 作
  • 迭代函数可以调用自身吗?

    当观看下面的 MIT 6 001 课程视频时 讲师在 28 00 将此算法标记为迭代 但是 在 30 27 他说这个算法和实际的 递归 算法都是递归的 该函数正在使用基本情况调用自身 那么这次迭代情况如何 private int itera
  • 如何在 MSSQL 中获取 CURRENT_DATE?

    我正在使用 jpa 3 o 和 Hibernate 我有一个命名查询 SELECT COUNT wt id FROM WPSTransaction wt WHERE wt createdDate gt CURRENT DATE WPSTra
  • JavaFX使节点覆盖父节点边框颜色

    我有一个如下所示的节点 仅使用 css 我希望标签覆盖其父边框颜色 因此标签下方的边框颜色部分变得不可见 我用来制作这个边框的CSS代码 fx border color black fx border width 3 fx border r
  • 无法从资源加载图片

    So I am trying to load a image file from a resource so that when I export my application into a jar file it could be use
  • 无法在 Java 中输出正确的哈希值。怎么了?

    在我的 Android 应用程序中 我有一个 SHA256 哈希值 我必须使用 RIPEMD160 消息摘要算法进一步对其进行哈希值 我可以输出任何字符串的正确 sha256 和ripemd160 哈希值 但是当我尝试使用ripemd160
  • Java:SortedMap、TreeMap、可比较?如何使用?

    我有一个对象列表 需要根据其中一个字段的属性进行排序 我听说 SortedMap 和 Comparator 是实现此目的的最佳方法 我是否要与正在排序的类实现 Comparable 还是创建一个新类 如何实例化 SortedMap 并传入
  • 具有 JPA 持久性的 Spring 状态机 - 存储库使用

    我试图弄清楚如何轻松使用 Spring 状态机 包括使用 JPA 进行持久化 这是我正在处理的问题 不兼容的数据类型 工厂和持久性 在程序的某个时刻 我想使用连接到用户的状态机 有用于此目的的存储库 项目spring statemachin
  • 纱线上的火花,连接到资源管理器 /0.0.0.0:8032

    我正在我的开发机器 Mac 上编写 Spark 程序 hadoop的版本是2 6 spark的版本是1 6 2 hadoop集群有3个节点 当然都在linux机器上 我在idea IDE中以spark独立模式运行spark程序 它运行成功
  • 拆分/标记化/扫描字符串并注意引号

    Java中是否有默认 简单的方法来分割字符串 但要注意引号或其他符号 例如 给定以下文本 There s a man that live next door in my neighborhood and he gets me down Ob
  • 在 java 中运行外部应用程序但不要等待它完成

    我正在用java编写一个应用程序 允许我运行其他应用程序 为此 我使用了 Process 类对象 但当我这样做时 应用程序会等待进程结束 然后再退出 有没有办法在 Java 中运行外部应用程序 但不等待它完成 public static v
  • 嵌套字段的 Comparator.comparing(...)

    假设我有一个这样的域模型 class Lecture Course course getters class Course Teacher teacher int studentSize getters class Teacher int
  • C 与 C++ 中的 JNI 调用不同?

    所以我有以下使用 Java 本机接口的 C 代码 但是我想将其转换为 C 但不知道如何转换 include
  • 如何减去两个 XmlGregorianCalendar 对象来创建一个 Duration 对象?

    我想计算两个时间之间的差值XmlGregorianCalendar对象 从而创建一个Duration object 但我还没有找到执行减法的干净方法 你会怎么做 那应该是 DatatypeFactory newDuration xgc2 t
  • Android UnityPlayerActivity 操作栏

    我正在构建一个 Android 应用程序 其中包含 Unity 3d 交互体验 我已将 Unity 项目导入 Android Studio 但启动时该 Activity 是全屏的 并且不显示 Android 操作栏 我怎样才能做到这一点 整
  • Collections.sort(list) 和 list.sort(Comparator) 之间的区别

    有什么理由让我应该选择Collections sort list 方法而不是简单地调用list sort 内部Collections sort只是调用sort的方法List无论如何 上课 令人惊讶的是几乎每个人都告诉我使用Collectio
  • 在实现使用原始类型的接口时如何避免警告?

    我正在实施流程工厂 http help eclipse org ganymede index jsp topic org eclipse platform doc isv reference api org eclipse debug co
  • mybatis:使用带有 XML 配置的映射器接口作为全局参数

    我喜欢使用 XML 表示法来指定全局参数 例如连接字符串 我也喜欢 Mapper 注释 当我尝试将两者结合起来时 我得到这个例外 https stackoverflow com questions 4263832 type interfac

随机推荐

  • Django(鼻子)测试加速,reuse_db 不起作用

    我正在使用 django nose 在 django 1 4 中运行单元测试 TEST RUNNER django nose NoseTestSuiteRunner 创建数据库需要很长时间 所以我发现把它放在settings py中 os
  • Symfony2 - 为什么超级管理员也需要投票

    我注意到 即使是超级管理员用户也会征求我的选民的意见 它是否按预期工作 如果是的话 我认为SuperAdmin的哲学是他们系统地拥有所有权利 这样我们就不必一一授予他们每个权限 既然如此 为什么不向所有选民授予访问权呢 我是否总是必须把 i
  • 加载程序集后执行的 C# 方法

    我编写了一些 C 类库 我想使用 Ninject 为我的类提供依赖注入 类库是否可以声明一些在每次加载类库时执行的代码 方法 我需要它来定义 Ninject 的绑定 听起来您正在寻找 C 的 DllMain 的等效项 在 C 中没有办法做到
  • 如何将多个参数作为单个向量传递给函数?

    我使用六个参数创建了以下函数 nDone lt function under strike ttoe vol rf dy pnorm log under strike rf dy vol 2 2 ttoe vol ttoe 0 5 nDon
  • method="post" enctype="text/plain" 不兼容?

    当我使用
  • 使用yarn berry时将.yarn目录提交到git

    在纱线 浆果 的下一个版本中manual https yarnpkg com getting started install指出应该只提交创建的名为 yarn 但是如果您对yarn使用多版本设置 则该目录包含该文件releases yarn
  • 根据ace编辑器实例中字符的长度设置宽度

    我正在开发一个使用 contenteditable 属性创建自定义富文本编辑器的项目 在这个富文本编辑器中 我想插入单行 ace 编辑器实例 其宽度将根据其中的字符数设置 为了将 ace 编辑器实例限制为单行 我处理了 Enter 键事件
  • 如何使用通配符投影别名?

    一旦我做了一个join A by id B by id 我得到一个带有字段的别名A f B f 有没有办法只将其投影到A fields C join A by id B by id D filter C by B n lt 1000 E f
  • 在大型文本文件中搜索字符串 - 分析 python 中的各种方法

    这个问题已经被问过很多次了 花了一些时间阅读答案后 我做了一些快速分析来尝试前面提到的各种方法 我有一个600 MB文件与600万字符串行 DMOZ 项目的类别路径 每行的条目都是唯一的 我想要load文件once 不停寻找用于数据中的匹配
  • 如何撤消 SQL Server UPDATE 查询?

    在 SQL Server Management Studio 中 我执行了以下查询 不幸的是 我忘记取消注释WHERE clause 更新了 1647 行 而不是 4 行 如何撤消最后一条语句 Unfortunately I ve only
  • 完成活动后如何取下键盘?

    我有一个用户在其中输入的活动 然后单击 确定 按钮 完成后 活动关闭并返回到旧活动 但软键盘仍然在屏幕上 我试过了android windowSoftInputMode stateHidden and getWindow setSoftIn
  • 阻止直接 URL 访问返回部分视图的控制器?

    如果有一个名为 UsersController 的控制器 其操作如下 public ActionResult ActiveUsers IQueryable
  • 如何获取数组值作为curl php请求的返回值?

    由于我是 PHP 新手 所以我很难使用 PHP 问题是我没有从curl 请求中获得任何返回值 我正在访问一个远程文件 其中包含以下代码 测试 php test gt getCall public function getCall var a
  • 为什么 easy_install 适用于某些 Windows 二进制文件?

    背景 Windows 默认情况下不包含编译器 安装编译器 或许还需要配置 Python 来使用它 是一项足够复杂的任务 许多开发人员都避免这样做 为此 许多具有二进制依赖项的包可以作为包含二进制文件的预编译 Windows 可执行文件提供
  • 如果未找到元素,C# 中的 XmlSerializer 反序列化是否会失败?

    我正在使用 XmlSerializer 在 C 中将对象写入和读取到 xml 我目前使用的属性XmlElement and XmlIgnore操纵对象的序列化 如果我的 xml 文件缺少我需要的 xml 元素 我的对象仍然可以很好地反序列化
  • Python 中的方法参数[重复]

    这个问题在这里已经有答案了 假设我有这样的代码 class Num def init self num self n num def getn self return self n def getone return 1 myObj Num
  • 将特定线程绑定到特定处理器核心

    我在大学里谈过一些关于并行处理的内容 现在我正在努力提高它 我可以编写可以并行运行的代码 然后启动线程 但之后我就失去了对线程执行操作的控制 我想知道如何控制线程 例如将特定线程绑定到特定处理器核心 我对 C 最感兴趣 但我已经用 Java
  • BigQuery 重复数据删除和分区表

    我想在 BigQuery 中创建一个允许执行以下操作的视图 重复记录删除 将 PARTITIONTIME 公开为用于过滤的列 以允许分区修剪 我知道执行重复数据删除的建议查询是 SELECT EXCEPT row number FROM S
  • 创建指向向量中元素的指针>

    如果我想要一个指向 int 向量向量中的元素的指针 我会写 vector
  • org.apache.hadoop.mapred.FileAlreadyExistsException

    我试图在 Hadoop 中运行示例程序here http hadoop apache org common docs r0 20 2 mapred tutorial html Example 3A WordCount v1 0 当我尝试运行