未找到映射器类

2023-12-31

有时我的 MR 工作会抱怨找不到 MyMapper 类。我必须给 job.setJarByClass(MyMapper.class);告诉它从我的 jar 文件加载它。

cloudera@cloudera-vm:/tmp/translator$ hadoop jar MapReduceJobs.jar 转换器/输入/Portuguese.txt 转换器/输出 13/06/13 03:36:57 警告 mapred.JobClient：未设置作业 jar 文件。可能找不到用户类别。请参阅 JobConf(Class) 或 JobConf#setJar(String)。 13/06/13 03:36:57 INFO input.FileInputFormat：要处理的总输入路径：1 13/06/13 03:36:57 信息 mapred.JobClient：正在运行的作业：job_201305100422_0043 13/06/13 03:36:58 信息 mapred.JobClient：映射 0% 减少 0% 13/06/13 03:37:03 信息 mapred.JobClient：任务 ID：attempt_201305100422_0043_m_000000_0，状态：失败 java.lang.RuntimeException: java.lang.ClassNotFoundException: com.mapreduce.variousformats.keyvaluetextinputformat.MyMapper 在 org.apache.hadoop.conf.Configuration.getClass(Configuration.java:996) 在 org.apache.hadoop.mapreduce.JobContext.getMapperClass(JobContext.java:212) 在 org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:601)

问题：为什么会发生这种情况。为什么它不总是告诉我从我的 jar 文件加载它。是否有一些解决此类问题的最佳实践？另外，如果我使用一些第三方库，我也必须为他们这样做吗？

请务必将任何依赖项添加到HADOOP_CLASSPATH and -libjars提交作业后，如下例所示：

使用以下命令添加（例如）当前和lib目录：

export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:`echo *.jar`:`echo lib/*.jar | sed 's/ /:/g'`

请记住，当通过以下方式开始工作时hadoop jar您还需要通过使用将任何依赖项的 jar 传递给它-libjars。我喜欢用：

hadoop jar <jar> <class> -libjars `echo ./lib/*.jar | sed 's/ /,/g'` [args...]

NOTE: The sed命令需要不同的分隔符；这HADOOP_CLASSPATH is :分开并且-libjars需要,分开了。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

未找到映射器类的相关文章

我可以在没有 Hadoop 的情况下使用 Spark 作为开发环境吗？

我对大数据和相关领域的概念非常陌生如果我犯了一些错误或拼写错误我很抱歉我想了解阿帕奇火花 http spark apache org 并使用它仅在我的电脑中在开发测试环境中由于Hadoop包含HDFS Hadoop分布式文件系统
如何从hdfs读取文件[重复]

这个问题在这里已经有答案了我在 project1目录下的hadoop文件系统中有一个文本文件名mr txt 我需要编写 python 代码来读取文本文件的第一行而不将 mr txt 文件下载到本地但我无法从 hdfs 打开 mr tx
更改 Spark Streaming 中的输出文件名

我正在运行一个 Spark 作业就逻辑而言它的性能非常好但是当我使用 saveAsTextFile 将文件保存在 s3 存储桶中时输出文件的名称格式为 part 00000 part 00001 等有没有办法更改输出文件名谢谢
Flume将数据从MySQL迁移到Hadoop

请分享您的想法需求是将MySQL db中的数据迁移到Hadoop HBase进行分析数据应该实时或接近实时地迁移 Flume可以支持这个吗有什么更好的方法据我了解 Flume 并不是为此而设计的 Flume 基本上用于读取日志如数
Pig 10.0 - 将元组分组并在 foreach 中合并包

我在用着Pig 10 0 我想在 foreach 中合并包假设我有以下内容visitors alias a b 1 2 3 4 a d 1 3 6 a e 7 z b 1 2 3 我想对第一个字段上的元组进行分组并将包与一组语义合并以获
名称节点处于安全模式

我提到了这些问题名称节点处于安全模式无法离开 https stackoverflow com questions 15803266 name node is in safe mode not able to leave and SafeM
Spark 写入 hdfs 无法使用 saveAsNewAPIHadoopFile 方法

我在 CDH 5 2 0 上使用 Spark 1 1 0 并试图确保我可以读取和写入 hdfs 我很快意识到 textFile 和 saveAsTextFile 调用旧的 api 并且似乎与我们的 hdfs 版本不兼容 def testHD
无法在 Hadoop Map-Reduce 作业中加载 OpenNLP 句子模型

我正在尝试将 OpenNLP 集成到 Hadoop 上的 Map Reduce 作业中从一些基本的句子分割开始在地图函数中运行以下代码 public AnalysisFile analyze String content InputS
Talend 和 Apache Spark？

我对 Talend 和 Apache Spark 在大数据生态系统中的定位感到困惑因为 Apache Spark 和 Talend 都可以用于 ETL 有人可以用一个例子解释一下吗 Talend 是一种基于工具的大数据方法通过内置组件支
使用字符串数组在 Hive 表上加载 CSV 文件

我正在尝试将 CSV 文件插入 Hive 其中一个字段是 string 数组这是 CSV 文件 48 Snacks that Power Up Weight Loss Aidan B Prince Health Fitness Trave
java.io.IOException: EnsureRemaining: 仅剩余 0 个字节，尝试读取 1

我在 giraph 中的自定义类方面遇到一些问题我制作了 VertexInput 和 Output 格式但总是收到以下错误 java io IOException ensureRemaining Only bytes remaining
无法验证 serde：org.openx.data.jsonserde.jsonserde

我编写了这个查询来在配置单元上创建一个表我的数据最初是 json 格式所以我已经下载并构建了 serde 并添加了它运行所需的所有 jar 但我收到以下错误 FAILED Execution Error return code 1 fr
HBase、Hadoop：如何估计 HBase 表或 Hadoop 文件系统路径的大小？

我有多个 HBase 表如何估计在 java 中使用的表的大致大小一种方法是你必须使用java客户端访问hdfs 通常在 hbase文件夹所有表格信息将在场 Hadoop 外壳你可以检查使用hadoop fs du h path
将 Spark 添加到 Oozie 共享库

默认情况下 Oozie 共享 lib 目录提供 Hive Pig 和 Map Reduce 的库如果我想在 Oozie 上运行 Spark 作业最好将 Spark lib jar 添加到 Oozie 的共享库而不是将它们复制到应用程序
当我将文件存储在 HDFS 中时，它们会被复制吗？

我是 Hadoop 新手当我使用以下方式存储 Excel 文件时hadoop fs putcommoad 它存储在HDFS中复制因子为3 我的问题是是否需要3份并分别存储到3个节点中这是 HDFS 工作的漫画 https docs
覆盖hadoop中的log4j.properties

如何覆盖hadoop中的默认log4j properties 如果我设置 hadoop root logger WARN console 它不会在控制台上打印日志而我想要的是它不应该在日志文件中打印 INFO 我在 jar 中添加了一个
全部配对图表上的所有路径

这可能是一个没有最佳解决方案的问题假设我有一个有向图不知道它是否有循环循环检测将是这个问题的方面之一给定一组顶点可能是数百万个顶点我需要计算给定图的所有唯一对之间的所有不同路径没有重复顶点的路径我该如何应对这种情况让我们看
Spring Tool Suite/Gradle/MapStruct - 找不到映射器的实现

我在 StackOverflow 上搜索了我的问题的答案虽然我找到了许多提供的解决方案但没有一个适合我的情况我必须在工作项目中使用 MapStruct 所以我正在尝试通过教程点 https www tutorialspoint com
Android 应用程序主活动出现 ClassNotFoundException

大多数设备都可以运行我的应用程序但我收到此错误报告 java lang RuntimeException Unable to instantiate activity ComponentInfo com company app com c
ETL informatica 大数据版（非云版）可以连接到 Cloudera Impala 吗？

我们正在尝试在 Informatica 大数据版本不是云版本上进行概念验证我发现我们可能能够使用 HDFS Hive 作为源和目标但我的问题是 Informatica 是否连接到 Cloudera Impala 如果是这样我们是否

随机推荐

django 将 .values_list('datetimefield') 转换为日期

我想将带有日期时间对象的 value list 字段转换为日期对象 values list time finished flat True 给我 2016 03 22T18 52 53 486Z 我想要的是 2016 03 22 谢谢你您
Autofac多次注册组件

在上一个关于如何可视化依赖关系图的问题中 https stackoverflow com a 59247007 1955317我为现在用来可视化我的依赖关系图的代码奠定了基础因为它是由 Autofac 解析的运行代码我得到一棵树生成
为什么java进程使用的内存比预期多得多

系统信息操作系统 archlinux JDK OpenJDK IcedTea 2 4 3 ArchLinux 版本 7 u45 2 4 3 1 x86 64 运行应用程序 https github com aemoncannon ensi
是否可以将观察者添加到tableView.contentOffset？

我需要跟踪 tableView contentOffset y 是否可以将观察者添加到 tableView contentOffset 我认为这是不可能的因为 contentOffset 不继承 NSObject 类还有其他解决办法吗
将递归函数转换为异步 CPS 实现 (javascript)

这是我的功能 function duplicate step through highlighted element jq target jq char cb console log element jq var contents elem
如何在R中手动更改VisNetwork中节点的位置

我的 VisNetwork 遇到问题我在 R 中创建了一个图表每次单击节点并将其移动到其他位置时它都会回到之前的位置是否有可能手动重新安排网络我想将一些节点移动到其他位置或更改一些节点之间的边的长度以便它更加透明至少有两种可能
我从 C 函数读取嵌套 lua 表作为参数是否正确？

我将用C语言实现一个函数该函数将由Lua脚本调用这个函数应该接收一个lua表甚至包含一个数组作为参数所以我应该读取表中的字段我尝试像下面那样做但是当我运行它时我的函数崩溃了谁能帮我找出问题所在吗 function findI
Fedora 24 上的 libicu 和 stringi 导致 R 头痛

我最近升级到 F24 现在在我的 R 会话中我无法加载一些包 sp reshape2 latex2exp knitr 等我发现的最初问题是 F24 使用 libicu56 而这些软件包需要 libicu54 我遵循了一个建议这个线程 ht
如何以编程方式更改 Chrome 中地址栏的字体大小

我想以编程方式更改 Chrome 中地址栏的字体大小因为它对我来说太大了有什么办法可以做到这一点吗通常地址栏的字体大小由操作系统的默认字体大小决定在这里阅读评论 https code google com p chromium i
如何在 Java 中将十六进制字符串转换为字节值

我有一个字符串数组我想将它转换为字节数组我使用Java程序例如 String str aa 55 转换成 byte new byte 0xaa byte 0x55 我能做些什么 String str Your string byte
通过ParentProcessID杀死进程

我想通过其 ParentProcessID 终止正在运行的进程我想像您在命令行中一样执行此操作 wmic process where parentprocessid 3008 terminate 但现在的问题是在 PowerShell
仪表 D3，显示值位置

我正在尝试使用一些现成的 JavaScript 来制作仪表我快到了但我不知道如何管理值标题 Here is how my code works now And this is how I like it to work 不知道如何处理问
在 Apache Spark (Scala) 中使用 reduceByKey

我有一个类型为用户 ID 名称计数的元组列表例如 val x sc parallelize List a b 1 a b 1 c b 1 a d 1 我试图将这个集合简化为一种类型其中每个元素名称被计算在内所以上面的 val
在 Ruby 脚本中重定向 stdout 时出现问题

我有以下测试 Ruby 脚本 require tempfile tempfile Tempfile new test stderr reopen tempfile stdout reopen tempfile puts test stdou
使用特殊字符的 PHP 变量/函数/类名称

我理解下划线是命名变量函数类等的可接受字符但是我想知道是否还有其他可以使用的特殊字符我测试了一些但没有运气并且很长一段时间以来一直假设没有但我想我会看看是否有其他人确切知道这主要是出于美观的目的但是我想在与其他开发人员合
更新列表中的子项会更新 C# 中的所有项

这是我的清单 public class PayRateDaysModel public string day name get set public List
计算字段上的 SSRS 聚合

我正在尝试对 SSRS 中的计算字段执行聚合但收到以下错误 rsAggregateReportItemInBody textrun Textbox43 Paragraphs 0 TextRuns 0 的值表达式在报表项上使用聚合函数聚合
Flask request.remote_addr 在 webfaction 上是错误的并且没有显示真实用户 IP

我刚刚在 Webfaction 上部署了一个 Flask 应用程序我注意到request remote addr总是127 0 0 1 这当然没有多大用处如何在 Webfaction 上的 Flask 中获取用户的真实 IP 地址 Th
Firestore 文档的最大字段数？

现在我有一个products我将产品存储为如下文档的集合文档ID title STRING price NUMBER images ARRAY OF OBJECTS userImages ARRAY OF OBJECTS thumbnai
未找到映射器类

有时我的 MR 工作会抱怨找不到 MyMapper 类我必须给 job setJarByClass MyMapper class 告诉它从我的 jar 文件加载它 cloudera cloudera vm tmp translator h

未找到映射器类

未找到映射器类 的相关文章

随机推荐

热门标签

未找到映射器类的相关文章