Hadoop 类型与映射预期值中的键不匹配文本收到的值 LongWritable

2023-12-03

有人知道为什么我会收到此错误吗？我看过很多其他类似的帖子，但其中大多数不适用于我，我也尝试了发布的一些确实适用于我的解决方案，但它们不起作用，我确信我只是错过了一些愚蠢的东西，谢谢您的帮助

chris@chrisUHadoop:/usr/local/hadoop-1.0.3/build$ hadoop MaxTemperature 1901 output4
12/07/03 17:23:08 WARN mapred.JobClient: Use GenericOptionsParser for parsing the     arguments. Applications should implement Tool for the same.
12/07/03 17:23:08 INFO input.FileInputFormat: Total input paths to process : 1
12/07/03 17:23:08 INFO util.NativeCodeLoader: Loaded the native-hadoop library
12/07/03 17:23:08 WARN snappy.LoadSnappy: Snappy native library not loaded
12/07/03 17:23:09 INFO mapred.JobClient: Running job: job_201207031642_0005
12/07/03 17:23:10 INFO mapred.JobClient:  map 0% reduce 0%
12/07/03 17:23:28 INFO mapred.JobClient: Task Id : attempt_201207031642_0005_m_000000_0, Status : FAILED
java.io.IOException: Type mismatch in key from map: expected org.apache.hadoop.io.Text, recieved org.apache.hadoop.io.LongWritable
at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.collect(MapTask.java:1014)
at org.apache.hadoop.mapred.MapTask$NewOutputCollector.write(MapTask.java:691)
at org.apache.hadoop.mapreduce.TaskInputOutputContext.write(TaskInputOutputContext.java:80)
at org.apache.hadoop.mapreduce.Mapper.map(Mapper.java:124)
at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:144)
at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:764)
at org.apache.hadoop.mapred.MapTask.run(MapTask.java:370)
at org.apache.hadoop.mapred.Child$4.run(Child.java:255)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:415)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1121)
at org.apache.hadoop.mapred.Child.main(Child.java:249)

Program:

import java.io.IOException;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

public class MaxTemperatureMapper extends Mapper<LongWritable, Text, Text, IntWritable>{

private static final int MISSING = 9999;

@Override
public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException
{
    String line = value.toString();
    String year = line.substring(15,19);
    int airTemperature;
    if (line.charAt(87) == '+')
    {
        airTemperature = Integer.parseInt(line.substring(88,92));
    }
    else
    {
        airTemperature = Integer.parseInt(line.substring(87,92));
    }
    String quality = line.substring(92,93);
    if (airTemperature != MISSING && quality.matches("[01459]"))
    {
        context.write(new Text(year), new IntWritable(airTemperature));
    }
}

}

import java.io.IOException;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

public class MaxTemperatureReducer extends Reducer<Text, IntWritable, Text, IntWritable>
{
@Override
public void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException
{
    int maxValue = Integer.MIN_VALUE;
    for (IntWritable value : values)
    {
        maxValue = Math.max(maxValue, value.get());
    }
    context.write(key, new IntWritable(maxValue));
}
}

import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class MaxTemperature 
{

public static void main(String[] args) throws Exception 
{
    if (args.length != 2)
    {
        System.out.println("Usage: MaxTemperature <input path> <output path>");
        System.exit(-1);
    }

    Job job = new Job();
    job.setJarByClass(MaxTemperature.class);
    job.setJobName("Max temperature");

    FileInputFormat.addInputPath(job, new Path(args[0]));
    FileOutputFormat.setOutputPath(job, new Path(args[1]));

    job.setOutputKeyClass(Text.class);
    job.setOutputValueClass(IntWritable.class);

    System.exit(job.waitForCompletion(true) ? 0 : 1);

}
}

您似乎缺少一些配置属性：

Mapper 和Reducer 类？ - 如果未定义，您将默认使用“身份”映射器/减速器

您的具体错误消息是因为身份映射器仅输出与传入的键/值类型相同的键/值类型，在本例中可能是 LongWritable 类型的键和 Text 类型的值（因为您尚未定义输入格式，默认值为可能是 TextInputFormat）。在您的配置中，您已将输出键类型定义为 Text，但映射器正在输出 LongWritable，因此会出现错误消息。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop

Hadoop 类型与映射预期值中的键不匹配文本收到的值 LongWritable 的相关文章

HBase 作为 Web 应用程序后端

任何人都可以建议将 HBase 作为基于 Web 的应用程序的主要数据源是否是一个好主意我主要关心的是 HBase 对查询的响应时间是否有可能实现亚秒级响应编辑有关应用程序本身的更多详细信息数据量约500GB文本数据预计很快将
如何在 Hive 中将字符串转换为毫秒时间戳

我有一个字符串 20141014123456789 它代表一个毫秒时间戳我需要将其转换为 Hive 中的时间戳 0 13 0 而不丢失毫秒我尝试了这个但 unix timestamp 返回一个整数所以我丢失了毫秒 from unix
将文件夹名称添加到输出 Pig Latin

我在 HDFS 中有下一个目录结构 logs folder 2021 03 01 log1 log2 log3 2021 03 02 log1 log2 2021 03 03 log1 log2 日志由文本数据组成数据中没有日期因为它已
如何获取hive中的数据库用户名和密码

正在编写jdbc程序来连接hive数据库我希望在连接 url 中提供用户名和密码我不知道如何使用 hive QL 获取用户名和密码有人可以帮我吗 Exception in thread main java sql SQLNonTran
Hive：转换“yyyy-MM-dd'T'HH:mm:ss.SSS'Z'”中缺少秒数的字符串日期时间

我使用以下代码将字符串日期时间变量转换为日期时间但转换后的字符串缺少 SSS 部分使用的代码 cast FROM UNIXTIME UNIX TIMESTAMP oldtime yyyy MM dd T HH mm ss SSS Z y
HDFS 在大量小文件和 128 Mb 块大小上的行为

我有很多多达数十万个小文件每个文件 10 100 Kb 我的 HDFS 块大小等于 128 MB 我的复制因子等于 1 为每个小文件分配 HDFS 块有什么缺点吗我见过相当矛盾的答案答案说最小的文件占用整个块 https stac
Hadoop 构建在 Windows 中失败：native.sln 中缺少 zconf.h？

我正在尝试在使用 Windows 10 家庭版的开发计算机上构建以下 hadoop 版本 hadoop 2 7 3 src 以下是我本地开发环境的详细信息 Windows 10家庭版英特尔酷睿 i5 6200U CPU 2 30GHz 内
如何为 HDFS 递归列出子目录？

我在 HDFS 中递归创建了一组目录如何列出所有目录对于普通的 UNIX 文件系统我可以使用以下命令来做到这一点 find path type d print 但我想为 HDFS 得到类似的东西递归列出目录内容hadoop dfs
在 Zookeeper 中创建路径的最有效方法，其中路径的根元素可能存在也可能不存在？

想象一条路径 root child1 child2 child3 想象一下在动物园管理员中可能存在其中的一部分比如 root child1 Zookeeper 中没有等效的 mkdir p 此外如果任何一个操作失败 ZooKeepe
使用自制软件安装hadoop时出错

我正在尝试在 Mac 上本地安装 hadoop 但在尝试 brew install hadoop 时收到以下错误 brew install hadoop gt Downloading http www apache org dyn clos
Hive 上的自定义 MapReduce 程序，规则是什么？输入和输出怎么样？

我被困了几天因为我想根据我在 hive 上的查询创建一个自定义的地图缩减程序在谷歌搜索后我发现没有太多例子而且我仍然对规则感到困惑创建自定义 MapReduce 程序的规则是什么映射器和减速器类怎么样任何人都可以提供任何解决方案
Hive如何存储数据，什么是SerDe？

当查询表时 SerDe 将将文件中的字节中的一行数据反序列化为 Hive 内部使用的对象来操作该行数据执行 INSERT 或 CTAS 时请参阅第 441 页上的导入数据表的 SerDe 将将 Hive 的一行数据的内部表示序列化为
Hadoop setInputPathFilter错误

我正在使用 Hadoop 0 20 2 无法更改并且我想向我的输入路径添加一个过滤器数据如下 path1 test a1 path1 test a2 path1 train a1 path1 train a2 我只想处理所有文件trai
无法使用 PDI 步骤连接到 HDFS

我已经配置成功了Hadoop 2 4 in an Ubuntu 14 04 虚拟机 from a 视窗8系统 Hadoop 安装工作绝对正常而且我还可以从 Windows 浏览器查看 Namenode 附图如下所以我的主机名是 ubu
是否值得购买 Mahout in Action 以跟上 Mahout 的速度，或者还有其他更好的来源吗？

我目前是一个非常随意的用户阿帕奇马胡特 http mahout apache org 我正在考虑购买这本书象夫在行动 http www manning com owen 不幸的是我很难理解这本书的价值并且认为它是一本曼宁早期访问计划 h
Hadoop安装问题：

我跟着this http www bogotobogo com Hadoop BigData hadoop Install on ubuntu single node cluster phpHadoop 安装教程不幸的是当我运行全部启动
将日期字符串转换为“MM/DD/YY”格式

我刚刚看到这个例子我该如何解决这个问题 Hive 元存储包含一个名为 Problem1 的数据库其中包含一个名为 customer 的表 customer 表包含 9000 万条客户记录 90 000 000 每条记录都有一个生日字段
Namenode高可用客户端请求

谁能告诉我如果我使用java应用程序请求一些文件上传下载操作到带有Namenode HA设置的HDFS 这个请求首先去哪里我的意思是客户端如何知道哪个名称节点处于活动状态如果您提供一些工作流程类型图或详细解释请求步骤从开始到结束
获取行 HBase 的特定列族中的列

我正在编写一个应用程序通过 JSP 显示 HBase 中特定表中的数据我想获取一行的特定列族中的所有列有什么办法可以做到这一点吗 public String getColumnsInColumnFamily Result r Stri
猪参考

我正在学习 Hadoop Pig 并且我总是坚持引用元素请查找下面的示例 groupwordcount group chararray words bag of tokenTuples from line token chararray

随机推荐

如何通过 p:ajax 使用 OmniFaces Ajax.updateColumn() 或 Ajax.updateRow()

我正在尝试使用 OmniFaces 1 3 SNAPSHOT Ajax 实用程序的 Ajax updateColumn 方法更具体地说我想使用 Ajax updateColumn table 1 替换使用 p ajax update p
如何在 Jenkins 管道中使用 Active Choices Reactive 参考参数(jenkinsfile)

我想要实现图3 如果不需要更新给默认值如果需要更新则给用户输入区域我想在 Jenkins 管道代码中使用主动反应参考而不是 jenkins GUI 检查了example 但用户不能自己输入值只能提供选择正如我们所看到的 Jen
print 函数中的结束逗号有什么用？ [复制]

这个问题在这里已经有答案了这段代码来自http docs python org 2 tutorial errors html predefined clean up actions with open myfile txt as f fo
我可以仅使用 CSS 为 bootstrap 图标添加颜色吗？

Twitter 的引导程序使用 Glyphicons 的 Icons 他们是 available in dark gray and white 默认情况下是否可以使用一些 CSS 技巧来改变图标的颜色我希望 css3 能有一些其他的优
给定日期时间的年龄（以年为单位，具有小数精度）

如何在 C 日期时间中获取给出出生日期的人的年龄我想要一个精确的年龄比如 40 69 岁这将计算出准确的年龄年龄的小数部分是相对于上一个生日和下一个生日之间的天数来计算的因此它将正确处理闰年小数部分在一年中是线性的并且不考虑月
如何在实体框架中为不同用户使用不同的连接字符串

我有一个要求我需要为不同的用户提供不同的连接字符串我们的想法是拥有username and password在登录屏幕上提供用作username and password连接字符串的从而使应用程序为不同的用户使用不同的连接字符串并
sqlite3 c/c++，获取聚合查询涉及的表名

我在 C 项目中使用 sqlite 我希望能够获取查询中涉及的表名 Ex SELECT FROM Employee 应该返回Employee 现在我使用成功了qlite3 column table name doc 对于此类查询但对于聚合
VB.NET 中令人困惑的逻辑运算符

我正在使用用 VB 编写的遗留代码库并且遇到了一个我不理解的条件运算符并且无法弄清楚要搜索什么来解决它我正在处理的是以下代码和结果为 true 的变量我不明白的具体部分是 1 第一个之间的关系X和第一个括号 2 2 的作用X lt
jq：传递不带引号的字符串参数

我想传递一个不带引号的参数 JQ arg 默认情况下有双引号因为它应该用作过滤器例如 propt properties final jq r c arg p propt p sample json echo final 样本 json
Scala 柯里化与部分应用函数

我意识到这里有几个问题what柯里化和部分应用函数是但我问的是它们有何不同作为一个简单的例子下面是一个用于查找偶数的柯里化函数 def filter xs List Int p Int gt Boolean List Int if x
AS3 - 如何使用鼠标事件的像素/点检测而不是对象检测

这看起来应该很容易我都不好意思问但我就是不明白我有一个大的圆形 MovieClip 用作按钮该影片剪辑包含具有透明背景的PNG插入到影片剪辑中由于其尺寸四个角边界框上有较大的空白注册区域如何让鼠标注册为仅位于圆形像素上方
我需要在 ASP.Net core Web API 的验证属性中返回自定义的验证结果（响应）

我需要在 ASP Net core Web API 中返回自定义的验证结果响应失效属性这是我创建的 ValidationAttribute class MaxResultsAttribute ValidationAttribute p
如何单独更改按钮 pygame 上文本的不透明度？

我下面有以下代码它是从另一篇文章中获取的按钮的类我想知道是否可以更改按钮背景的不透明度而不更改其上文本的不透明度我怎样才能实现这个目标 Code import pygame pygame init font pygame font S
如何读取 zip 存档中的单个文件

我需要读取 zip 文件内的单个文件 test txt 的内容整个 zip 文件是一个非常大的文件 2GB 并且包含很多文件 10 000 000 因此提取整个文件对我来说不是一个可行的解决方案如何读取单个文件尝试使用zip wrap
使用 css 在上设置强制宽度，该宽度位于下，使用 colspan 而不使用 colgroup

我想设置宽度td in tbody在下面thead th有一个colspan 2 具有硬定义的列宽以为单位如果单元格内容超出浏览器外壳不会动态调整表格宽度 sample width 100 table layout fixed sa
如何在 CakePHP 2.0 中发送带有附件的电子邮件？

我正在尝试使用 CakePHP 2 0 发送一封带有附件的电子邮件该文件由用户通过表单提交到目前为止我有 App uses CakeEmail Network Email email new CakeEmail email gt att
使用 handler.postDelayed 获取剩余时间

我在用handler postDelayed为某些动画内容创建一些延迟的方法像这样 Handler h new Handler h postDelayed new Runnable Override public void run Sta
如何在 foreach 循环中删除 xmlnode？

在下面的代码中我使用 foreach 循环来检查节点列表中的每个节点并删除其中的一些节点删除一个节点后 foreach 循环抛出以下错误元素列表已更改枚举操作无法继续我怎样才能避免它 public static XmlNodeLi
在C中使用紧凑指针寻址二维数组的元素[关闭]

Closed 这个问题需要调试细节目前不接受答案我正在使用 C 实现莫尔斯电码并遇到一些基础知识基本思想是我有 A 到 Z 的二维字符数组每个数组的第一个元素是一个字母表后跟相应的莫尔斯电码程序将接收一个字符一旦找到匹配项该
Hadoop 类型与映射预期值中的键不匹配文本收到的值 LongWritable

有人知道为什么我会收到此错误吗我看过很多其他类似的帖子但其中大多数不适用于我我也尝试了发布的一些确实适用于我的解决方案但它们不起作用我确信我只是错过了一些愚蠢的东西谢谢您的帮助 chris chrisUHadoop usr lo

Hadoop 类型与映射预期值中的键不匹配文本收到的值 LongWritable

Hadoop 类型与映射预期值中的键不匹配文本收到的值 LongWritable 的相关文章

随机推荐

热门标签