映射减少计数示例

2024-04-17

我的问题是关于mapreduce programming in java.

假设我有 WordCount.java 示例，一个标准mapreduce program。我希望map函数收集一些信息，并返回形成如下的reduce函数map：<slaveNode_id,some_info_collected>,

so that I can know what slave node collected what data..知道怎么做吗？

public class WordCount {

    public static class Map extends MapReduceBase implements Mapper<LongWritable, Text, Text, IntWritable> {
      private final static IntWritable one = new IntWritable(1);
      private Text word = new Text();

      public void map(LongWritable key, Text value, OutputCollector<Text, IntWritable> output, Reporter reporter) throws IOException {
        String line = value.toString();
        StringTokenizer tokenizer = new StringTokenizer(line);
        while (tokenizer.hasMoreTokens()) {
          word.set(tokenizer.nextToken());
          output.collect(word, one);
        }
      }
    }

    public static class Reduce extends MapReduceBase implements Reducer<Text, IntWritable, Text, IntWritable> {
      public void reduce(Text key, Iterator<IntWritable> values, OutputCollector<Text, IntWritable> output, Reporter reporter) throws IOException {
        int sum = 0;
        while (values.hasNext()) {
          sum += values.next().get();
        }
        output.collect(key, new IntWritable(sum));
      }
    }

    public static void main(String[] args) throws Exception {
      JobConf conf = new JobConf(WordCount.class);
      conf.setJobName("wordcount");

      conf.setOutputKeyClass(Text.class);
      conf.setOutputValueClass(IntWritable.class);

      conf.setMapperClass(Map.class);
      conf.setCombinerClass(Reduce.class);
      conf.setReducerClass(Reduce.class);

      conf.setInputFormat(TextInputFormat.class);
      conf.setOutputFormat(TextOutputFormat.class);

      FileInputFormat.setInputPaths(conf, new Path(args[0]));
      FileOutputFormat.setOutputPath(conf, new Path(args[1]));

      JobClient.runJob(conf);
    }
}

谢谢你！！

您所要求的是让应用程序（您的地图缩减事物）了解它运行的基础设施。

一般来说，答案是您的应用程序不需要此信息。对Mapper 的每次调用和对Reducer 的每次调用都可以在不同的节点上执行，也可以全部在同一节点上执行。 MapReduce 的美妙之处在于结果是相同的，因此对于您的应用程序：这并不重要。

因此，API 没有功能来支持您的此请求。

祝你学习 Hadoop 愉快:)

附：我能想到的唯一方法（至少可以说是令人讨厌的）是在映射器中包含某种类型的系统调用，并向底层操作系统询问它的名称/属性/等。这种构造将使您的应用程序非常不可移植；即它不会在 Windows 或 Amazon 的 Hadoop 上运行。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

映射减少计数示例的相关文章

相当于 java PBKDF2WithHmacSHA1 的 Python

我的任务是构建一个 API 的使用者该 API 需要带有 UNIX 时间种子值的加密令牌我看到的示例是使用我不熟悉的 Java 实现的在阅读文档和其他堆栈文章后一直无法找到解决方案使用javax crypto SecretKey j
从SQLite列中获取所有数字字符串并进行总和计算

我是 Android 和 SQLite 的新手我在 SQLite 中有一个只有数字的 AMOUNT 列我可以在 ListView 中显示它但我无法找到任何我理解的方法来将它们全部添加并显示在 TextView 中这是数据库助手 im
Eclipse 与 IntelliJ 热部署

我的应用程序配置 Tomcat 8 Spring Spring MVC Hibernate 在 Eclipse 中我创建了 Tomcat 服务器并将我的应用程序添加到资源中 JSP JS CSS 和 JAVA 类热部署的工作原理就是这样
Java中如何对对象数组进行排序？

我的数组不包含任何字符串但它包含对象引用每个对象引用都通过 toString 方法返回名称 id 作者和发布者 public String toString return name n id n author n publisher n
使用起始字符串和结束字符串从长字符串中提取子字符串？

我有这个长字符串它是一个长的连续字符串 Home address H NO 12 SECTOR 12 GAUTAM BUDH NAGAR NOIDA 121212 UTTAR PRADESH INDIA 911112121212 Last
java中%%是什么意思？

我是一名 PHP 程序员想知道这行代码的含义 System out printf exp 3f is 3f n x Math exp x 3f 3f n 和逗号 x 是什么意思它与C类似printf http java sun com
在 Spring Webflux 中执行阻塞 JDBC 调用

我使用 Spring Webflux 和 Spring data jpa 使用 PostgreSql 作为后端数据库我不想在进行数据库调用时阻塞主线程例如find and save 为了实现同样的目标我有一个主调度程序Controll
使用 Microsoft REST API - Java 将 Xbox-Live GamerTag 转换为 XUID

我有一个 Java 应用程序它需要能够获取用户输入的 Minecraft Bedrock Edition 玩家标签并将其转换为给定帐户的 XUID 以便我可以将其存储起来以供稍后列入白名单和参考目的我一直在浏览 Microsoft R
Map：为 Integer 和 Double 类型定义方法，但不为 String 类型定义方法

我正在尝试定义一个方法putIfGreaterThan 为了我的新Map class 给定一个键仅当新值大于旧值时它才会用新值替换旧值我知道我可以通过组合来实现这一点通过有一个private final Map
无法删除临时文件夹（有时）

当我启动应用程序时我创建一个临时文件夹 public static File createTempDir String name throws IOException File tempDir File createTempFile na
如何组合 3 个或更多 CompletionStages？

如果有 2 个 CompletionStages 我可以将它们与thenCombine method CompletionStage a aCompletionStage getA CompletionStage b bCompletion
Java MYSQL/JDBC 查询从缓存的连接返回过时的数据

我一直在 Stackoverflow 中寻找答案但似乎找不到不涉及 Hibernate 或其他数据库包装器的答案我直接通过 Tomcat 6 Java EE 应用程序中的 MYSQL 5 18 JDBC 驱动程序使用 JDBC 我正在缓
如何根据从 jtextfield 和组合框接收的值将数据行添加到 Jtable

我有一个JFrame表格有JTextFields JCombobox等等我能够将这些值接收到变量现在我想将接收到的数据添加到JTable当用户单击添加或类似的操作时在新行中我创造了JTable使用 net beans 的问题是将这
Java/Hibernate - 异常：内部连接池已达到其最大大小，当前没有可用的连接

我第一次在大学项目中使用 Hibernate 而且我还是个新手我想我遵循了我的教授和我阅读的一些教程给出的所有指示但我不断收到标题中的异常 Exception in thread main org hibernate Hibernate
有没有办法删除 JShell 中的导入？

我正在发现 JShell 并且发现默认添加的导入 jshell gt imports import java io import java math import java net import java nio file import j
AWS SQS Batch SendMessageBatchRequest 非常慢

我的应用程序使用 SendMessageBatchRequest 将每个请求发布 10 条消息到 AWS SQS 每条消息的大小小于250字节该应用程序预计每天发布约一百万条记录但要实现这一目标消息发布的速度非常慢 AmazonSQS
在进行堆转储后，如何在发生 OutOfMemoryError 时重新启动 JVM？

我知道关于 XX HeapDumpOnOutOfMemoryError https stackoverflow com q 542979 260805JVM 参数我也知道 XX OnOutOfMemoryError cmd args cm
Java环境变量设置方法

我已将以下行插入 bash profile export GOOGLE APPLICATION CREDENTIALS Users jun Downloads export PATH PATH GOOGLE APPLICATION CRED
在edittext android中插入imageview

我想将 imageview 放在 edittext 中可能吗我检查了 evernote 应用程序它能够将照片放在编辑文本部分我想让我的应用程序完全相同我如何才能将从图库中选择的图像视图放入编辑文本中我首先尝试将 imagevie
为什么我们不能在函数式接口中重载抽象方法？（爪哇）

所以我熟悉java中的函数式接口以及它们与lambda表达式的使用一个函数式接口只能包含一个抽象方法当从 lambda 表达式使用这一孤独方法时您不需要指定其名称因为接口中只有一个抽象方法编译器知道这就是您正在引用的方法 Exa

随机推荐

Django通过最后创建的对象进行反向查询

我有两个模型 class SomeActivity models Model name models ChartField max length 100 class SomeStatus models Model name models C
Maven：在不同源级别上进行编译和测试

我目前正在开发一个将在嵌入式设备上运行的项目该设备运行 Java ME JRE 相当于 Java 1 4 因此 maven 配置为针对源级别和目标级别 1 4 进行编译是否可以在不同的源目标级别上运行 Maven 测试阶段因为这样我
std::string 和 std::wstring 的前向声明

无法转发声明 std string 和 std wstring 的问题经常被讨论据我了解原因是这些类型是模板类 basic string 实例化的类型定义 namespace std typedef basic string
在 Android 中使用带有 post 参数的 HttpClient 和 HttpPost

我正在为一个 Android 应用程序编写代码该应用程序应该获取数据将其打包为 Json 并将其发布到 Web 服务器而 Web 服务器又应该使用 json 进行响应使用 GET 请求工作正常但由于某种原因使用 POST 时所有
如何在 Delphi 2010 中使用 RTTI 设置任意类型的事件处理程序？

读完帖子后如何通过新的 RTTI 设置事件处理程序 https stackoverflow com questions 1482461 how to set event handlers via new rtti d2010 我想知道是否可
ASP.Net MVC 4 在表单提交时设置“onsubmit”

我有以下表格 Html BeginForm ActionMethod Controller FormMethod Post 提交后我想运行一个 Javascript 函数所以我添加了以下内容 Html BeginForm ActionMe
是否可以在不展开调用堆栈的情况下终止 Windows XP 上的 C++ 应用程序？

我的理解是当您在 Windows XP 中通过任务管理器终止 C 应用程序时该应用程序仍然干净地被破坏即调用堆栈将展开并且所有相关的对象析构函数将被调用不知道我这里的理解是否有误是否可以立即终止这样的应用程序而不展开堆栈例如
捕获非本地抛出的异常？

我的问题与 try catch 块的语法行为有关带有 catch 的空 try 块如下所示 void fun try catch Exception e or try catch ArrayIndexOutOfBoundsExcepti
Html.DropDownListFor 未按预期运行 ASP.net MVC

我是 ASP net MVC 的新手在使下拉列表正常工作时遇到问题我有一个强类型视图它尝试使用 Html DropDownListFor 如下所示我使用模型中的属性填充列表如下所示 Public ReadOnly Property
如何在 C++ 运行时组件内的 Windows Phone 8.1 XAML 应用程序中使用 C++ dll

我想在我的 C Windows Phone 8 1 XAML Visual Studio 项目中使用 C DLL 为 Arm x86 编译我创建了一个 C 运行时组件来与我的 C 代码交互此代码需要预编译的 dll 我将 lib 文件添
自定义WinForms按钮不改变图像？

我创建了一个自定义按钮名为 AcceptButton 继承自 System Windows Forms Button 在构造函数上我设置了一些属性但最重要的是一个图像绿色复选标记如下所示 this Image Proyecto C
如何使用 Razor 将部分视图视图模型项目保存在主视图视图模型中？

这可能是一个棘手的问题但就这样吧假设我有一个主视图我们称之为MainView cshtml Now MainView cshtml有一个专用的 ViewModel 称为MainViewModel cs它保存一个变量Model Exam
Corba 事件客户端 ETIMEDOUT

我使用omniOrb 和Python 构建了一个CORBA 事件服务客户端我在使用 Java 客户端时遇到了同样的问题我非常确定我遇到了与这篇文章相同的事情因为我的 strace 看起来非常相似但他没有确切解释他是如何修复它的 Ja
对于 Buffer 等运算符来说，打开和关闭边界的含义是什么？

我不明白需要打开或关闭边界的 Buffer 运算符的重载我指的重载是 public static IObservable
如何使用 python 和 Opencv 计算图像中的点数？

I want to count number of dots in an image The image looks like 我参考了这个 SOF 链接计算图像中的彩色点 https stackoverflow com questions
即使使用stream_set_blocking，PHP SSH2流内容仍为空？

我正在开发一个工具它使用 PECL SSH2 扩展通过 SSH2 从远程主机读取 iptables 配置我能够成功连接到主机进行身份验证并执行命令我遇到的问题是有时该流不包含任何数据 Load the current firewal
TwoSum 算法：如何改进？

我想做一个算法并发现这个问题leetcode http www leetcode com 给定一个整数数组找到两个数字使它们加起来等于特定的目标数字函数twoSum 应返回两个数字的索引以便它们相加达到目标其中index1 必须小
Jython，仅使用 Java 中的 Python 方法？

阅读和使用时本文 http www rexx com dkuhlman jython course 03 html example the jython classes它假设我们有一个完整的对象定义包含类和从 python 到 java
查找日期的两个周期之间重叠的天数

我有两个表每个表都保存日期期间从 date1 到 date2 我将在表1和表2中查找两个日期期间之间的重叠天数 Example table1 id FromDate ToDate 1 2000 01 01 2000 02 04 2 20
映射减少计数示例

我的问题是关于mapreduce programming in java 假设我有 WordCount java 示例一个标准mapreduce program 我希望map函数收集一些信息并返回形成如下的reduce函数map

映射减少计数示例

映射减少计数示例 的相关文章

随机推荐

热门标签

映射减少计数示例的相关文章