Eclipse本地运行与远程提交MapReduce程序的步骤详解

2023-05-16

1.下载eclipse插件

此插件只是方便我们在eclipse上查看hdfs集群上的数据而已。

1.1 下载对应版本的 hadoop-eclipse-plugin-XXX.jar

并将其复制到eclipse下的plugin的目录下,最后重启eclipse。 完成后会看到eclipse的 Window-->Show View-->Other  窗口   多了这么个东西

1.2配置hadoop location参数




2.下载hadoop在windows平台编译后的包

若你有linux的hadoop包,则还需要将linux版的lib和bin目录替换成windows平台编译的版本,其bin目录下一定得有winutils.exe这个文件

2.1 下载完成后得配置环境变量参数

HADOOP_HOME:
注意 HADOOP_HOME是在系统变量里配置
PATH:
完成之后在windows命令行中输入hadoop,出现如下提示则表明安装成功



3.测试效果

将本地hadoop目录下的 etc/log4j.properties文件放置于eclipse工程src下。
我测试的程序是气温最高最低值的统计。

3.1通过eclipse查看hdfs集群状态

切换到mapreduce模式
看直接查看

3.2测试用eclipse往集群上提交程序

1)读取/climate/input/ 下的所有数据 将最后结果输出到/climate/output/下
2)编写好Mapper、Reducer继承类 和Driver类的main方法
Driver代码
	public static void main(String[] args) throws Exception{
		Configuration conf = new Configuration();
		Job job = Job.getInstance(conf);
		
		job.setJarByClass(ClimateTemperature.class);
		job.setMapperClass(ClimateTemperatureMapper.class);
		job.setReducerClass(ClimateTemperatureReducer.class);
		
		job.setMapOutputKeyClass(Text.class);
		job.setMapOutputValueClass(IntWritable.class);
		job.setOutputKeyClass(Text.class);
		job.setOutputValueClass(ClimateBean.class);
		
		Path outPath = new Path(args[1]);
		FileSystem fs = FileSystem.get(conf);
		if(fs.exists(outPath )){
			fs.delete(outPath, true);
		}
		
		FileInputFormat.setInputPaths(job, new Path(args[0]));
		FileOutputFormat.setOutputPath(job, outPath);
		
		boolean res = job.waitForCompletion(true);
		System.exit(res?0:1);
	}
3)配置main方法接收参数
4)直接run main
远程提交成功!

3.3测试用eclipse直接跑本地程序

1)首先将java文件导出成普通jar包到E盘,再在G盘新建climate/input  并把数据手动放入至此文件夹
2)而后修改main方法里的某些参数
3)配置main方法接收参数
4)直接run main方法
本地运行成功!
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Eclipse本地运行与远程提交MapReduce程序的步骤详解 的相关文章

  • ubuntu更改默认启动项顺序

    ubuntu更改默认启动项顺序 因为经常需要在ubuntu下调试openstack代码 xff0c 在windows下用虚拟机又会严重影响使用性能 xff0c 所以干脆将笔记本装了windows 43 ubuntu双系统 xff0c 曾多次
  • tensorflow学习笔记(十九):分布式Tensorflow

    最近在学习怎么分布式Tensorflow训练深度学习模型 看官网教程看的云里雾里 最终结合着其它资料 终于对分布式Tensorflow有了些初步了解 gRPC google remote procedure call 分布式Tensorfl
  • gcc安装教程(windows版本)

    windows下的gcc有两个版本mingw和cygwin xff0c 二选一就好 已学会C 43 43 xff0c 做工程 xff0c 建议用mingw 用cygwin编译后的二进制码在别人机器上用不了 xff0c 因为其他人的机器没有c
  • 华为以太网链路聚合Eth-Trunk实验

    链路聚合Eth Trunk 什么是链路聚合 xff1f 原理基本术语聚合模式负载分担的逐流转发和逐包转发负载分担的延伸链路聚合实验一 手工聚合链路聚合实验二 LACP STATIC聚合链路聚合实验的疑问思考补充 xff0c 三层Eth Tr
  • 关于Linux 下的错误路由产生火星包的问题

    关于linux下的错误路由产生火星包的问题 错误原理 linux 下的route表 xff0c 不仅负责包的转发路径选择 xff0c 还负责检验包的来源的合理性 xff0c 比如 ip r default via 10 0 2 2 dev
  • 配置SSH的对等性

    在所有节点配置SSH的对等性 在安装Oracle Real Application clusters之前 必须先配置所有节点的SSH对等性 因为在安装过程种Oracle Universal Installer 使用ssh和scp命令执行远程
  • apt-get下载安装本地包

    一 使用场景 xff1a Ubuntu系统 1 Computer A不能上网 xff0c 需通过Computer B将安装包下载后 xff0c 拷贝给Computer A进行本地安装 前提是 xff0c 2台机器上的操作系统环境相同 2 也
  • sklearn专题六:聚类算法K-Means

    目录 1 概述 1 1 无监督学习与聚类算法 1 2 sklearn中的聚类算法 2 KMeans 2 1 KMeans是如何工作的 2 2 簇内误差平方和的定义和解惑 2 3 KMeans算法的时间复杂度 3 sklearn cluste
  • 查找某个导师(博导、硕导)所带学生的学位论文的步骤

    怎么查找某个导师 xff08 博导 硕导 xff09 所带学生的学位论文呢 xff1f 一般经过这几个步骤就能找到 xff1a 第一步 xff1a 在浏览器中输入网址https www cnki net xff0c 进入中国知网 第二步 x
  • 我的三色2016

    2016年于我来讲是无疑是迄今为止最为多彩与丰富的一年 xff0c 在这一年里我完成了从象牙塔到职场的过渡 xff0c 经历过迷茫 xff0c 遭受过歧视 xff0c 遇到过挑战 xff0c 好在上帝虽然关闭了所有的门却为我 打开了一道窗
  • 图像处理之Haar特征

    Haar like 特征是计算机视觉领域一种常用的特征描述算子 也称为 Haar 特征 xff0c 这是因为 Haar like 是受到一维 haar 小波的启示而发明的 所以称为类 Haar 特征 xff0c 后来又将 Haar like
  • 任意大小汉字点阵字库(字模)的制作与生成 单片机GUI/STemwin

    1 首先介绍一下汉字点阵在汉字库中的地址计算公式 xff1a 汉字库种类繁多 xff0c 但都是按照 区位的顺序 排列的 前一个字节为该汉字的区号 xff0c 后一个字节为该字的位号 每一个区记录94个汉字 xff0c 位号则为该字在该区中
  • ubuntu下ifconfig找不到命令,packege ‘net-tools‘ has no installation candidate

    PS xff1a 首先要将网络适配器设置为NAT模式 刚用虚拟机安装完ubuntu后 xff0c 实用ifconfig提示找不到命令 xff1a 用sudo apt install net tools也提示错误 xff1a Package
  • caffe+opencv linux安装

    有gpu http blog csdn net leijiezhang article details 53688157 仅CPU http blog csdn net u010402483 article details 51506616
  • Deep learning系列(十五)有监督和无监督训练

    1 前言 在学习深度学习的过程中 xff0c 主要参考了四份资料 xff1a 台湾大学的机器学习技法公开课 xff1b Andrew NG的深度学习教程 xff1b Li feifei的CNN教程 xff1b caffe官网的教程 xff1
  • c++ item

    C 43 43 书单 xff1a 1 第一本 基础好一些的 xff0c 可以看Stanley B Lippman的C 43 43 Primer xff0c 基础不太好的话 xff0c 可以看Stanley B Lippman的 Essent
  • 链表基础知识总结

    链表和数组作为算法中的两个基本数据结构 xff0c 在程序设计过程中经常用到 尽管两种结构都可以用来存储一系列的数据 xff0c 但又各有各的特点 数组的优势 xff0c 在于可以方便的遍历查找需要的数据 在查询数组指定位置 xff08 如
  • 关系型 和 非关系型 数据库使用场景

    面试 xff1a 你懂什么是分布式系统吗 xff1f Redis分布式锁都不会 xff1f gt gt gt 关系型数据库优点 SQL方便在多个表之间 做非常复杂的数据查询事务支持 安全性能高 关系型数据库缺点 不擅长大量数据的写入处理不擅
  • Dont't recreate the sequence! You would invalidate all independent objects and l

    原文出处 xff1a https community oracle com message 4016489 4016489 Dont 39 t recreate the sequence You would invalidate all i
  • June 11th 模拟赛C T1 Sandcas Solution

    空降题目处 点我点我点我 Description FJ居住的城堡有N个城墙 1 lt 61 N lt 61 25 000 xff0c 编号为1到N xff0c 每个城墙的高度为M i 1 lt 61 M i lt 61 100 000 xf

随机推荐