hadoop实践（五）win10+eclipse+hadoop2.6.4 开发环境

2023-11-04

本人环境为win10（才从win7升级）

eclipse是 Kepler Service Release 1

在win10下，安装了vm workstation，其上安装了centos6.5 ，并在上面部署了hadoop2.6.4的伪分布式安装

一、目标

设置win10下的eclipse开发环境，并且可以在此环境上开发hadoop应用，并在伪分布式hadoop环境下测试。

二、准备

1、eclipse （ Kepler Service Release 1）

2、 hadoop2.6.4

3、 hadoop.dll 和 winutils

4、 wordcount 代码

5、 wordcount 所需要的统计单词的文本源

6、 hadoop for eclipse的插件，本人使用的插件为 hadoop-eclipse-plugin-2.6.4.jar

三、环境搭建步骤

1、将hadoop2.6.4解压在win10系统的任意目录下。（就是为了配置eclipse用，实际联调的时候，是连接linux 虚机上的伪分布式hadoop）

2、设置win10的环境变量，通过控制面板-》系统-》高级设置-》环境变量需要设置如下几个环境变量，已本人机器为例：

JAVA_HOME=C:\Program Files (x86)\Java\jre6\bin

HADOOP_HOME=E:\cwqwork\develop\hadoop-2.6.4

path 增加最后 E:\cwqwork\develop\hadoop-2.6.4\bin

3、拷贝插件到 eclipse安装目录下的plugsin目录

4、启动eclipse， windows-》hadoop Map/Reduce

在 hadoop installation directory 里面，填入前面第1步解压的目录，点击OK

5、界面最右边新出先的 Map/Reduce标签点中，在最左边Project Explorer 会出现 DFS Locations。

界面最右下角有个蓝色小象，点击后，设置 hadoop location

6、上面设置好后，就可以一层一层浏览 DFS Locations。这里显示的是 linux下hadoop的dfs系统

四、测试工程代码

1、新建工程，选other -》map reduce project，然后输入工程名称等等，建立新的工程

2、创建 WordCount 类

代码如下：

import java.io.IOException;
import java.util.StringTokenizer;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;

public class WordCount {

  public static class TokenizerMapper 
       extends Mapper<Object, Text, Text, IntWritable>{

    private final static IntWritable one = new IntWritable(1);
    private Text word = new Text();

    public void map(Object key, Text value, Context context
                    ) throws IOException, InterruptedException {
      StringTokenizer itr = new StringTokenizer(value.toString());
      while (itr.hasMoreTokens()) {
        word.set(itr.nextToken());
        context.write(word, one);
      }
    }
  }

  public static class IntSumReducer 
       extends Reducer<Text,IntWritable,Text,IntWritable> {
    private IntWritable result = new IntWritable();

    public void reduce(Text key, Iterable<IntWritable> values, 
                       Context context
                       ) throws IOException, InterruptedException {
      int sum = 0;
      for (IntWritable val : values) {
        sum += val.get();
      }
      result.set(sum);
      context.write(key, result);
    }
  }

  public static void main(String[] args) throws Exception {
    Configuration conf = new Configuration();
    //conf.set("mapred.job.tracker","192.168.136.155:9001" );
    //conf.set("fs.default.name","192.168.136.155:9000" );
    
    String[] otherArgs = new GenericOptionsParser(conf, args).getRemainingArgs();
   
    if (otherArgs.length != 2) {
      System.err.println("Usage: wordcount <in> <out>");
      System.exit(2);
    }
    System.out.println ("Usage: wordcount <in> <out>" + otherArgs[0] +"  "+ otherArgs[1] );
    
    Job job = new Job(conf, "wordcount");
    job.setJarByClass(WordCount.class);
    job.setMapperClass(TokenizerMapper.class);
    job.setCombinerClass(IntSumReducer.class);
    job.setReducerClass(IntSumReducer.class);
    job.setOutputKeyClass(Text.class);
    job.setOutputValueClass(IntWritable.class);
    FileInputFormat.addInputPath(job, new Path(otherArgs[0]));
    FileOutputFormat.setOutputPath(job, new Path(otherArgs[1]));
    
    System.out.println ("add input path:" + otherArgs[0]);    
    System.out.println ("set output path:" + otherArgs[1]); 
    System.out.println ("begin wait job completion");
    
    job.waitForCompletion(true);  
  }
}

创建完成后，在linux 虚机上导入需要统计的文本

文本1：Hello world Hello me! cwq solo

文本2： Hello world Hello you! solo

在linux 目录 /opt/hadoop/input/wordcount 下：

echo "Hello world Hello me! cwq solo" >test1.txt

echo " Hello world Hello you! solo" >test2.txt

hadoop fs -put /opt/hadoop/input/wordcount input

3、完成后，在类上右键-》run configuration-》输入参数

hdfs://192.168.136.155:9000/user/hadoop/input/wordcount hdfs://192.168.136.155:9000/user/hadoop/output/wordcount

输入后，不要执行。

然后，用run on hadoop 方式执行。

4、正常情况下，会报异常：

Exception in thread "main" java.lang.NullPointerException
at java.lang.ProcessBuilder.start(ProcessBuilder.java:441)
at org.apache.hadoop.util.Shell.runCommand(Shell.java:445)
at org.apache.hadoop.util.Shell.run(Shell.java:418)

原因是，没有安装补丁。将 hadoop.dll 和 winutils 拷贝到 win10上hadoop目录下bin目录。

5、再次运行，没有异常，但是运行结束，查看dfs 没有output结果， console没有输出异常。这里纠结很久。

解决办法：在src 目录下，建立log.properities文件，使得log4j 可以打印

                 log4j.rootLogger=debug,stdout,R
                 log4j.appender.stdout=org.apache.log4j.ConsoleAppender
                 log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
                 log4j.appender.stdout.layout.ConversionPattern=%5p - %m%n
                 log4j.appender.R=org.apache.log4j.RollingFileAppender
                 log4j.appender.R.File=mapreduce_test.log
                 log4j.appender.R.MaxFileSize=1MB
                 log4j.appender.R.MaxBackupIndex=1
                 log4j.appender.R.layout=org.apache.log4j.PatternLayout
                 log4j.appender.R.layout.ConversionPattern=%p %t %c - %m%
                 log4j.logger.com.codefutures=DEBUG

6、再次运行，console打印会有error

WARN - job_local194089354_0001
org.apache.hadoop.security.AccessControlException: Permission denied: user=Administrator, access=WRITE, inode="/user/hadoop/output":hadoop:supergroup:drwxr-xr-x
at org.apache.hadoop.hdfs.server.namenode.FSPermissionChecker.checkFsPermission(FSPermissionChecker.java:271)

说明是权限问题， eclipse是用Administrator启动的，连接linux下的hadoop是用此用户，所以权限禁止。

解决办法：

1）、如果是测试环境，可以取消hadoop hdfs的用户权限检查。打开conf/hdfs-site.xml，找到dfs.permissions属性修改为false（默认为true）OK了。
2）、修改hadoop location参数，在advanced parameter选项卡中，找到hadoop.job.ugi项，将此项改为启动hadoop的用户名即可
3）、修改window 机器的用户名为 hadoop 用户名。

7、执行，这次正确执行完成，console 不报告错误， dfs location 右键 -》reconnect -》一层一层点开，最后output 目录下看到统计单词结果。

Hello 4
cwq 1
me! 1
solo 2
world 2
you! 1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

hadoop实践（五）win10+eclipse+hadoop2.6.4 开发环境的相关文章

如何在 Eclipse 中引用不同的 Java 项目

我有项目1和项目2 Project1 依赖于 Project2 我有点厌倦了每次在 Project2 中进行一些代码更改时我都必须导出 Project2 JAR 文件并将其复制到 Project1 的 lib 文件夹中有没有办法自动
Spark 写入 hdfs 无法使用 saveAsNewAPIHadoopFile 方法

我在 CDH 5 2 0 上使用 Spark 1 1 0 并试图确保我可以读取和写入 hdfs 我很快意识到 textFile 和 saveAsTextFile 调用旧的 api 并且似乎与我们的 hdfs 版本不兼容 def testHD
try-with-resources 中出现死代码警告，但翻译后的 try-catch-finally 中没有出现死代码警告

以下代码使用try 有资源 https docs oracle com javase specs jls se7 html jls 14 html jls 14 20 3Java 8 中引入的构造偶尔抛出方法被声明为抛出一个偶尔的异常
java.lang.ClassNotFoundException：找不到类 org.apache.hadoop.fs.azurebfs.SecureAzureBlobFileSystem

我是 Spark 和 Kubernetes 世界的新手我使用 docker image tool sh 实用程序使用与 Hadoop 3 2 捆绑在一起的官方 Spark 3 0 1 构建了 Spark docker 映像我还为 Jup
按下按钮时清除编辑文本焦点并隐藏键盘

我正在制作一个带有编辑文本和按钮的应用程序当我在 edittext 中输入内容然后单击按钮时我希望键盘和焦点在 edittext 上消失但我似乎无法做到这一点我在 XML 中插入了这两行代码 android focusable tr
如何在 Eclipse 中更改动态 Web 项目的上下文根？

我在 Eclipse 中开发了一个动态 Web 项目我可以使用以下 URL 通过浏览器访问该应用程序 http localhost 8080 MyDynamicWebApp 我想将访问URL更改为 http localhost 8080
使用字符串数组在 Hive 表上加载 CSV 文件

我正在尝试将 CSV 文件插入 Hive 其中一个字段是 string 数组这是 CSV 文件 48 Snacks that Power Up Weight Loss Aidan B Prince Health Fitness Trave
Eclipse 类型提案从 3.4 更改为 3.5 - 可配置吗？

If I already have the types imported in Eclipse 3 4 I get concrete default classes but in 3 5 I just get the interface f
JDK 8 - “无法解析类型 java.util.Map$Entry”[重复]

这个问题在这里已经有答案了我尝试使用 HashMap 但收到错误无法解析类型 java util Map Entry 它是从所需的 class 文件间接引用的我正在使用 JDK 8 和 Eclipse 有人知道为什么吗 My code
仅在 1.8 或更高版本的源级别允许使用 Lambda

我的 Eclipse 版本为 1 8 mars 2 版本并且我将compliance java 级别设置为 1 8 如下所示但我仍然收到错误 Lambda 仅允许在源级别 1 8 或更高版本 You also nend to set y
java.lang.UnsatisfiedLinkError：java.library.path中没有opencv_java2411

我正在尝试将 opencv 添加到我的 Spring Boot Maven 项目中为了使用 opencv 库我必须在 java library path 中提供本机库我已将以下命令添加到 Eclipse VM 参数中 Djava li
无法验证 serde：org.openx.data.jsonserde.jsonserde

我编写了这个查询来在配置单元上创建一个表我的数据最初是 json 格式所以我已经下载并构建了 serde 并添加了它运行所需的所有 jar 但我收到以下错误 FAILED Execution Error return code 1 fr
如何直接将一个mapper-reducer的输出发送到另一个mapper-reducer而不将输出保存到hdfs中

问题最终解决检查底部的我的解决方案最近我尝试运行 Mahout in Action 的第 6 章列表 6 1 6 4 中的推荐示例但我遇到了一个问题我用谷歌搜索但找不到解决方案问题是我有一对映射器减速器 public fina
如何根据条件禁用 TestNG 测试

目前有没有办法根据条件禁用 TestNG 测试我知道您当前可以在 TestNG 中禁用测试 Test enabled false group blah public void testCurrency 我想根据条件禁用相同的测试但不知道
应用程序正在等待调试器附加

我正在 Eclipse 中开发一个 Android 应用程序当我尝试在三星选项卡上进行调试时我在屏幕上收到以下消息等待调试器并在其下方写着应用程序 xxx 正在等待调试器附加我做了一些搜索发现查看目标sdk 重新启动 ecl
如何为 eclipse PHP 调试设置正确的 URL

我在使用非标准 URL 在 Eclipse 中设置 PHP 调试时遇到问题我的应用程序的 URL 必须是http xxx index php http xxx index php 这是我无法轻易改变的我在设置调试配置来调用此 URL 时
Hadoop Windows 设置。运行 WordCountJob 时出错：“任何本地目录中都没有可用空间”

我正在按照此视频教程尝试在我的计算机上设置 hadoop 如何在 Windows 10 上安装 Hadoop https www youtube com watch v zujpglKP0Nw 我已经成功设置它从 sbin 目录执行 st
在 Linux 上，在 Eclipse CDT 中使用 gdb 调试 C++ 应用程序，如何向 stdin 输入内容？

在 Linux 上我尝试在 Eclipse CDT 中使用 gdb 调试 C 应用程序例如应用程序applic exe接受一些命令行参数arg1 and arg2它期望一些数据stdin 比如说取自文件input txt 通常要在控
从 Android 函数更新 Textview

有人可以告诉我如何从函数更新 Android Textview 控件吗我在互联网上进行了深入搜索看到很多人都问同样的问题我测试了线程但无法工作有人有一个简单的工作示例吗例如调用一个函数在循环中运行多次并且该函数在 TextV
从 Eclipse 的历史视图中删除 ORIG_HEAD 和 FETCH_HEAD

我最近开始使用 Eclipse Kepler 和 EGit 插件这些分支不是我习惯的有没有办法永久阻止这些分支的创建我尝试手动删除它们但它不起作用并且我不想在下次获取或变基时保留它们据我从对您问题的评论中了解到您只希望这些参考

随机推荐

人脸年龄识别

人脸年龄识别人脸识别背景人脸识别研究概况人脸识别算法分类人脸识别的意义一张有趣的人脸年龄识别结果图本文目的数据集 dataloader py generate train val file py img aug py net
stm32矩阵键盘c语言程序,stm32矩阵键盘原理图及程序介绍

STM32F0 系列产品基于超低功耗的 ARM Cortex M0 处理器内核整合增强的技术和功能瞄准超低成本预算的应用该系列微控制器缩短了采用 8 位和 16 位微控制器的设备与采用 32 位微控制器的设备之间的性能差距能够在经济
大话数据结构1 - 概念、线性表

程序设计数据结构算法数据数据元素数据项数据对象数据结构逻辑结构集合结构线性结构树形结构图形结构物理结构顺序存储结构链式存储结构空间优势数据类型抽象数据类型 ADT abstract data type 算
Python工业项目实战01：项目介绍及环境构建

知识点01 课程目标项目目标项目1 在线教育学习如何做项目项目中大数据工程师要负责实现的内容和流程学习数仓基础理论建模分层项目2 一站制造企业中项目开发的落地代码开发代码开发 SQL DSL SQL SparkCore
免费的插画素材网站有哪些？

面对紧急设计项目设计师会选择使用外力来完成项目免费插图网站可以帮助我们在这个时候解决问题但大多数插图网站都是收费的需要版权或特别丑陋的基本上很少有免费的没有版权的好插图但今天我想推荐一个免费的插图网站即时设计资源社区即时设计
程序员是否可以在家办公——在家办公的利与弊

对软件技术工作者来说办公的场所对工作效率似乎并没有大的影响毕竟大部分软件工程师给人的印象是埋头于电脑前似乎只要给他们一台能够连上Internet或是公司VPN的电脑他们就能产出我们期望的代码在理想情况下公司还能通过这样的方式
马尔可夫链模型的信贷风险分析与预测

今天为大家介绍马尔科夫链模型信贷中计算风险分析与预测的一个重要模型马尔科夫链模型是啥数学模型中的一个重要的模型是属于一类重要的随机过程马尔可夫链模型由俄国数学家马尔可夫于1907年提出人们在实际中常遇到具有下述特性的随机过程
条件分支if和else的使用详解

顺序结构没什么好讲的就是从上到下的写代码所以接下来壹哥就直接带各位来学习分支结构里的条件分支我们在前面说过分支结构或者叫做条件分支其实有两种情况一种是if else 类型的条件分支一种是switch case 类型的条件分
链表反转全家桶（一）：动画详解单链表反转

单链表的反转是一个easy级别的题目这个题目在力扣上的提交次数达到47万次而且在面试中也频频出现可谓是大受欢迎它的兄弟们也跟着风光了这道题本身是比较简单的而它的难兄难弟就不是那么简单了今天这篇文章先从简单开始分析单链表的
Navicat运行sql文件导入数据不全或导入失败

前言我们平时想把数据从一个数据库中导入另外一个数据库中的时候一般都是把所需的数据表进行转储sql文件然后再运行sql文件导入新的数据库中这么做数据少的时候一般不会出现什么错但是如果数据量比较大表比较多就会出现缺少数据表或
Android自定义控件-----放大镜

public class ShaderView extends View private final Bitmap bitmap private final ShapeDrawable drawable 放大镜的半径 private sta
转载：原文http://www.cnblogs.com/gao241/p/3522143.html

shell实例手册 0说明手册制作雪松更新日期 2013 12 06 欢迎系统运维加入Q群 198173206 请使用 notepad 打开此文档 alt 0 将函数折叠后方便查阅请勿删除信息转载请说明出处抵制不道德行为错误在
常见的图像滤波算法

本文介绍五种常见的图像滤波方式线性滤波方框滤波均值滤波高斯滤波非线性滤波中值滤波双边滤波提醒本文主要是算法公式没有具体完整的代码一线性滤波总的来说这三种线性滤波原理每个像素的输出值是输入像素的加权和其处理方式
mysql通过二进制日志回复数据_详解如何通过Mysql的二进制日志恢复数据库数据...

经常有网站管理员因为各种原因和操作导致网站数据误删而且又没有做网站备份结果不知所措甚至给网站运营和盈利带来负面影响所以本文我们将和大家一起分享学习下如何通过Mysql的二机制日志 binlog 来恢复数据系统环境操作系统 Ce
Apache HTTPD 换行解析漏洞（CVE-2017-15715）

简介 HTTPD就是平常大家说的apache服务器 HTTPD才是他的真实名字环境搭建使用vulhub里现成的环境部署即可进入vulhub下的httpd CVE 2017 15715 docker compose build dock
【python办公自动化】使用PysimpleGUI实现AHP指标的添加和删除及编号重新排序

使用PysimpleGUI实现AHP指标的添加和删除 1 运行界面 2 添加指标 3 删除指标 4 编码重新排序 5 全部代码 1 运行界面 2 添加指标输入框中输入内容点击添加指标按钮然后就会自动添加到上方列表中 3 删除指标
浩鲸科技2020届c++

1 C 是类型安全的 Java c 语言是类型安全的除非强制类型转换 C语言不是类型安全的因为同一段内存可以用不同的数据类型来解释比如1用int来解释就是1 用boolean来解释就是true 2 float a b c 那么可以如下
记一次SpringBoot打包Jar引入第三方jar包,部署出现ClassNotFound的现象

心有猛虎细嗅蔷薇最近公司和第三方项目进行于是需要引入第三方的SDK来调用一些东西引入进来什么都是很好的但是发布出去就出现各种ClassNotFuoundException等问题然后看下测试环境的log发现了第三方的SDK中的类不
关于hive的启动和连接

目录一前言二 hive的启动与连接 2 1 启动hadoop 2 2 启动hive 2 3 一些注意事项一前言太久没用hive了今天想重新熟悉一下结果发现自己甚至忘记了怎么启动于是特此记录篇笔记便于以后忘记时查阅不会写
hadoop实践（五）win10+eclipse+hadoop2.6.4 开发环境

本人环境为win10 才从win7升级 eclipse是 Kepler Service Release 1 在win10下安装了vm workstation 其上安装了centos6 5 并在上面部署了hadoop2 6 4的伪分布式安装

hadoop实践（五）win10+eclipse+hadoop2.6.4 开发环境

hadoop实践（五）win10+eclipse+hadoop2.6.4 开发环境 的相关文章

随机推荐

热门标签

hadoop实践（五）win10+eclipse+hadoop2.6.4 开发环境的相关文章