hadoop2.7.2 window win7 基础环境搭建

2023-05-16

hadoop环境搭建相对麻烦,需要安装虚拟机过着cygwin什么的,所以通过查资料和摸索,在window上搭建了一个,不需要虚拟机和cygwin依赖,相对简便很多。

下面运行步骤除了配置文件有部分改动,其他都是参照hadoop下载解压的share/doc/index.html。




hadoop下载:http://apache.opencas.org/hadoop/common/

解压至无空格目录下即可,下面是目录结构:


下面配置windows环境:

Java JDK :

我采用的是1.8的,配置JAVA_HOME,如果默认安装,会安装在C:\Program Files\Java\jdk1.8.0_51。此目录存在空格,启动hadoop时将报错,JAVA_HOME is incorrect ...此时需要将环境变量JAVA_HOME值修改为:C:\Progra~1\Java\jdk1.8.0_51,Program Files可以有Progra~代替。

Hadoop 环境变量:

新建HADOOP_HOME,指向hadoop解压目录,如:D:/hadoop。path环境变量中增加:%HADOOP_HOME%\bin;。

Hadoop 依赖库:

winutils相关,hadoop在windows上运行需要winutils支持和hadoop.dll等文件,下载地址:http://download.csdn.net/detail/fly_leopard/9503059

注意hadoop.dll等文件不要与hadoop冲突。为了不出现依赖性错误可以将hadoop.dll放到c:/windows/System32下一份。


hadoop环境测试:

起一个cmd窗口,起到hadoop/bin下,hadoop version,显示如下:



hadoop基本文件配置:hadoop配置文件位于:hadoop/etc/hadoop下

core-site.xml / hdfs-site.xml / mapred-site.xml / yarn-site.xml

core-site.xml:

<configuration>

   <property>

       <name>fs.defaultFS</name>

       <value>hdfs://localhost:9000</value>

   </property>

</configuration>

hdfs-site.xml:

 

<configuration>

       <property>

               <name>dfs.replication</name>

                <value>1</value>

       </property>

       <property>

                <name>dfs.namenode.name.dir</name>

               <value>file:/hadoop/hadoop272/data/dfs/namenode</value>

       </property>

       <property>

               <name>dfs.datanode.data.dir</name>

               <value>file:/hadoop/hadoop272/data/dfs/datanode</value>

       </property>

</configuration>

mapred-site.xml:

<configuration>

       <property>

          <name>mapreduce.framework.name</name>

          <value>yarn</value>

       </property>

</configuration>

yarn-site.xml:

<configuration>

       <property>

          <name>yarn.nodemanager.aux-services</name>

          <value>mapreduce_shuffle</value>

       </property>

       <property>

          <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

          <value>org.apache.hadoop.mapred.ShuffleHandler</value>

       </property>

</configuration>

格式化系统文件:

hadoop/bin下执行 hdfs namenode -format

待执行完毕即可,不要重复format。

格式化完成后到hadoop/sbin下执行 start-dfs启动hadoop

访问:http://localhost:50070



(不是必须的 ) 创建目录:用于输入和输出,linux上是/user/用户名/xx windows上可能没具体要求,我创建也是按照liunx目录方式的。参照的api doc上面


创建完成可以通过hdfs dfs-ls 目录名称查看,也可以在浏览器中查看创建的目录或文件


input输入文件到目录:login_weibo2是我自己创建的文本文件,位于hadoop一个盘的。此处是D:/hadoop/login_weibo2


如果了解命令参数输入hdfs dfs回车查看dfs命令参数 。hdfs dfs -put回车查看put相关参数。其他命令也是这样。

查看input输入的文件内容:


运行hadoop给的examples,做个参考,运行下面命令等待执行完成。hadoop jar jar文件位置 grep 输入目录(包含被处理文件的目录)  输出目录(运行结果输出目录)


然后查看文件夹下多了些东西,就是运行结果输出目录,结果般存在part-r-xxxx里面。


在hadoop/sbin下启动start-yarn,访问http://localhost:8088可查看 资源、节点管理



刚接触hadoop,什么都不是很了解,不对地方欢迎指正。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

hadoop2.7.2 window win7 基础环境搭建 的相关文章

  • 如何查看cpu是否支持sse指令级

    Mac xff1a 命令 xff1a sysctl a grep machdep cpu features 结果 xff1a machdep cpu features FPU VME DE PSE TSC MSR PAE MCE CX8 A
  • Mac系统下VSCode配置gopath

    golang项目的编译和调试依赖gopath 命令行可以通过export为每个golang项目导出不同的gopath xff0c 使用VSCode也可以通过配置 xff0c 实现不同的golang项目使用不同gopath xff0c 步骤如
  • GDB打印vector指定元素

    使用GDB调试程序时 xff0c 需要查看变量的值 对于普通变量 xff0c 直接使用p命令即可 xff0c 如下 xff1a 对于vector xff0c 也可以使用相同的方法 xff0c 如下 xff1a vector元素较少时 xff
  • Linux中学教程(一)

    突然想写点关于linux的东西 xff0c 一是将自己几十年来零碎的知识作以串联 xff0c 二是能为正在学习路上的新手作些指引 而恰好作者的孩子是一位初一的学生 xff0c 我写的这些东西也正是我手把手教授他的 xff0c 现在分享出来并
  • libevent之eventop

    功能 xff1a IO处理模型 架构 xff1a 实现 xff1a event internal h定义eventop结构体 xff0c 在 c文件实例化生成对应的全局对象 xff0c 如在poll c中生成pollops对象 event
  • C++ Lambda表达式的使用方法

    C 43 43 Lambda表达式的简单实用方法如下 xff1a include lt functional gt include lt algorithm gt include lt iostream gt include lt list
  • Visual Code 配置golang开发环境

    1 去微软官网下载安装Visual Code http code visualstudio com Download 安装成功后 xff0c 打开命令行 xff0c 输入go version xff0c 会输出golang 版本 如果没有输
  • linux下调用mysql_query产生SIGSEGV段错误

    xfeff xfeff 程序需要用到MySQL来进行持久化 xff0c 代码在windows测试通过 xff0c 但在Linux调试时 xff0c 产生下面的异常 xff1a Thread 9 34 NodesManagerd 34 rec
  • vim编辑文档误用Ctrl+S导致vim假死

    xfeff xfeff 在linux使用vim编辑源码之后 xff0c 顺手使用了ctrl 43 s xff0c 本以为会保存源码 xff0c 但不料vim却卡住了 xff0c 怎么动都动不了 经过查询 xff0c 才发现ctrl 43 s
  • golang获取命令行参数

    xfeff xfeff 对于C C 43 43 java xff0c 或C 程序 xff0c 我们可以通过入口函数 xff08 main函数 xff09 直接获取命令行参数 xff1a int main int argc char argv
  • linux不指定LD_LIBRARY_PATH运行程序

    在windows中 xff0c 只要将动态库DLL跟可执行程序放在同一个目录 xff0c 程序在运行时 xff0c 就能找到DLL 然而 xff0c 在linux中 xff0c 必须指定动态库的路径 xff0c 程序才能找到动态库 xff0
  • bfs编译失败,编译gflags时缺少config.h

    在编译百度文件系统时 xff0c 编译失败 xff0c 错误如下 xff1a 进入到bfs thirdsrc gflags 2 1 1 include gflags xff0c 发现config h存在 于是跳到gflags 2 1 1 x
  • golang文件读取介绍

    golang提供了多种文件读取方式 xff0c 第一种方式 xff0c 也是最简单的一种方式 xff0c 如下 xff1a bytes err 61 ioutil ReadFile 34 a txt 34 if err 61 nil pan
  • zookeeper分布式部署

    在部署zookeeper之前 xff0c 先准备3台服务器 xff08 服务器已安装配置jdk xff09 xff1a node0 192 168 1 161 xff08 ubuntu16 04 xff09 node1 192 168 1
  • Linux中学教程--第1章 Centos8 开局N件事

    操作系统的学习 xff0c 最重要的是动手去操作 xff0c 而不是去背诵枯燥的概念 命令 通过前面的学习 xff0c 估计大家都已经将centos 8 5安装到自己的虚拟机里了 xff0c 可是第一次登录以后桌面怎么空空的呢 xff1f
  • stdbind剖析

    stl 算法库多数算法只能提供一个参数给绑定函数 xff0c 如 for each 函数 如果想打印 vector 中的每一个元素 xff0c 用 for each 实现方式代码如下 xff1a include lt iostream gt
  • 解决使用libhdfs.so连接hdfs出错问题java.lang.ClassNotFoundException: org.apache.hadoop.fs.F

    xfeff xfeff 出现java lang ClassNotFoundException org apache hadoop fs FileSystem错误的原因 xff1a libhdfs so并没有直接与hadoop与hdfs直接交
  • svn主干删除build.sh重新提交报错“处于冲突状态;请在新增之前标记冲突为已经解决”

    在调试编译脚本过程中 xff0c 由于一开始忘记修改脚本权限 xff0c build sh无法执行 在为build sh增加执行权限后 xff0c 准备重新提交build sh 因此通过windows的svn工具 xff08 有界面 xff
  • Kafka集群配置使用主机名,windows无法访问

    因工作需要 xff0c 在Linux集群下搭建了zookeeper集群和kafka集群 zookeeper集群和kafka集群中的所有配置均使用的真实ip地址 但由于服务节点使用的是动态IP xff0c IP地址经常发生变化 xff0c 每
  • makefile入门

    Makefile入门 1 gcc常用编译命令 gcc最简单的编译命令就是gcc c xff0c 编译当前目录下的所有源文件 现在 xff0c 假设目录say下面存在三个文件say h xff08 定义模块函数 xff09 xff0c say

随机推荐