hadoop-2.8.0完全分布式环境搭建

2023-05-16

一、机器及环境准备。

1、jdk安装不用多说，安装完成配置环境变量即可。

export JAVA_HOME=/usr/java/latest
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=.:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar
export PATH=$JAVA_HOME/bin:$PATH

运行 #source /etc/profile让环境变量生效

2、将下载的hadoop-2.8.0.tar.gz文件解压到指定目录/data/下，然后需要配置hadoop相关的环境变量，这里为了区别，特意做一个单独的配置文件，放到/etc/profile.d目录下，取名hadoop.sh,文件内容如下。

同样的为了让环境变量生效，需要运行# source /etc/profile

3、配置免密钥登录，这里需要在namenode节点上远程操作datanode节点，因此只需要在linux-node1上配置免密登录，然后将密钥拷贝到linux-node1,linux-node2,linux-node3上,linux-node1本机也需要免密登录，如果不配置这一步，在启动hdfs时，需要手动输入密码。

#ssh-keygen -t rsa -P ""
#cp /root/.ssh/id_rsa.pub /root/.ssh/authorized_keys
#ssh-copy-id linux-node2
#ssh-copy-id linux-node3

上面依次创建一对密钥，然后在linux-node1上将id_rsa.pub复制为authorized_keys，这样就实现了在本季免密登录。最后分别利用ssh-copy-id命令将密钥拷贝到linux-node2,linux-node3上。

说明一点：hadoop-2.8.0二进制安装包是在x64位机器上编译的，所以如果是64位虚拟机，无须下载源码编译来生成本地库，我们可以通过查看lib/native/libhadoop.so.1.0.0文件，来验证具体的编译信息。

[root@linux-node1 hadoop-2.8.0]# file lib/native/libhadoop.so.1.0.0 
lib/native/libhadoop.so.1.0.0: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, BuildID[sha1]=0x4f0a2f27e6f1a45560dad736ba475a8d7fb97a09, not stripped

二、准备配置文件。

core-site.xml

<configuration>
     <property>
             <name>fs.defaultFS</name>
             <value>hdfs://linux-node1:9000</value>
     </property>
     <property>
             <name>hadoop.tmp.dir</name>
             <value>file:/data/hadoop-2.8.0/tmp</value>
     </property>
</configuration>

根据配置文件，需要在hadoop安装目录下新建tmp目录。

hdfs-site.xml

<configuration>
     <property>
            <name>dfs.replication</name>
            <value>2</value>
     </property>
     <property>
            <name>dfs.namenode.secondary.http-address</name>
            <value>linux-node1:9001</value>
     </property> 
     <property>
            <name>dfs.namenode.name.dir</name>
            <value>file:/data/hadoop-2.8.0/hdfs/name</value>
     </property> 
     <property>
            <name>dfs.datanode.data.dir</name>
            <value>file:/data/hadoop-2.8.0/hdfs/data</value>
     </property> 
</configuration>

根据配置文件，需要在hadoop安装目录下新建hdfs/name,hdfs/data两个目录。

mapred-site.xml

<configuration>
     <property>
          <name>mapreduce.framework.name</name>
          <value>yarn</value>
      </property>
     <property>
          <name>mapreduce.jobhistory.address</name>
          <value>linux-node1:10020</value>
      </property>
     <property>
          <name>mapreduce.jobhistory.webapp.address</name>
          <value>linux-node1:19888</value>
      </property>
</configuration>

yarn-site.xml

<configuration>
      <property>
           <name>yarn.nodemanager.aux-services</name>
           <value>mapreduce_shuffle</value>
      </property>
      
      <property>
           <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
           <value>org.apache.hadoop.mapred.ShuffleHandler</value>
      </property>
      <property>
           <name>yarn.resourcemanager.address</name>
           <value>linux-node1:8032</value>
      </property>
      <property>
           <name>yarn.resourcemanager.scheduler.address</name>
           <value>linux-node1:8030</value>
      </property>
      <property>
           <name>yarn.resourcemanager.resource-tracker.address</name>
           <value>linux-node1:8031</value>
      </property>
      <property>
           <name>yarn.resourcemanager.admin.address</name>
           <value>linux-node1:8033</value>
      </property>
      <property>
           <name>yarn.resourcemanager.webapp.address</name>
           <value>linux-node1:8088</value>
      </property>
</configuration>

slaves

[root@linux-node1 hadoop]# cat slaves 
linux-node2
linux-node3

hadoop-env.sh(可选)，如果安装jdk时，配置环境变量使用了软链的方式将jdk的安装目录映射到/usr/java/latest这样的目录，这里就需要将hadoop-env.sh中JAVA_HOME的值需要设置一下，否则在启动hdfs时会出现java_home未设置的错误，如果直接指定jdk的安装目录，则不用设置。

# The java implementation to use.
export JAVA_HOME=/usr/java/latest

配置文件准备好了之后，可以将hadoop-2.8.0安装包拷贝到linux-node2,linux-node3机器对应的目录下。

scp -r /data/hadoop-2.8.0 linux-node2:/data/
scp -r /data/hadoop-2.8.0 linux-node3:/data/

三、格式化和启动hdfs,yarn。

在主节点上运行以下命令：hdfs namenode -format，入下图所示，表示格式化成功。

sbin/start-dfs.sh//启动dfs文件系统，可以查看hdfs文件系统。

sbin/start-yarn.sh//启动yarn，可以运行mapreduce程序。

如果需要关闭，依次关闭yarn,hdfs

sbin/stop-yarn.sh

sbin/stop-dfs.sh

四、登录图形界面查看集群状态。

在浏览器中访问地址:http://192.168.61.21:50070

overview

datanode

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

hadoop-2.8.0完全分布式环境搭建的相关文章

ubuntu上利用qemu-kvm创建虚拟机

kvm是Kernel based Virtual Machine的缩写 xff0c 即基于内核的虚拟机技术 xff0c 运行在具备Intel vt或者AMD V功能的x86平台上在linux2 6 20之后的版本中kvm成为了linux内
Fatal error in launcher: Unable to create process using解决办法

我的机器是windows7 64位机器 xff0c 本来默认安装了pip命令是9 0 1版本的 xff0c 网上有介绍说可以安装1 5 6版本我考虑将pip更改为1 5 6版本 xff0c 去官网下载一个whl的文件 xff0c 利用pi
openstack-install-ubuntu-single说明

ubuntu1404单机安装部署openstack juno值得注意的地方 xff0c 这里说明一下先来说说openstack组件 keystone gt 认证组件glance gt 镜像组件 xff0c 负责管理虚拟机镜像nova gt
hive自定义函数UDF

Hive自定义函数 UDF xff0c 可以帮助用户轻松实现在hql语句中展现自定义查询结果这里以一个简单的连接函数来实现用户自定义函数 xff0c 假设表结构如下 xff1a 表中只有两个简单的字段 xff0c id和name 这里实现
Oracle 数据误删的恢复措施

Oracle中常见的数据删除操作就三种 xff0c truncate xff0c drop xff0c delete xff0c 下面分类说一下如何恢复 Truncate xff1a 该操作执行后 xff0c 保留表结构 xff0c 清空
Hive使用入门

先介绍一些基本的命令 xff1a 1 进入hive命令行 xff0c 这种方式进入之后 xff0c 操作结果展示时带有执行mapreduce的调试信息 xff1b hive service cli 等同于直接输入hive 2 进入hive命
Hive内部表和外部表的区别

hive作为基于hdfs的数据仓库 xff0c 在构建表的时候 xff0c 会有内部表和外部表 xff0c 这里介绍两者的异同点相同点 xff1a 1 他们都是用mysql或者derby作为元数据存储 xff0c 他们在元数据的组织上是相
hive:For direct MetaStore DB connections, we don't support retries at the client level

hive创建表和导入数据都没有问题 xff0c 在删除表 xff0c 做drop table 时报如题所示的错误有的文章说修改元数据库字符集为latin1 但是元数据库字符集默认创建就是latin1 修改字符集无法解决该问题通过更换my
rhel7安装docker

docker是当下最流行的虚拟化容器技术之一 xff0c 它是基于lxc的一种容器技术 xff0c 该技术已经非常成熟 xff0c 而且在实际应用中已经越来越普遍很多框架都有对docker的支持 xff0c 包括hadoop spark
Openstack使用ubuntu镜像启动虚拟机实例

一般情况下openstack环境搭建好了之后 xff0c 就是测试启动虚拟机通常我们会使用一个最基本的镜像cirros 0 3 3 x86 64 disk img来作为镜像 xff0c 使用glance命令行或者horizon的图形化界
docker使用Dockerfile构建镜像

docker获取镜像 xff0c 除了docker pull docker load之外还可以通过自定义Dockerfile的方式通过命令docker build 来构建新镜像通过这种方式可以很自由的定义想要安装的镜像 xff0c 想要安
django环境搭建

django是python开发框架 xff0c 是一个丰富的web框架第一步 xff1a 安装pip wget https bootstrap pypa io get pip py python get pip py 第二步 xff1a
docker配置国内仓库镜像registry-mirror

Docker在默认安装之后 xff0c 当需要下载镜像时 xff0c 通过命令docker pull learn tutoral拉取示例镜像 xff0c 或者其他镜像时 xff0c 都是访问默认的docker hub上的镜像 xff0c 在
TypeError: object() takes no parameters

python面向对象编程第一个坑 TypeError object takes no parameters 出现这个错误 xff0c 一般就是构造函数 init 书写的不对 xff0c 检查一下是否是少了一个下划线或者是少写了一个i字母 x
windows上Flask环境搭建

Flask是python开发框架用来快速构建web项目下面介绍如何在windows上搭建flask开发环境并运行一个demo 第一步创建项目并构建flask环境 mkdir flaskapp cd flaskapp virtualen
WebSocket 测试工具

一 WebSocket 简介 WebSocket是一种在单个TCP连接上进行全双工通信的协议 WebSocket使得客户端和服务器之间的数据交换变得更加简单 xff0c 允许服务端主动向客户端推送数据在WebSocket API中 xff
利用pipework为docker容器设置固定IP

今天介绍如何在redhat centos7系列机器上使用pipework为docker启动的容器指定一个固定ip 我们知道默认情况下 xff0c docker会使用bridge网络模式为每一个启动的容器动态分配一个IP xff0c 以172
用docker玩坏ubuntu虚拟机容器

当我们装上docker之后 xff0c 自然会pull一个或多个镜像玩玩 xff0c 这时候 xff0c docker hub仓库上有很多系列操作系统镜像 xff0c 每个系列又有很多不同功能的虚拟机镜像 xff0c 比如centos分6还
tornado入门实例

tornado是python web开发的又一个轻量级框架 tornado框架需要安装 xff0c 为了方便 xff0c 我直接安装了Anaconda 2 4 1 里面直接就带了tornado 还有很多python库 numpy scipy
web.py框架入门

web py是python web开发的一个轻量级框架 web py可以通过pip命令安装 xff0c pip install web py 编写官网示例代码 xff1a vi index py import web urls 61 34

随机推荐

graphviz快速上手

graphviz最初是AT amp T实验室用来画流程图的工具 xff0c 使用dot语言其中根据图的类型可以分为有向图 dirgraph 和无向图 graph 我们知道图是由点 node 和边 edge 组成的 xff0c 在有向图中边
mysqld: File './mysql-bin.index' not found (Errcode: 13 - Permission denied)

我们通过yum方式安装mysql 会生成mysql mysql用户组和用户 xff0c 启动mysql默认是使用mysql用户如果我们开启了慢log日志 xff0c 而且我们使用service mysqld start启动mysql 会报
redhat7编译安装php-5.5.38

1 从官网下载php源码包 php 5 5 38 2 安装依赖包 yum install libxml2 libxml2 devel bzip2 devel libcurl devel y yum install openssl opens
spark-1.6.0源码编译安装

环境准备 spark是scala语言写的 xff0c scala运行需要jdk 如果通过maven编译 xff0c 还需要maven环境 xff0c 因此spark源码编译需要安装jdk scala apache maven这三样环境这里
ZendStudio+php+Apache开发环境搭建

学习php xff0c 我们就想有一个好的ide xff0c ZendStudio是专门为php开发提供的ide xff0c 写完代码立马能够在工作空间中调试 xff0c 可以通过Run As gt PHP CLI Application
图文详解win7实现局域网共享文件

工作中 xff0c 我们有时候会拥有两台机器 xff0c 避免机器之间文件传来传去 xff0c 可以使用局域网文件共享 xff0c 在一台机器上开启文件共享 xff0c 另一台机器通过IP访问 xff0c 即可轻松实现文件互访今天介绍我们
模拟画图题P1185 绘制二叉树

可能更好的观看体验题目链接P1185 绘制二叉树题意概述根据规则绘制一棵被删去部分节点的满二叉树节点用 o o o 表示 xff0c 树枝用表示每一层树枝长度会变化 xff0c 以满足叶子结点有如下特定 xff1a 相邻叶子节点
win7+MySQL5.7.18zip版本安装

mysql5 7 18zip版本在windows的安装 xff0c 就是解压 xff0c 初始化 xff0c 然后做一些密码修改的设置即可使用 xff0c 如果需要远程连接 xff0c 需要更改用户表的host值为 39 39 xff0c
redhat7源码编译hadoop2.6.0

以前在32位linux机器上编译过hadoop2 6 0 这次在redhat7 64bit上再次编译hadoop2 6 0 xff0c 除必须的jdk maven protobuf需要安装之外 xff0c 还需要安装系统依赖库gcc gcc
elasticsearch启动错误

最近想尝试一下elk搭建实时日志分析系统 xff0c 结果运行elasticsearch时 xff0c 就遇到了一些问题这些问题基本都是系统参数相关的现在整理出来 xff0c 以免后面再次遇到 xff0c 也供大家参考 xff0c 少走
kafka+flume+hdfs实时日志流系统初探

本次实验 xff0c 主要为了测试将kafka的消息通过flume接收并存入hdfs xff0c 如果之前搭建过hadoop flume kafka的 xff0c 这里会很快就会完成 xff0c 思路比较清晰 xff0c 主要配置在flum
让Eclipse中spring的xml配置文件出现属性和类提示

在spring配置文件中可以让配置bean的时候出现提示 xff0c 这里需要做一些设置设置包括安装springide插件 spring beans version xsd文件引入 xff0c 增加xml编辑提示的字符 xff0c 默认只
win7查看端口占用的进程

之前遇到一个问题 xff0c 系统上mysql启动了 xff0c 无法通过navicat客户端来连接 xff0c 这就很郁闷了 xff0c 最后定位到问题 xff0c 是我机器上还开启了一个开发php的应用程序phpwamp 它自带了一个m
cxf+spring实现webservice

1 构建maven项目 xff0c 工程结构如下 xff1a 这里需要特别指出就是cxf core 3 1 12 jar类路径META INF cxf下有一个cxf xml的配置文件 xff0c 这个在applicationContext
Activemq+spring整合

activemq与spring的整合需要用到线程池考虑到连接会话等资源的建立和释放 xff0c 无须人工操作 xff0c 全部交给容器来处理这里通过一个实例讲解activemq与spring如何整合项目大致是这样的设计 xff1a
springsecurity4.2入门完整实例

1 构建maven项目 xff0c 引入springsecurity相关依赖项目结构如下 xff1a pom xml配置文件主要部分 xff1a lt properties gt lt spring version gt 4 2 0 RE
Linux上tensorflow安装

选择安装Anaconda xff0c 然后激活tensorflow 环境最后使用pip install安装第一步 xff1a 安装Anaconda xff0c Anaconda集成了很多python库 xff0c 不用手动额外安装 An
Window安装Anaconda后，conda不是内部或者外部命令

今天在安装Theano的时候 xff0c 需要看一下 xff0c anaconda已经安装了哪些包使用命令如下在控制台 xff0c cmd回车输入即可 xff1a conda list 但是 xff0c 显示出错 xff0c conda
zookeeper集群环境搭建

zookeeper是一个分布式框架 xff0c 它的用途在今天非常广泛 xff0c 通常与dubbo一起构成分布式系统 xff0c 另外kafka消息系统也自带了zookeeper hadoop集群也少不了zookeeper xff0c z
hadoop-2.8.0完全分布式环境搭建

一机器及环境准备 1 jdk安装不用多说 xff0c 安装完成配置环境变量即可 export JAVA HOME 61 usr java latest export JRE HOME 61 JAVA HOME jre export CLA

hadoop-2.8.0完全分布式环境搭建

hadoop-2.8.0完全分布式环境搭建 的相关文章

随机推荐

热门标签

hadoop-2.8.0完全分布式环境搭建的相关文章