Hadoop的伪分布式的安装及部署

2023-11-16


做Hadoop的伪分布式我们分为一下几个步骤

安装JDK
配置JDK的环境变量
配置Hadoop的环境变量
修改Hadoop的文件
对NameNode进行格式化
开启NameNode和DataNode
web页面访问分布式文件系统

需要的软件及源码包

  1. FileZilla ——(https://filezilla-project.org
  2. SecureCRT ——(https://download.csdn.net/download/xujingran/10775969
  3. jdk-7u80-linux-x64.gz ——(https://download.csdn.net/download/xujingran/10775975
  4. hadoop-2.6.0.tar.gz([http://archive.apache.org/dist/hadoop/core

安装JDK

  1. 下载完成JDK和Hadoop的源码包
  2. 利用FileZilla把文件复制到/root文件夹下
  3. 配置JDK,在/usr下创建Java安装文件夹
   	 mkdir /usr/java
  1. 执行ls命令,查看文件是否存在,
  2. 解压jdk-7u80-linux-x64.gz到本地的/usr/java
	 tar -zxvf jdk-7u80-linux-x64.gz -C /usr/java
  1. 进入cd /usr/java 执行ls命令查看是否安装成功并修改环境变量

        和Windows里安装完JDK进行计算机—>属性—>高级属性—>环境变量的步骤一样

	1.vim /etc/profile 
	2.在unset -f pathmunge后面(也就是在最后一行后面)加入
		export JAVA_HOME=/usr/java/jdk1.7.0_80(需要和上面安装的版本相同)
		export PATH=$PATH:$JAVA_HOME/bin 
  1. 修改完成后不会立即生效,需要执行source命令来让它生效。
	source /etc/profile
  1. 输入java会有回显信息,输入java- version命令会有版本的显示则表示JDK安装成功
  2. 输入jps会有jps的显示,若没有则需要配置并安装yum源,配置方法查看https://blog.csdn.net/xujingran/article/details/83905273
  3. 配置完yum源执行 yum grep|list openjdk来查找java包,找到后执行 yum install java-1.7.0-openjdk-devel.x86_64来安装java包
           

Hadoop的部署安装

  1. 进入/root,执行ls查看是否有hadoop的文件
  2. 执行tar -zxvf hadoop-2.6.0.tar.gz -C /usr/local(将hadoop-2.6.0.tar.gz解压到/usr/local)
  3. 执行ls查看是否有这个文件,并执行mv hadoop-2.6.0/ hadoop注意空格 将名字改为hadoop)
  4. 进入cd /usr/local/hadoop/,输入vim ~/.bashrc(编辑~/.bashrc文件)
  5. 配置hadoop的环境变量

        与前面配置的JDK的环境变量不同


    在alias rm=”rm -i”前面加入需要的变量信息
    export JAVA_HOME=/usr
    export PATH=/usr/local/hadoop/bin/:/usr/local/hadoop/sbin/:$PATH
    export HADOOP_HOME=/usr/local/hadoop
    export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
  1. 修改完成后不会立即生效,需要执行source命令来让它生效。
	source ~/.bashrc
  1. (1)输入echo $JAVA_HOME来检验变量值,
    (2)输入java -version查看java是否配置成功
    (3)输入hadoop version查看hadoop是否可用,不可用需要检查配置文件是否正确

Hadoop的配置

        我们做的都是在一台虚拟机里做的实验,所以我们是做的伪分布式的实验,伪分布式的实验是需要修改两个文件,core-site.xmlhdfs-site.xml,这两个文件都是位于/usr/local/hadoop/etc/hadoop文件夹下

  1. (1)修改core-site.xml文件

    <configuration>
   		 <property>
    		<name>hadoop.tmp.dir</name>
    		<value>file:/usr/local/hadoop/tmp</value>
    		<description>Abase for other temporary directories.</description>
    	</property>
    	<property>
    		<name>fs.defaultFS</name>
    		<value>hdfs://localhost:9000</value>
    	</property>
    </configuration>

(2)修改hdfs-site.xml文件

    <configuration>
   		 <property>
    		<name>dfs.replication</name>
    		<value>1</value>
    	</property>
    	<property>
    		<name>dfs.namenode.name.dir</name>
    		<value>file:/usr/local/hadoop/tmp/dfs/name</value>
    	</property>
    	<property>
    		<name>dfs.datanode.data.dir</name>
    		<value>file:/usr/local/hadoop/tmp/dfs/data</value>
    	</property>
    </configuration>
  1. 将NameNode格式化,执行hdfs namenode -format命令
            如果显示successfully formatted或者Exitting with status 0则显示配置成功,如果显示Exitting with status 1则配置失败(不同版本的hadoop显示会有不同,请大家注意一下
  2. 接下来要开启NameNode进程和DataNode进程,命令为:start-dfs.sh(此时需要输入三次密码)。
  3. 输入jps命令,如果有jpsSecondaryNameNodeNameNodeDataNode则说明配置成功。
           若没有SecondaryNameNode,需要stop-dfs.sh关闭进程重新开启,
           如果没有NameNode,DataNode,则需要检查前面的文件是否有配置错误
  4. 成功启动后在浏览器的web界面输入http://localhost:50070,此时会弹出分布式文件系统的提示界面。

Hadoop的使用

  1. 在命令行输入hdfs dfs –mkdir –p /usr/hadoop创建目录,执行完成后去web页面的utilities页面去验证是否成功
  2. 输入
 ./bin/hdfs dfs –mkdir –p input./bin/hdfs dfs –mkdir –p input
 ./bin/hdfs dfs –put /etc/hadoop/*.xml input

       将hadoop文件夹下的所有.xml文件上传到分布式文件系统,进入web页面的utilities页面去验证是否成功

  1. 输入
  mkdir ./output
./bin/hdfs dfs –get hdfs-site.xml ./output

  cat ./output/ hdfs-site.xml 

       在分布式文件系统中下载hdfs-site.xml 到output文件夹)进入output文件夹下执行ls查看是否成功。

  1. 实验结束。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop的伪分布式的安装及部署 的相关文章

随机推荐

  • phpmyadmin版本对应的各php版本

    phpmyadmin支持的php版本如下 phpmyadmin4 0 PHP5 2 PHP5 3 PHP5 4 PHP5 5 PHP5 6 PHP7 0 PHP7 1 PHP7 2 PHP7 3 PHP7 4 phpmyadmin4 4 P
  • linux 之 内核实时性

    1 linux 实时性方案 单内核方案 主线软实时内核 打PREEMPT RT补丁 使内核成为硬实时内核 双内核方案 主线普通内核 实时内核 例如 RT linux RTAI Xenomai 2 实时性和抢占性 实时性 实时分为硬实时和软实
  • 项目实现读写分离操作(mysql)

    读写分离 1 问题说明 2 读写分离 Master 主库 数据同步 gt Slave 从库 Mysql主从复制 mysql主从复制 介绍 mysql主从复制是一个异步的复制过程 底层是基于mysql数据库自带的二进制日志功能 就是一台或多台
  • GNU 链接脚本LDS介绍

    前言 程序的从C语言代码变成可以在目标机器上执行额文件 可以分为如下步骤 编译 预编译 将宏定义等转义编译 将C语言变成目标文件 o档案 编译 汇编 将预编译过后的目标变为目标文件 链接 合并多个目标文件 o a 等为最终的可执行文件 LD
  • 51智能小车小车之跟随(超声波的使用)(三)

    智能车的另外一种模式 跟随模式 会跟着前面的障碍物走 此模式利用两个模块 超声波模块和跟随模块 模块的使用 中间是超声波模块 两边是跟随模块 超声波控制前进后退 利用超声波测距 如果距离小于一个值小车前进 否则后退 跟随模块控制左右转动 如
  • Resulting document after update is larger than 16777216

    依赖包是 问题原因 更新文档后data的数据量太大了 超过了16M 解决办法 1 优化自己的mongo代码逻辑 取消文档中的集合存储已文档的方式存储 2 修改mongo的源码 改变源代码并从源代码构建自己的mongo版本 Note the
  • 移动端使用clipboard插件自动复制内容

    最近做一个微信商城遇到点击复制订单号 银行卡号 手机号等等一系列点击复制操作 用到了clipboard插件 支持android ios部分支持 可以通过执行ClipboardJS isSupported 来判断浏览器是否支持clipboar
  • Python已经pip安装某模块后仍然报错ImportError: No module named ***

    uwsgi no request plugin is loaded you will not be able to manage requests Problem Operational MODE preforking threaded n
  • 深富策略:权重调整拖累指数 下周操作要谨慎

    昨日沪深两市指数整体呈现震荡分化格局 上证指数与深证成指全天低开低走 弱势整理格局明显 而创业板指低开高走 反弹走势明显 但尾盘受权重回落影响 最终微幅收涨 行业概念上看 盐湖提锂 能源金属 光伏设备 游戏 化肥行业 元宇宙概念 电子竞技
  • 综合资源网大全

    特别分類 全部 網賺資源 實用 生活 有聲 電子書 辦公 職場 小學初中 公考考研等 幼兒資源 中醫相關 投資理财 情感約會 高中網課 小吃美食 風水相關 seo教程資源 網頁相關資源 福利共享資源 日賺100 3月賺10W CPA空手套白
  • python global和nonlocal_python global和nonlocal用法解析

    python global和nonlocal用法解析 这篇文章主要介绍了python global和nonlocal用法解析 文中通过示例代码介绍的非常详细 对大家的学习或者工作具有一定的参考学习价值 需要的朋友可以参考下 global和n
  • Jupyter Notebook代码折叠插件教程

    默认安装完成的 Jupyter Notebook 是没有安装插件选项的 我们可以通过下面的方法安装插件 pip install jupyter contrib nbextensions pip install jupyter nbexten
  • 微信小程序请求的封装及跨域的解决。

    我这个是把所有请求都抽离到不同页面对应的js文件中 可以方便后期的修改和排查问题 第一步 新建api文件夹并创建config js文件配置公共信息 const baseURL http xxxxxxxxxxx 配置公共地址并暴露 expor
  • [日常]实现windows的本地定时备份文件夹

    虽然网上有一些免费的文件自动备份软件 但是没有自己编写一段批处理来完成备份任务来的放心 而且不用占用系统资源 就给大家讲一下如何利用批处理完成本地文件或者文件夹的备份 该方法可把某文件夹下的文件同步到另外的文件夹 可忽略已经存在的文件 可根
  • Can't use Subversion command line client:svn

    1 在Intellij IDEA里checkout东西时出先这个错误提示 Can t use Subversion command line client svn Subversion command line client version
  • 怎么将服务器文件移动到根目录,如何要移动的Nginx Web根目录移到新位置上的Ubuntu 16.04...

    介绍 在Ubuntu上 在默认情况下 Nginx的Web服务器中存储其文件 var www html 通常位于根文件系统与操作系统的其余部分 有时 尽管将文档根目录移动到其他位置 如单独安装的文件系统 很有帮助 例如 如果您从同一Nginx
  • trading view实现

    TradingView udf模式 近期k线更新 刚趟完坑 简单总结一下 第一步 申请tv 官网地址 https cn tradingview com 注 需以公司名义申请 第二步 相关资料 文档 https b aitrade ga bo
  • 特殊乘法。。

    题目描述 写个算法 对两个小于1000000000的输入 求特殊乘法的结果 特殊乘法举例 123 45 1 4 1 5 2 4 2 5 3 4 3 5 输入 两个小于1000000000的数 输出 输入可能有多组数据 对于每组数据 Inpu
  • vue学习笔记3——外部引入css和路由的一部分

    vue学习笔记3 外部引入css和路由的一部分 从外部引入css文件 在 vue文件中 后面加的scoped是H5新特性 可以锁定style的范围 此处这样写就是说引入的css只在当前的vue的主页生效 不加scoped的话 可能会影响其他
  • Hadoop的伪分布式的安装及部署

    文章目录 需要的软件及源码包 安装JDK Hadoop的部署安装 Hadoop的配置 Hadoop的使用 做Hadoop的伪分布式我们分为一下几个步骤