Hadoop的伪分布式的安装及部署

2023-11-16

文章目录

需要的软件及源码包
安装JDK
Hadoop的部署安装
Hadoop的配置
Hadoop的使用

做Hadoop的伪分布式我们分为一下几个步骤

需要的软件及源码包

FileZilla ——（https://filezilla-project.org）
SecureCRT ——（https://download.csdn.net/download/xujingran/10775969）
jdk-7u80-linux-x64.gz ——（https://download.csdn.net/download/xujingran/10775975）
hadoop-2.6.0.tar.gz（[http://archive.apache.org/dist/hadoop/core ）

安装JDK

下载完成JDK和Hadoop的源码包
利用FileZilla把文件复制到/root文件夹下
配置JDK，在/usr下创建Java安装文件夹

   	 mkdir /usr/java

执行ls命令，查看文件是否存在，
解压jdk-7u80-linux-x64.gz到本地的/usr/java

	 tar -zxvf jdk-7u80-linux-x64.gz -C /usr/java

进入cd /usr/java 执行ls命令查看是否安装成功并修改环境变量

和Windows里安装完JDK进行计算机—>属性—>高级属性—>环境变量的步骤一样

	1.vim /etc/profile 
	2.在unset -f pathmunge后面（也就是在最后一行后面）加入
		export JAVA_HOME=/usr/java/jdk1.7.0_80（需要和上面安装的版本相同）
		export PATH=$PATH:$JAVA_HOME/bin

修改完成后不会立即生效，需要执行source命令来让它生效。

	source /etc/profile

输入java会有回显信息，输入java- version命令会有版本的显示则表示JDK安装成功
输入jps会有jps的显示，若没有则需要配置并安装yum源，配置方法查看https://blog.csdn.net/xujingran/article/details/83905273
配置完yum源执行 yum grep|list openjdk来查找java包，找到后执行 yum install java-1.7.0-openjdk-devel.x86_64来安装java包

Hadoop的部署安装

进入/root，执行ls查看是否有hadoop的文件
执行tar -zxvf hadoop-2.6.0.tar.gz -C /usr/local（将hadoop-2.6.0.tar.gz解压到/usr/local）
执行ls查看是否有这个文件，并执行mv hadoop-2.6.0/ hadoop（注意空格将名字改为hadoop）
进入cd /usr/local/hadoop/，输入vim ~/.bashrc（编辑~/.bashrc文件）
配置hadoop的环境变量

与前面配置的JDK的环境变量不同


    在alias rm=”rm -i”前面加入需要的变量信息
    export JAVA_HOME=/usr
    export PATH=/usr/local/hadoop/bin/:/usr/local/hadoop/sbin/:$PATH
    export HADOOP_HOME=/usr/local/hadoop
    export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native

修改完成后不会立即生效，需要执行source命令来让它生效。

	source ~/.bashrc

（1）输入echo $JAVA_HOME来检验变量值，
（2）输入java -version查看java是否配置成功
（3）输入hadoop version查看hadoop是否可用，不可用需要检查配置文件是否正确

Hadoop的配置

我们做的都是在一台虚拟机里做的实验，所以我们是做的伪分布式的实验，伪分布式的实验是需要修改两个文件，core-site.xml和hdfs-site.xml，这两个文件都是位于/usr/local/hadoop/etc/hadoop文件夹下

（1）修改core-site.xml文件


    <configuration>
   		 <property>
    		<name>hadoop.tmp.dir</name>
    		<value>file:/usr/local/hadoop/tmp</value>
    		<description>Abase for other temporary directories.</description>
    	</property>
    	<property>
    		<name>fs.defaultFS</name>
    		<value>hdfs://localhost:9000</value>
    	</property>
    </configuration>

（2）修改hdfs-site.xml文件

    <configuration>
   		 <property>
    		<name>dfs.replication</name>
    		<value>1</value>
    	</property>
    	<property>
    		<name>dfs.namenode.name.dir</name>
    		<value>file:/usr/local/hadoop/tmp/dfs/name</value>
    	</property>
    	<property>
    		<name>dfs.datanode.data.dir</name>
    		<value>file:/usr/local/hadoop/tmp/dfs/data</value>
    	</property>
    </configuration>

将NameNode格式化，执行hdfs namenode -format命令
如果显示successfully formatted或者Exitting with status 0则显示配置成功，如果显示Exitting with status 1则配置失败（不同版本的hadoop显示会有不同，请大家注意一下）
接下来要开启NameNode进程和DataNode进程，命令为：start-dfs.sh（此时需要输入三次密码）。
输入jps命令，如果有jps，SecondaryNameNode，NameNode，DataNode则说明配置成功。
若没有SecondaryNameNode，需要stop-dfs.sh关闭进程重新开启，
如果没有NameNode，DataNode，则需要检查前面的文件是否有配置错误
成功启动后在浏览器的web界面输入http://localhost:50070，此时会弹出分布式文件系统的提示界面。

Hadoop的使用

在命令行输入hdfs dfs –mkdir –p /usr/hadoop创建目录，执行完成后去web页面的utilities页面去验证是否成功
输入

 ./bin/hdfs dfs –mkdir –p input./bin/hdfs dfs –mkdir –p input
 ./bin/hdfs dfs –put /etc/hadoop/*.xml input

将hadoop文件夹下的所有.xml文件上传到分布式文件系统，进入web页面的utilities页面去验证是否成功

输入

  mkdir ./output
./bin/hdfs dfs –get hdfs-site.xml ./output

  cat ./output/ hdfs-site.xml

在分布式文件系统中下载hdfs-site.xml 到output文件夹）进入output文件夹下执行ls查看是否成功。

实验结束。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Linux

Hadoop的部署

Hadoop的伪分布式的安装及部署的相关文章

SONAR - 使用 Cobertura 测量代码覆盖率

我正在使用声纳来测量代码质量我不知道的一件事是使用 Cobertura 测量代码覆盖率的步骤我按照以下步骤操作http cobertura sourceforge net anttaskreference html http cober
如何模拟ARM处理器运行环境并加载Linux内核模块？

我尝试加载我的vmlinux into gdb并使用 ARM 内核模拟器但我不明白为什么我会得到Undefined target command sim 这是外壳输出 arm eabi gdb vmlinux GNU gdb GDB 7
在 Linux 中禁用历史记录 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案要在 Linux 环境中禁用历史记录我执行了以下命令 export HISTFILESIZE 0 export HISTSIZE 0 u
QFileDialog::getSaveFileName 和默认的 selectedFilter

我有 getSaveFileName 和一些过滤器我希望当用户打开保存对话框时选择其中之一 Qt 文档说明如下可以通过将 selectedFilter 设置为所需的值来选择默认过滤器我尝试以下变体 QString selFilte
在Linux上编译C# + WPF以便在Windows上运行

我有一个 C 应用程序其中某些部分是使用 WPF 编写的 Mono 不支持可以在 Linux 上编译这个应用程序吗最终该应用程序将在 Windows 上运行但它是更大框架的一部分并且我们的整个构建过程在 Linux 上运行因此
为什么我收到的数据包数据大小大于mss？

我在两台 PC 上使用 ifconfig ethX mtu 300 修改了 MTU 并使用 netperf 测试网络我用 WireShark 嗅探了 SYN 数据包中的 MSS 260 但我得到了一些大于 260 的数据包为什么嗅探器
修改linux下的路径

虽然我认为我已经接近 Linux 专业人士但显然我仍然是一个初学者当我登录服务器时我需要使用最新版本的R 统计软件 R 安装在 2 个地方当我运行以下命令时 which R I get usr bin R 进而 R version
是否可以在Linux上将C转换为asm而不链接libc？

测试平台为Linux 32位但也欢迎 Windows 32 位上的某些解决方案这是一个c代码片段 int a 0 printf d n a 如果我使用 gcc 生成汇编代码 gcc S test c 然后我会得到 movl 0 28 e
Android：ANT 构建失败，并显示 google-play-services-lib：“解析为没有项目的 project.properties 文件的路径”

我正在尝试使用 ANT 构建我的应用程序但在包含 google play services lib 库项目后我惨遭失败 Step 1 我在 project properties 文件中设置了对库项目的引用 android library
通过特定分隔符删除字符串

我的文件中有几列其中第二列有分隔符我想删除第二列中的第一个第三个和第四个字符串并将第二个字符串留在该列中但我有正常的分隔符空间所以我不知道 input 22 16050075 A G 16050075 A G 22 16050
如何禁用 GNOME 桌面屏幕锁定？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案如何阻止 GNOME 桌面在几分钟空闲时间后锁定屏幕我已经尝试过官方手册了在红帽 https access redhat com doc
如何根据 HTTP 请求使用 Python 和 Flask 执行 shell 命令并流输出？

下列的这个帖子 https stackoverflow com questions 15092961 how to continuously display python output in a webpage 我能够tail f网页的日志
如何在 shell 脚本中并行运行多个实例以提高时间效率[重复]

这个问题在这里已经有答案了我正在使用 shell 脚本它读取 16000 行的输入文件运行该脚本需要8个多小时我需要减少它所以我将其划分为 8 个实例并读取数据其中我使用 for 循环迭代 8 个文件并在其中使用 while
gdb查找行号的内存地址

假设我已将 gdb 附加到一个进程并且在其内存布局中有一个文件和行号我想要其内存地址如何获取文件x中第n行的内存地址这是在 Linux x86 上 gdb info line test c 56 Line 56 of test c
为什么 Linux perf 使用事件 l1d.replacement 来处理 x86 上的“L1 dcache misses”？

在英特尔 x86 上 Linux用途 https stackoverflow com a 52172985 149138事件l1d replacements来实施其L1 dcache load misses event 该事件定义如下计数
为什么内核需要虚拟寻址？

在Linux中每个进程都有其虚拟地址空间例如 32位系统为4GB 其中3GB为进程保留 1GB为内核保留这种虚拟寻址机制有助于隔离每个进程的地址空间对于流程来说这是可以理解的因为有很多流程但既然我们只有 1 个内核那么为什么我
chown：不允许操作

我有问题我需要通过 php 脚本为系统中的不同用户设置文件所有者权限所以我通过以下命令执行此操作其中 1002 是系统的用户 ID file put contents filename content system chown 100
sendfile64 只复制约2GB

我需要使用 sendfile64 复制大约 16GB 的文件到目前为止我所取得的成就是 include
域套接字“sendto”遇到“errno 111，连接被拒绝”

我正在使用域套接字从另一个进程获取值就像 A 从 B 获取值一样它可以运行几个月但最近 A 向 B 发送消息时偶尔会失败出现 errno 111 连接被拒绝我检查了B域套接字绑定文件它是存在的我也在另一台机器上做了一些测试效
vector 超出范围后不清除内存

我遇到了以下问题我不确定我是否错了或者它是一个非常奇怪的错误我填充了一个巨大的字符串数组并希望在某个点将其清除这是一个最小的例子 include

随机推荐

phpmyadmin版本对应的各php版本

phpmyadmin支持的php版本如下 phpmyadmin4 0 PHP5 2 PHP5 3 PHP5 4 PHP5 5 PHP5 6 PHP7 0 PHP7 1 PHP7 2 PHP7 3 PHP7 4 phpmyadmin4 4 P
linux 之内核实时性

1 linux 实时性方案单内核方案主线软实时内核打PREEMPT RT补丁使内核成为硬实时内核双内核方案主线普通内核实时内核例如 RT linux RTAI Xenomai 2 实时性和抢占性实时性实时分为硬实时和软实
项目实现读写分离操作（mysql）

读写分离 1 问题说明 2 读写分离 Master 主库数据同步 gt Slave 从库 Mysql主从复制 mysql主从复制介绍 mysql主从复制是一个异步的复制过程底层是基于mysql数据库自带的二进制日志功能就是一台或多台
GNU 链接脚本LDS介绍

前言程序的从C语言代码变成可以在目标机器上执行额文件可以分为如下步骤编译预编译将宏定义等转义编译将C语言变成目标文件 o档案编译汇编将预编译过后的目标变为目标文件链接合并多个目标文件 o a 等为最终的可执行文件 LD
51智能小车小车之跟随（超声波的使用）（三）

智能车的另外一种模式跟随模式会跟着前面的障碍物走此模式利用两个模块超声波模块和跟随模块模块的使用中间是超声波模块两边是跟随模块超声波控制前进后退利用超声波测距如果距离小于一个值小车前进否则后退跟随模块控制左右转动如
Resulting document after update is larger than 16777216

依赖包是问题原因更新文档后data的数据量太大了超过了16M 解决办法 1 优化自己的mongo代码逻辑取消文档中的集合存储已文档的方式存储 2 修改mongo的源码改变源代码并从源代码构建自己的mongo版本 Note the
移动端使用clipboard插件自动复制内容

最近做一个微信商城遇到点击复制订单号银行卡号手机号等等一系列点击复制操作用到了clipboard插件支持android ios部分支持可以通过执行ClipboardJS isSupported 来判断浏览器是否支持clipboar
Python已经pip安装某模块后仍然报错ImportError: No module named ***

uwsgi no request plugin is loaded you will not be able to manage requests Problem Operational MODE preforking threaded n
深富策略：权重调整拖累指数下周操作要谨慎

昨日沪深两市指数整体呈现震荡分化格局上证指数与深证成指全天低开低走弱势整理格局明显而创业板指低开高走反弹走势明显但尾盘受权重回落影响最终微幅收涨行业概念上看盐湖提锂能源金属光伏设备游戏化肥行业元宇宙概念电子竞技
综合资源网大全

特别分類全部網賺資源實用生活有聲電子書辦公職場小學初中公考考研等幼兒資源中醫相關投資理财情感約會高中網課小吃美食風水相關 seo教程資源網頁相關資源福利共享資源日賺100 3月賺10W CPA空手套白
python global和nonlocal_python global和nonlocal用法解析

python global和nonlocal用法解析这篇文章主要介绍了python global和nonlocal用法解析文中通过示例代码介绍的非常详细对大家的学习或者工作具有一定的参考学习价值需要的朋友可以参考下 global和n
Jupyter Notebook代码折叠插件教程

默认安装完成的 Jupyter Notebook 是没有安装插件选项的我们可以通过下面的方法安装插件 pip install jupyter contrib nbextensions pip install jupyter nbexten
微信小程序请求的封装及跨域的解决。

我这个是把所有请求都抽离到不同页面对应的js文件中可以方便后期的修改和排查问题第一步新建api文件夹并创建config js文件配置公共信息 const baseURL http xxxxxxxxxxx 配置公共地址并暴露 expor
[日常]实现windows的本地定时备份文件夹

虽然网上有一些免费的文件自动备份软件但是没有自己编写一段批处理来完成备份任务来的放心而且不用占用系统资源就给大家讲一下如何利用批处理完成本地文件或者文件夹的备份该方法可把某文件夹下的文件同步到另外的文件夹可忽略已经存在的文件可根
Can't use Subversion command line client:svn

1 在Intellij IDEA里checkout东西时出先这个错误提示 Can t use Subversion command line client svn Subversion command line client version
怎么将服务器文件移动到根目录,如何要移动的Nginx Web根目录移到新位置上的Ubuntu 16.04...

介绍在Ubuntu上在默认情况下 Nginx的Web服务器中存储其文件 var www html 通常位于根文件系统与操作系统的其余部分有时尽管将文档根目录移动到其他位置如单独安装的文件系统很有帮助例如如果您从同一Nginx
trading view实现

TradingView udf模式近期k线更新刚趟完坑简单总结一下第一步申请tv 官网地址 https cn tradingview com 注需以公司名义申请第二步相关资料文档 https b aitrade ga bo
特殊乘法。。

题目描述写个算法对两个小于1000000000的输入求特殊乘法的结果特殊乘法举例 123 45 1 4 1 5 2 4 2 5 3 4 3 5 输入两个小于1000000000的数输出输入可能有多组数据对于每组数据 Inpu
vue学习笔记3——外部引入css和路由的一部分

vue学习笔记3 外部引入css和路由的一部分从外部引入css文件在 vue文件中后面加的scoped是H5新特性可以锁定style的范围此处这样写就是说引入的css只在当前的vue的主页生效不加scoped的话可能会影响其他
Hadoop的伪分布式的安装及部署

文章目录需要的软件及源码包安装JDK Hadoop的部署安装 Hadoop的配置 Hadoop的使用做Hadoop的伪分布式我们分为一下几个步骤