ubuntu 11配置hadoop

2023-11-19

最近没事，研究下ubuntu 配置hadoop！

ubuntu版本:64 bit 11.04

hadoop版本: hadoop1.2.1

一、在Ubuntu下创建hadoop用户组和用户;

1. 创建hadoop用户组;

sudo addgroup hadoop

2. 创建hadoop用户;

sudo adduser -ingroup hadoop hadoop

3. 给hadoop用户添加权限，打开/etc/sudoers文件;

sudo gedit /etc/sudoers

按回车键后就会打开/etc/sudoers文件了，给hadoop用户赋予root用户同样的权限。

在root ALL=(ALL:ALL) ALL下添加

hadoop ALL=(ALL:ALL) ALL

二、在Ubuntu下安装JDK

下载适合自己系统的jdk并配置JAVA环境变量，

http://blog.csdn.net/wei_ge163/article/details/8060534

三、安装ssh服务

sudo apt-get install ssh

openssh-server

四、建立ssh无密码登录本机
1.换成hadoop用户
su - hadoop

2.创建ssh-key
ssh-keygen -t rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys //将id_rsa.pub追加到authorized_keys授权文件
chmod 777 ~/.ssh/authorized_keys
scp ~/.ssh/id_rsa.pub hadoop@localhost:~/

3.登录localhost;
ssh localhost
( 注：当ssh远程登录到其它机器后，现在你控制的是远程的机器，需要执行退出命令才能重新控制本地主机。)

4.执行退出命令;
exit

五、安装hadoop

我们采用的hadoop版本是：hadoop-1.2.1（http://www.apache.org/dyn/closer.cgi/hadoop/common/
1.假设hadoop-1.2.1.tar.gz在/work，将它复制到安装目录 /usr/local/下；
sudo cp hadoop-1.2.1.tar.gz /usr/local/
2.解压hadoop-0.20.203.tar.gz；
cd /usr/local
sudo tar -zxf hadoop-1.2.1.tar.gz
3. 将解压出的文件夹改名为hadoop;
sudo mv hadoop-1.2.1 hadoop
4.将该hadoop文件夹的属主用户设为hadoop，
sudo chown -R hadoop:hadoop hadoop
5.打开hadoop/conf/hadoop-env.sh文件;
sudo gedit hadoop/conf/hadoop-env.sh

6.配置conf/hadoop-env.sh（找到#export JAVA_HOME=...,去掉#，然后加上本机jdk的路径）;
export JAVA_HOME=/usr/lib/jvm/java-6-openjdk

7.打开conf/core-site.xml文件;
sudo gedit hadoop/conf/core-site.xml
编辑如下：property后面需要手工敲
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>
<property>
    <name>fs.default.name</name>
    <value>hdfs://localhost:9000</value>
</property>
</configuration>

8. 打开conf/mapred-site.xml文件;
sudo gedit hadoop/conf/mapred-site.xml
编辑如下property后面需要手工敲：
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

    <configuration>
     <property>
      <name>mapred.job.tracker</name>
      <value>localhost:9001</value>
     </property>

</configuration>

9. 打开conf/hdfs-site.xml文件;

sudo gedit hadoop/conf/hdfs-site.xml
编辑如下：
<configuration>
<property>
    <name>dfs.name.dir</name>
    <value>/usr/local/hadoop/datalog1,/usr/local/hadoop/datalog2</value>
</property>

<property>
    <name>dfs.data.dir</name>
    <value>/usr/local/hadoop/data1,/usr/local/hadoop/data2</value>
</property>

<property>
    <name>dfs.replication</name>
    <value>2</value>
</property>
</configuration>

10.打开conf/masters文件，添加作为secondarynamenode的主机名，作为单机版环境，这里只需填写 localhost
sudo gedit hadoop/conf/masters

11.打开conf/slaves文件，添加作为slave的主机名，一行一个。作为单机版，这里也只需填写 localhost
sudo gedit hadoop/conf/slaves

六、在单机上运行hadoop
1.进入hadoop目录下，格式化hdfs文件系统，初次运行hadoop时一定要有该操作，
cd /usr/local/hadoop/
bin/hadoop namenode -format
注：可以在/etc/profile中导入如下:
$ export HADOOP_INSTALL=/usr/local/hadoop
$ export PATH=$PATH:$HADOOP_INSTALL/bin

2.启动bin/start-all.sh
bin/start-all.sh

3.检测hadoop是否启动成功
jps
如果有Namenode，SecondaryNameNode，TaskTracker，DataNode，JobTracker五个进程，就说明你的hadoop单机版环境配置好了，然后可以通过firefox浏览器查看，使用http://localhost:50030/

注意：Hadoop的各组件都可以用xml文件进行配置。
一般配置的话，主要是三个配置文件(全在$HADOOP_INSTALL的conf目录)：
    core-site.xml：用于配置Common组件的属。
    hdfs-site.xml：用于配置HDFS的属性，
    HDFS顾名思义Hadoop Distributed File System，Hadoop分布式文件系统。
    mapred-site.xml：用于配置MapReduce属性。

在Hadoop的早期版本中，只有一个配置文件来配置这三项，叫hadoop_site.xml的配置文件，后期开始分为三个，一一对应个组件。属性内容不变，仅仅是分开。
另外，在docs目录中还有对应的三个html文件，分别保存着各组件的默认设置。

Hadoop的三种运行模式：
第一：独立模式（standalone）或者本地模式（local model）
此模式无需守护进程，所有的程序都在单个的虚拟机上运行。
由于在本地模式下测试和调试MapReduce程序很方便，所以一般来说比较适用于开发阶段。
第二：伪分布模式（pseudo-distributed model）
顾名思义，一个模拟的小规模的集群，Hadoop守护进程运行在本地环境中。一般用作测试环境
第三：全分布模式（fully distributed model）
这才是真实的，Hadoop守护进程运行在真正的集群环境。一般作为产品环境。

注：在无论哪个模式下去运行Hadoop都需要关注两个重要因素：
1.是否启动Hadoop守护进程，2.是否已经正确配置各属性。

下面这个表里简单列举了三种模式下的所需的最小属性配置集合：

组件名称	属性名称	独立模式	伪分布模式	全分布模式
Common	fs.default.name	file:/// （默认）	hdfs://localhost/	hdfs://namenode/
HDFS	dfs.replication	N/A	1	3 （默认）
MapReduce	mapred.job.tracker	local （默认）	localhost:8021	jobtracker:8021

三种模式下的配置：

本机模式：

一般Hadoop安装后默认属性就是本地模式（独立模式），所以一般来说，不用进行更多的配置。

三个配置文件内容如下：

－－－－－core-site.xml－－－－－

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

</configuration>

<?xml version="1.0"?>

－－－－－mapred-site.xml－－－－－

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

</configuration>

－－－－－mapred-site.xml－－－－－

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

</configuration>

伪分布模式：

三个配置配置文件内容如下：

－－－－－core-site.xml－－－－－

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>fs.default.name</name>

<value>hdfs://localhost/</value>

</property>

</configuration>

<?xml version="1.0"?>

－－－－－mapred-site.xml－－－－－

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>dfs.replication</name>

</property>

</configuration>

－－－－－mapred-site.xml－－－－－

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>mapred.job.tracker </name>

<value>localhost:8021</value>

</property>

</configuration>

全分布模式：

三个配置配置文件内容如下：

－－－－－core-site.xml－－－－－

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>fs.default.name</name>

<value>hdfs://namenode/</value>

</property>

</configuration>

<?xml version="1.0"?>

－－－－－mapred-site.xml－－－－－

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>dfs.replication</name>

</property>

</configuration>

－－－－－mapred-site.xml－－－－－

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>mapred.job.tracker </name>

<value>jobtracker:8021 </value>

</property>

</configuration>

参考：http://www.cnblogs.com/tippoint/archive/2012/10/23/2735532.html

http://www.cnblogs.com/shannyn/archive/2013/08/28/3287443.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java基础

ubuntu 11配置hadoop 的相关文章

Java操作Excel文件

创建一个Excel文件 public static void creatExcelFile String filepath Workbook wb new XSSFWorkbook try FileOutputStream fileOut
Java IO流缓冲流-BufferedInputStream、BufferedOutputStream

首先抛出一个问题有了InputStream为什么还要有BufferedInputStream BufferedInputStream和BufferedOutputStream这两个类分别是FilterInputStream和FilterO
Calendar的使用

Calendar Calendar是一个抽象类构造器被protected修饰需要通过getInstance 获取实例 public static void main String args Calendar instance Calen
Swagger3 注解使用（Open API 3.0）

文章目录前言一 swagger 3 的使用 Swagger SpringFox 3 0 相关特性 SpringDoc 二从 spring fox 迁移到 springdoc 三使用 swagger3 注解代替 swagger2 的
接口的加密解密

接口加密 1 接口参数加密基础加密 2 接口参数加密接口时效性验证一般达到这个级别已经非常安全了 3 接口参数加密时效性验证私钥达到这个级别安全性固若金汤 4 接口参数加密时效性验证私钥 Https 我把这个级别称之为金钟罩
使用jemeter进行压力测试关注的指标

一压测设置线程数并发数量能跑多少量具体说是一次存在多少用户同时访问 Rame Up Period in seconds 表示JMeter每隔多少秒发动并发理解成准备时长设置虚拟用户数需要多长时间全部启动如果线程数是20 准备
Java特训的第一天——开篇

我是一名刚入门的Java菜鸟我选择Java的原因是因为其语法简单功能强大从web 到桌面到嵌入式无所不能下面我将谈一谈我对Java语言的认识 Java语言概述关于Java的介绍网上有很详细的阐述我在这里就不再细述了下面只简
java Map集合

目录一介绍二 HashMap 三 TreeMap 四 LinkedHashMap 一介绍 Java中的Map是一种键值对的集合数据类型用于存储无序的不重复的键值对它提供了快速的查找和访问功能可以根据键来获取值常见的Map实
各种注释总结

jsp注释 html注释
POI解析word\pdf中表格
java 泛型作用与定义

1 泛型方法的定义和使用 public static void main String args throws ClassNotFoundException String str get 哈士奇 world System out print
MVC模型图

MVC图
求一个数组的最大值最小值及其下标

求一个数组的最大值最小值及其下标思路假定一个数为最大值如果有个数比假定的最大值还大那么该数就为最大值最小值同理使用for循环 public class MaxMin public static void main String
JAVA--GUI（2）--布局

布局为了更好适应不同平台而引入的概念 Java的布局管理器是一个实现了LayoutManager接口的实例用户无法设置setLocation 这些方法如果想自己设置则需要取消布局管理器采用布局管理器边界布局顺序布局网格布局卡
多线程下载文件（支持暂停、取消、断点续传）

多线程下载文件支持暂停取消断点续传多线程同时下载文件即在同一时间内通过多个线程对同一个请求地址发起多个请求将需要下载的数据分割成多个部分同时下载每个线程只负责下载其中的一部分最后将每一个线程下载的部分组装起来即可涉及的知
IDEA 编写JDBC 第一个示例

知心惟有雕梁燕自来相伴东风不管琵琶怨落花吹遍一新建一个Module 二在此Module下新建一个包在包再建一个包命名为lib 三导入mysql驱动四将mysql驱动添加到项目的库里五代码实现 package Con
设计模式(2)

2 2 结构型模式结构型模式一共有七种其中适配器模式和装饰模式统称为包装模式装饰模式和代理模式的类图基本相同但目的不同这些有相似目的或者有相似结构的模式需要对其概念辨析清楚才能较好地掌握下面将对结构型模式分别进行介绍 2 2
黑豹程序员-统一身份认证接口

术语和定义 1 IAM Identity Access Manager 统一身份认证系统 2 IDM Identity Manager 身份管理 3 SSO Single Sign On 单点登录 4 AD Active Directory
黑豹程序员-统一身份认证接口

术语和定义 1 IAM Identity Access Manager 统一身份认证系统 2 IDM Identity Manager 身份管理 3 SSO Single Sign On 单点登录 4 AD Active Directory
黑豹程序员-字符串中查找出重复的字符串

Collections frequency codeList element 字符串element 在codeList集合中重复的次数 List

随机推荐

Vulkan再探（7）：纹理贴图

08 20 2020 文章目录纹理贴图 Texture Mapping 纹理属性加载图片临时缓冲区储存图片信息生成贴图等级生成图像和存储空间难点传输数据图解拷贝缓冲区到图像创建采样器创建图像视图创建组合图像采样器描述
Vulkan 绘制显示设计

背景众所周知 Vulkan是个跨平台的图形渲染API 为了友好地支持跨平台 Vulkan自然也抽象出了很多接口层去对接各个操作系统抹平系统间的差异 Swap Chains即为WSI 其本质上是一种图像队列此队列会按顺序依次将队列中的若
《深入理解java虚拟机》第二章

1 运行数据区域 1 1线程私有 1 1 1 程序计数器字节码解释器通过程序计数器里的数值来寻找下一条要执行的指令执行native方法无程序计数器值无OOM 1 1 2 java虚拟机栈每一个方法运行时都会建立一个栈帧栈帧用来存储
深度学习中卷积和池化的一些总结

最近完成了hinton的深度学习课程的卷积和池化的这一章节了马上就要结束了这个课程的作业我写的最有感受待我慢慢说来 1 里面有几个理解起来的难点一个是卷积可以这么来理解这幅图是对一个5 5的矩阵A进行3 3的矩阵B的卷积那么就
大数据分析系统

1 概念分类数据分析系统的主要功能是从众多外部系统中采集相关的业务数据集中存储到系统的数据库中系统内部对所有的原始数据通过一系列处理转换之后存储到数据仓库的基础库中然后通过业务需要进行一系列的数据转换到相应的数据集市供其他
LeetCode刷题——剑指offer位运算题目汇总（包含快速乘、快速幂、二进制加法）

剑指offer位运算题目汇总剑指 Offer II 001 整数除法剑指 Offer II 002 二进制加法剑指 Offer II 003 前 n 个数字二进制中 1 的个数剑指 Offer II 004 只出现一次的数字剑指
手摸手，带你用vue撸后台系列四(vueAdmin一个极简的后台基础模板)（好文章！！）

转载自原文格式清晰 https juejin im post 6844903486241374221 完整项目地址 vue element admin 系列文章手摸手带你用 vue 撸后台系列一基础篇手摸手带你用 vue 撸后
【CSDN】删除文章后,浏览量会减少吗？了解软删除和硬删除

hello 我是小索奇如果你也在博客写作的话有没有考虑到一个问题文章删除后浏览量会减少吗下面就给大家阐述一下当在CSDN中删除已发布的文章后该文章的浏览量统计会有以下情况软删除状态的文章浏览量统计会保留不会下降或者重置
html+css+javascript 之间的关系与作用

三者间的关系一个基本的网站包含很多个网页一个网页由 html css 和 javascript 组成 html 是主体装载各种 dom 元素 css 用来装饰 dom 元素 javascript 控制 dom 元素用一扇门比喻三者间
springboot多模块打包配置问题

工程案例结构 baidu 聚合过程 baidu web 子模块web工程 baidu service 子模块 baidu config 子模块配置工程注意事项配置步骤 1 baidu 聚合工程工程下的 pom xml 文件案列如下
【云原生之k8s】K8s 管理工具 kubectl 详解（二）

K8S模拟项目 Kubectl是管理k8s集群的命令行工具通过生成的json格式传递给apiserver进行创建查看管理的操作帮助信息 root localhost bin kubectl help kubectl controls
mysqlbinglog基于即时点还原

mysqlbinglog基于即时点还原 mysqlbinlog介绍要想从二进制日志恢复数据你需要知道当前二进制日志文件的路径和文件名一般可以从选项文件即my cnf or my ini 取决于你的系统中找到路径 mysql5 7开
SAR成像系列：【3】合成孔径雷达（SAR）的二维回波信号与简单距离多普勒（RD）算法（附matlab代码）

合成孔径雷达发射信号以线性调频信号 LFM 为基础目前大部分合成孔径雷达都是LFM体制为了减轻雷达重量也采用线性调频连续波 FMCW 体制为了获得大带宽亦采用线性调频步进频 FMSF 体制 1 LFM信号 LFM的主要特点在于可以使载
操作系统内存管理——分区、页式、段式、段页式管理

1 内存管理方法内存管理主要包括虚地址地址变换内存分配和回收内存扩充内存共享和保护等功能 2 连续分配存储管理方式连续分配是指为一个用户程序分配连续的内存空间连续分配有单一连续存储管理和分区式储管理两种方式 2 1 单一连续存
谈谈Qt信号与槽

关于Qt信号与槽 Qt信号与槽本质类似观察者模式观察者模式 Observer Pattern 定义对象间的一种一对多依赖关系使得每当一个对象状态发生改变时其相关依赖对象皆得到通知并被自动更新观察者模式又叫做发布订阅 Publish
5G Capital一年，“首都标准”初现

在北京生活许多年如果问我什么时候京味浓度最高答案可能是下了飞机走上出租车的那一刻北京司机连闲聊都是一副见过世面的样子你研究人工智能我觉得吧交通管理就该这样那样高铁咱都造出来了什么高科技我看中国人很快就能搞出来冬奥会场馆建得
scatter函数绘制散点图——MATLAB

1 scatter X Y 在矢量X和Y指定的位置显示彩色圆如 scatter 1 2 3 4 4 5 6 7 效果如图默认彩色圆为蓝色空心圆 2 scatter X Y S S确定每个标记的面积 S可以是与X和Y相同长度的矢量或标量
Gibbs 采样基本原理和仿真

Gibbs 采样基本原理和仿真文章目录 Gibbs 采样基本原理和仿真 1 基本概念 1 1 Gibbs采样算法 1 2 Markov链 1 2 1 Markov链的定义 1 2 2 Markov链的细致平稳条件 1 2 3 Markov
初学者怎么高效率学习c语言？

想学C语言我们首先的了解C语言是什么它是一门面向过程的抽象化的通用程序设计语言广泛应用于底层开发 C语言能以简易的方式编译以及处理低级存储器 C语言是仅产生少量的机器语言以及不需要任何运行环境支持就可以运行的高效率程序设计语言尽管C
ubuntu 11配置hadoop

最近没事研究下ubuntu 配置hadoop ubuntu版本 64 bit 11 04 hadoop版本 hadoop1 2 1 一在Ubuntu下创建hadoop用户组和用户 1 创建hadoop用户组 sudo addgroup

ubuntu 11配置hadoop

ubuntu 11配置hadoop 的相关文章

随机推荐

热门标签