准备相关资源环境
运行环境 | 工具 |
Linux Centos 6.3 JDK 1.7.0_51 | SSH Secure Shell |
1. 下载Hadoop1.2
http://mirrors.cnnic.cn/apache/hadoop/common/hadoop-1.2.1/
这里下载的是hadoop-1.2.1.tar.gz,解压缩:
tar -zxvf hadoop-1.2.1.tar.gz
2. 配置系统环境变量
vi /hadoop/hadoop1.2.1/conf/hadoop-env.sh
3. 测试安装
source hadoop-env.sh
hadoop version
4. 运行前配置,由于Hadoop是分布式系统,要在单机上运行就要采用伪分布式方式
1) 在运行目录中,创建tmp hdfs/name hdfs/data目录
cd /hadoop/hadoop-1.2.1
mkdir tmp
mkdir hdfs
mkdir hdfs/name
mkdir hdfs/data
2) mapred-site.xml
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
3) hdfs-site.xml
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.name.dir</name>
<value>/hadoop/hadoop-1.2.1/hdfs/name</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>/hadoop/hadoop-1.2.1/hdfs/data</value>
</property>
</configuration>
4) core-site.xml
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/hadoop/hadoop-1.2.1/tmp</value>
</property>
</configuration>
5. 格式化namenode,不然的话在jps里找不到namenode
hadoop namenode -format
6. 执行启动
start-all.sh
7. 检查启动是否正常,应出现DataNode/NameNode/TaskTracker/SecondaryNameNode/JobTracker进程
8. 一切OK,恭喜Hadoop部署运行成功!
最后可自己去运行Hadoop-examples相关例子来试试效果,如:WordCount。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)