(一)win10安装hadoop 2.8.5(详细步骤)

2023-11-16

目录

1 JDK

2 Hadoop

2.1 下载

2.2 配置环境变量

2.3 配置文件

2.4 格式化hdfs

【已解决】格式化总是报错 The markup in the document following the root element must be well-formed

2.5 启动

【已解决】无法将“start-all.cmd”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。

3 参考


1 JDK

1.1 下载

按照自己的版本去官网下载(需要注册登录)    github下载

1.2 安装

安装按提示,唯一要注意的是:JDK的安装路径不要带空格!否则会报错“C:\Program不是内部或外部命令”。

所以不能装到 Program Files 目录下。

举栗子:E:\Hadoop\Java\jdk1.8.0_231

嗯……顺手把jre的安装目录也改了

1.3 配置环境变量

点开环境变量配置(不会可以百度,不截图)

1 新建系统变量

2 JAVA_HOME

3 安装JDK的文件目录,我安装在E:\Hadoop\Java\jdk1.8.0_231,就填这个,不是Jre的

1.4 成功测试

2 Hadoop

2.1 下载

官网下载Hadoop对应版本安装包,然后解压到目标网址即可:官网下载  镜像网站(更快)

注意:不要下错啦,不要上面src的压缩包

下完解压到对应位置就好

 

注意:Hadoop不支持win,因此还要下载winutils:github下载

找到对应的版本,用里面的文件替换hadoop\bin目录下的对应文件。(如何从 GitHub 上下载指定项目的单个文件或文件夹GitZip

我下下来的是压缩包,直接解压到对应bin目录,有重复文件全部替换(也可以解压后把文件copy到bin目录下,选择全部替换即可)

2.2 配置环境变量

要配置3条

2.3 配置文件

现在E:\Hadoop\hadoop-2.8.5目录下新建一个文件夹,建议就叫workspace,不同一也没关系。

在新建的文件目录下,新建三个文件,如下图。

打开E:\Hadoop\hadoop-2.8.5\etc\hadoop,开始复制粘贴修改工作,一共要配置4个文件.

core-site.xml 文件

这个地址后续实验经常用,请铭记  hdfs://localhost:9000

<configuration>
	<property>
        <name>hadoop.tmp.dir</name>
        <value>/E:/Hadoop/hadoop-2.8.5/workspace/tmp</value>
    </property>
    <property>
        <name>dfs.name.dir</name>
        <value>/E:/Hadoop/hadoop-2.8.5/workspace/name</value>
    </property>
    <property>
        <name>fs.default.name</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

<!-- 这个地址后续实验经常用,请铭记  hdfs://localhost:9000 -->

hdfs-site.xml

因为是单机版的,所以dfs.replication设置为1

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.data.dir</name>
        <value>//E:/Hadoop/hadoop-2.8.5/workspace/data</value>
    </property>
</configuration>

mapred-site.xml.template 文件 

<configuration>
	<property>
		<name>mapreduce.framework.name</name>
		<value>yarn</value>
	</property>
	<property>
		   <name>mapred.job.tracker</name>
		   <value>hdfs://localhost:9001</value>
	</property>
</configuration>

yarn-site.xml 

<configuration>
   <property>
       <name>yarn.nodemanager.aux-services</name>
       <value>mapreduce_shuffle</value>
    </property>
    <property>
       <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
       <value>org.apache.hadoop.mapred.ShuffleHandler</value>
    </property>
</configuration>

2.4 格式化hdfs

打开cmd 输入hdfs namenode -format

【问题】格式化总是报错 The markup in the document following the root element must be well-formed.

【解决】知道是上面四个文件配置出问题,但是无论如何修改都不行(度娘没用啊)

最后的解决办法是,删掉这四个文件,从能运行的hadoop里复制粘贴这四个文件,重新修改就OK了。github下载配置文件

2.5 启动

只要再路径中添加了sbin,就可以再cmd中输入start-all.cmd启动,输入stop-all.cmd关闭。

否则要在E:\Hadoop\hadoop-2.8.5\sbin目录下输入。

【问题】无法将“start-all.cmd”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。

【解决】未解决,不要用PowerShell,使用windows cmd替代即可。

3 参考

大数据入门(五)windows上搭建单机版Hadoop2.8(踩坑记录)

无法将“python”项识别为 cmdlet、函数、脚本文件或可运行程序的名称

如何从 GitHub 上下载指定项目的单个文件或文件夹 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

(一)win10安装hadoop 2.8.5(详细步骤) 的相关文章

随机推荐

  • 最新xmind2022版思维导图如何使用详解教程

    前段时间和大家盘点了五种高效的学习方法 没有看过的小伙伴戳这里 最科学的学习方法盘点 讲到思维导图笔记法的时候 本狗子给大家推荐了一款免费的思维导图软件 xmind软件 然后好多小伙伴都加我问关于思维导图的使用方法 于是今天我就做了一份关于
  • 微信小程序编译bug---Hbuilderx编译时一直卡在编译界面

    项目场景 微信小程序新增某功能模块 问题描述 使用Hbuilderx开发微信小程序 正常开发中 在某次重新保存代码并编译后一直卡在编译界面 如图 图为Hbuilderx界面 因为此时没有编译完成 所以微信开发者工具界面一片空白 报错为 ap
  • Python,OpenCV使用KNN来构建手写数字及字母识别OCR

    Python OpenCV使用KNN来构建手写数字及字母识别OCR 1 原理 1 1 手写数字识别 1 2 字母识别 2 源码 2 1 手写数字OCR 2 2 字母OCR 参考 这篇博客将介绍如何借助OpenCV提供的手写数字及字母数据集
  • Linux用户空间与内核空间

    Linux用户空间与内核空间 2012 08 30 15 39 1969人阅读 评论 1 收藏 举报 linux linux内核 struct user system allocation Linux 操作系统和驱动程序运行在内核空间 应用
  • 2.Xaml 停靠框架

    1 运行效果图片 2 Xaml程序
  • ChatGPT实现知识图谱生成

    知识图谱生成 在之前章节中 我们尝试过让 ChatGPT 对一段文本做实体识别和词性分析 结果很不错 但如果是需要长期留存下来 后续在不同场景下快速查询分析 最好还是要把数据存入到专门的图数据库中 才能方便随时读取 本节 我们试试让 Cha
  • 《计算机网络原理》(谢希仁)笔记——第二章

    此为本人观看韩立刚老师视频所做笔记与总结 下面为视频连接 https www bilibili com video av10921041 from search seid 733222547867341420 第二章 物理层 主要知识点为数
  • Verilog对数据进行四舍五入(round)与饱和(saturation)截位

    重点 1 正数截位 直接看截掉的最高位是不是一 是的话进一 负数截位 截的最高位为1且其它位不全是0进一 2 饱和 也就是大于求的结果 整数变为符号位为0 其它位为1 负数变成第一位为1 其它位为0 一 引言 在利用Verilog写数字信号
  • Python入门到放弃(一)

    介绍python和库文件管理 python是解释型语言 Python的特点 简单 易学 速度快 免费开源 高层语言 可移植性 解释性 面向对象 也支持面向过程 可扩展性 可嵌入性 丰富的库 规范的代码 在cmd中退出python 输入exi
  • Tomcat优化相关问题

    1 你怎样给 tomcat 去调优 JVM 参数调优 Xms 表示 JVM 初始化堆的大小 Xmx表示 JVM 堆的最大值 这两个值的大小一般根据需要进行设置 当应用程序需要的内存超出堆的最大值时虚拟机就会提示内存溢出 并且导致应用服务崩溃
  • Spark(七)——累加器和广播变量

    5 累加器 通过在驱动器中调用SparkContext accumulator initialValue 方法 创建出存有初始值的累加器 返回值为org apache spark Accumulator T 对象 其中 T 是初始值 ini
  • ObjectARX编程(八) --------有名对象字典、用户字典和字典中的对象

    在AutoCAD数据库中 对象字典是字典类型数据库对象的总称 按其层次关系可分为两类 一是有AutoCAD数据库直接管理的第一层对象字典 二是有第一层对象字典管理的第二层对象字典 为了便于区别 我们把第一层对象字典称为有名对象字典 用于在应
  • 浅谈std::move和std::forward原理

    前言 本文主要整理了C 11中std move和std forward的原理 这对理解C 的移动拷贝有很重的意义 一 左值和右值 左值 一般来说 能在内存中取得其地址 即是左值 右值 在内存在无取得其地址的 即是右值 note 左值持久 右
  • Python中MNE库模拟原始脑电数据

    研究脑电算法的时候发现了一个问题 如何评价模型的准确性 之前的工作流程都是先用公开数据集的数据训练好模型 然后放到实测数据上进行参数微调 在公开数据集上进行模型的选择主要是因为公开数据集的数据质量较好 可以排除硬件的影响 从而专心于算法的研
  • RTL仿真验证

    注意 个人学习笔记 后续会进行修改完善 目前还在初步学习阶段 参考gitee上 从零开始写RISC V处理器 在写testbench文件时 有两点需要注意的 第一点就是在testbench文件里加上读指令文件的操作 initial begi
  • Pandas中插入新的行或列

    python中插入新行或列 前言 一 新增列 二 新增行 前言 在特定位置插入行或者列是比较常用的操作 具体的插入操作主要是在哪插入和插入什么 提示 以下是本篇文章正文内容 下面案例可供参考 一 新增列 在pandas中新增列用到的是ins
  • 编写C++中的两个类 一个只能在栈中分配空间 一个只能在堆中分配(腾讯2012面试题)

    编写C 中的两个类 一个只能在栈中分配空间 一个只能在堆中分配 腾讯2012面试题 这道题挺好的 HeapOnly cpp include
  • windows修改远程端口号

    windows远程桌面默认使用的是3389 为了提高服务器安全性 可以修改默认端口3389为其它端口号 端口使用原则 TCP与UDP段结构中端口地址都是16比特 所以端口范围在0 65535 对于这65536个端口号有以下的使用规定 1 端
  • java 根据已有ppt模板修改其内容

    现有需求 根据数据库数据 定期更新 ppt 报表内容 本文修改内容 主要是 ppt中的图表 测试ppt 代码 package org springblade bigdata ureport service impl import java
  • (一)win10安装hadoop 2.8.5(详细步骤)

    目录 1 JDK 2 Hadoop 2 1 下载 2 2 配置环境变量 2 3 配置文件 2 4 格式化hdfs 已解决 格式化总是报错 The markup in the document following the root eleme