windows部署hadoop-2.7.0

2023-05-16

        这里使用自己编译的hadoop-2.7.0版本部署在windows上,记得几年前,部署hadoop需要借助于cygwin,还需要开启ssh服务,最近发现,原来不需要借助cygwin,也无需开启ssh免密登录这些类linux的复杂流程。直接就可以sbin/start-all.cmd,开启了四个服务。

第一步、准备hadoop-2.7.0,其实就是自己编译,这里不介绍,可以直接在网上找已经编译好的windows版本。这里将我自己编译的放在github上。编译过的hadoop与一般下载的hadoop的区别在于bin目录,如果是windows,那么会有很多dll,lib等文件。主要的还是需要libwinutils.lib,winutils.exe这些文件。

第二步、既然能编译hadoop-2.7.0,那么本地环境肯定是有了jdk了,这里不介绍环境了,很简单,只需要jdk,一个编译好的hadoop-2.7.0,设置etc/hadoop/hadoop-env.cmd中的JAVA_HOME环境变量。这里需要注意,如果环境变量路径中有Program Files,需要修改为PROGRA~1,如下所示:

另外需要将hadoop目录作为环境变量HADOOP_HOME加入系统中,并将%HADOOP_HOME%\bin加入到Path环境变量中。 

接着就可以验证hadoop版本信息了:

第三步、修改配置core-site.xml,hdfs-site.xml,mapred-site.xml(默认是mapred-site.xml.template,重命名一下),yarn-site.xml

core-site.xml


<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>


hdfs-site.xml


<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/E:/software/hadoop-2.7.0/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/E:/software/hadoop-2.7.0/datanode</value>
    </property>
</configuration>


mapred-site.xml


<configuration>
     <property>
          <name>mapreduce.framework.name</name>
          <value>yarn</value>
     </property>
</configuration>


yarn-site.xml


<configuration>

<!-- Site specific YARN configuration properties -->
      <property>
          <name>yarn.nodemanager.aux-services</name>
          <value>mapreduce_shuffle</value>
      </property>
      <property>
          <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
          <value>org.apache.hadoop.mapred.ShuffleHandler</value>
      </property>
</configuration>

将配置文件中提到的文件夹datanode,namenode创建一下,另外创建一个tmp文件夹。

第四步、格式化数据 :hadoop namenode -format

第五步、启动hadoop-dfs和hadoop-yarn服务,直接运行sbin\start-all.cmd

这里会分别启动四个窗口,包含了namenode,datanode,resourcemanager,nodemanager服务。

namenode console 

datanode console 

resourcemanager console 

 

nodemanager console 

服务启动了,没有异常,可以进行进一步的验证。

jps查看服务

hdfs验证

mapreduce验证 :运行hadoop自带的示例 wordcount

hadoop jar share\hadoop\mapreduce\hadoop-mapreduce-examples-2.7.0.jar wordcount /user/hadoop/input \
/user/hadoop/output

查看wordcount运行结果: 

webui界面就不展示了,至此,windows上部署hadoop就演示完成了。重点是需要一个编译好的hadoop。 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

windows部署hadoop-2.7.0 的相关文章

  • 如何在 Windows 中利用 RDMA

    如何使用 RDMA 将内存块从一台服务器复制到 Windows 下的另一台服务器 我们没有 infiniband 但我们有 10GB 网络交换机 我所需要的只是一个例子 但我在谷歌上运气不佳 EDIT 好吧 到目前为止还没有人回答我的问题
  • Inno Setup中如何处理带空格的路径?

    我想允许带有空格的路径 例如program files 当使用 Inno Setup 安装我的程序时 但是 带有空格的路径会让我安装的服务崩溃 Inno 安装文件如下所示 Setup AppName Demo DefaultDirName
  • 批量修改XML文件

    好的 所以我不太熟悉使用 For F 如果文件是静态的并且有一组可以跳过然后从中提取数据的行 我可以修改它 我目前正在尝试修改 XML 文件 该文件将具有不同数量的行 但始终具有以下内容
  • os.path.expanduser("~") 的替代方案?

    在Python 2 7 x中 os path expanduser Unicode 已损坏 这意味着如果 的扩展中包含非 ASCII 字符 则会出现异常 http bugs python org issue13207 http bugs p
  • 30000 毫秒后量角器超时

    我正在尝试将量角器 e2e 测试集成到我的巡航控制中 我正在使用以下测试规范 describe index function var ptor it should have a title function browser get http
  • 检查上次更改密码的时间[关闭]

    Closed 这个问题是与编程或软件开发无关 help closed questions 目前不接受答案 Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话 但却具有历史意义 目前不接受新的
  • Python:获取Windows操作系统版本和架构

    首先 我不认为这个问题是重复的 在Python中检测64位操作系统 windows https stackoverflow com questions 2208828 detect 64bit os windows in python因为恕
  • 二进制模式下的 Windows 管道

    我在windows中编写了一个程序 它将播放通过stdin发送给它的二进制音频 我将其称为play 就像linux程序一样 然后我写了一个单独的程序如下 FILE f popen aplay exe wb FILE song fopen C
  • Impala:如何查询具有不同模式的多个镶木地板文件

    在 Spark 2 1 中我经常使用类似的东西 df spark read parquet path to my files parquet 即使具有不同的模式 也可以加载镶木地板文件的文件夹 然后我使用 SparkSQL 对数据帧执行一些
  • 如何在 Windows 中的命令提示符启动时运行命令

    EDIT 如果您想在计算机启动时执行任何任务或基于 活动这非常有帮助 http answers microsoft com en us windows forum windows 7 performance how to schedule
  • 简单的Java程序插入USB热点后速度慢100倍

    我有以下Java程序 class Main public static void main String args throws java io IOException long start System nanoTime java io
  • 同时触发 Windows 事件 id 4802 和 4803(调用和取消屏幕保护程序)

    事件 id 4803 关闭屏幕保护程序 在事件 id 4802 调用屏幕保护程序 之后立即触发 请注意 屏幕保护程序实际上仍然处于打开状态 直到检测到用户交互 我使用的是 Windows 8 1 在 Windows 7 上 事件 id 48
  • 如何从 Windows 批处理文件中的 ECHO 字符串中去除引号?

    我正在创建一个 Windows 批处理文件 但我必须 ECHO 一个大型复杂字符串 因此我必须在两端加上双引号 问题是引号也被回显到我正在写入的文件中 如何 ECHO 这样的字符串并去掉引号 UPDATE 我花了两天的时间研究这个问题 终于
  • 堆栈独立的C/C++蓝牙API?

    我想知道是否有适用于 Windows XP Vista 7 x86 和 x64 的堆栈独立 C C 蓝牙 api 我的目标是创建连接并通过蓝牙发送 接收一些时间关键的数据 我的研究给了我以下选择以及这项任务的缺点 用于蓝牙的 Windows
  • 使用.NET代码将系统时间同步到域控制器

    我要运行基于时间的测试 需要在测试期间多次更改系统时间 我希望能够在测试结束时将时间重新同步到域控制器时间 我有任何方法可以使用 NET 代码 C 来做到这一点 我正在使用以下位置的 p invoke 函数更改时间 使用 C 以编程方式设置
  • Windows GUI 控件 ID 是如何创建的?

    在 Windows 中 对于每个控件 例如每个对话框 窗口 文本框和复选框等 都会给出一个控件 ID 这个控件id是如何创建的 Windows 中的两个应用程序可以具有相同的控件 ID 吗 有没有办法手动设置 Windows 控件 ID 控
  • 将 file.lib 构建为可在 linux 上使用的 file.a

    我正在尝试将 api 从 Windows 移植到 Linux 到目前为止 我已经完成了 file cpp 和 file h 的工作 但我仍然有一个指定给 Windows 的库 lib 这是 api 工作所必需的 我怎样才能从这个库构建一个可
  • 在 Windows 安装项目中注册和取消注册 DLL

    我有几个 dll 文件需要在安装 卸载 Windows 安装程序时分别注册 取消注册 我尝试了以下方法 创建一个 bat 文件来注册 dll 问题是我无法在安装项目中使用 自定义操作 添加 bat 文件 另外 如何在卸载时运行注销dll 请
  • 在 Windows 下对 Unix 下创建的文件使用 fstream::seekg

    我有一个C 跨平台程序 在Linux下用g 编译 在PC下用Visual Studio编译 该程序将行写入文本文件 使用 lt lt 运算符和std endl 但也可以从生成的文本文件中读回数据 使用std getline 为了优化数据访问
  • 批处理 - IF ELSE 启动功能的条件无论如何都会执行

    提前抱歉 如果这里有一个线程可以回答我的问题 我从周五开始就一直在这个问题上并四处寻找 我确实发现了一些类似的问题 但我无法应用或适应这个问题 据我所知 简而言之 我有一个批处理脚本 它创建目录的文本文件 然后该脚本在目录中搜索文件 如果文

随机推荐

  • mysql密码中有特殊字符&在命令行下登录

    在服务器上 xff0c 通常为了快速登录数据库 xff0c 我们会使用mysql hhost uusername ppassword db的方式登录数据库 xff0c 如果密码中没有特殊字符 amp xff0c 会直接进入数据库sql命令行
  • ERROR 1093 (HY000): You can't specify target table 'student2' for update in FROM clause问题解决

    在做mysql嵌套子查询删除时 xff0c 出现如题错误 mysql语句如下 xff1a delete from student2 where id not in select id from student2 group by no na
  • Configured broker.id 2 doesn't match stored broker.id 1 in meta.properties

    kafka伪分布式集群安装报错 xff1a Configured broker id 2 doesn 39 t match stored broker id 1 in meta properties 这种情况只有在一台机器上部署两个brok
  • hbase1.0.0完全分布式安装

    hbase是Hadoop生态系统中重要的一员 xff0c 他是基于google bigtable的思想开发出来的开源列簇数据库 hbase的运行环境依赖于hdfs zookeeper 这里介绍完全分布式安装 前提 jdk安装 xff0c s
  • java操作hbase的增删改查

    首先需要将hbase安装目录下lib文件夹中的jar文件全部加入到项目类路径下 xff0c 另外还需要将hadoop相关jar包也加入 这里需要用到的主要API介绍一下 Configuration xff1a HBase参数配置对象 Con
  • windows安装解压版postgresql9.6

    1 下载并解压postgresql到系统一个目录 2 初始化数据库 初始化之前 xff0c 需要设置一个存储数据库的文件夹data目录 这里设置在postgresql安装目录下 进入安装目录 xff0c 运行如下命令 bin initdb
  • CentOS 7连接mysql 8提示2059 - authentication plugin ‘caching_sha2_password

    环境 xff1a CentOS 7 4 1708 mysql 8 0 11 Navicat 12 解决办法 1 由于myslq8不支持动态修改密码验证方式 xff0c 所以要先停止mysql systemctl stop mysqld se
  • mongodb副本集集群中节点出现recovering状态解决办法

    记录一次mongodb在生产环境中从节点出现recovering状态的问题解决过程 进入mongo shell命令行 xff0c 通过rs conf 命令查看节点状态 xff0c 出现RECOVERING 查看日志 xff0c 错误日志截图
  • mongodb3.4+sharding分片集群环境搭建

    背景 xff1a mongodb集群搭建方式有三种 xff0c 1 主从 官方已经不推荐 xff0c 2 副本集 xff0c 3 分片 这里介绍如何通过分片sharding方式搭建mongodb集群 sharding集群方式也基于副本集 x
  • eclipse+android开发logcat无法输出日志解决办法

    eclipse打开logcat视图 xff0c 应用程序启动 xff0c 连接设备 xff0c 即使logcat日志级别调试到verbose xff0c 仍然无法打印日志 问题在于adt版本和android版本不兼容 xff0c 如果你的a
  • 30分钟搞定个推sdk安卓客户端接入

    所需的工具 eclipse 43 adt 43 logcat 43 安卓手机 43 联网 1 注册成为个推开发者 个推官方网站 xff1a https dev getui com dev 2 登记应用 接下来 xff0c 填写应用详细信息
  • 30分钟搞定极光sdk安卓客户端接入

    1 注册成为极光开发者 xff0c 极光开发者平台官方网站 xff1a https www jiguang cn 2 登录极光开发者平台 xff0c 进入开发者服务 xff0c 创建应用 填写相关信息 xff0c 应用icon 应用名称 创
  • mina框架实现长连接与android客户端通信

    这篇文章也是通过学习mina框架视频来的 xff0c 网上也有很多类似的代码 xff0c 这里通过自己敲一遍代码 xff0c 熟悉mina框架的使用以及安卓编程 mina框架作为一个网络异步编程框架 xff0c 它和netty一样 xff0
  • rabbitmq开启webui界面管理

    默认情况下 xff0c 安装完成rabbitmq xff0c 启动成功 xff0c 并不会开启webui的http访问服务 通过rabbitmq plugins list查看rabbitmq插件 xff0c 发现rabbitmq manag
  • centos7下设置vi的colorscheme

    每次在centos机器上使用vi编辑文件 xff0c 发现总是默认的黑底白字 xff0c 效果非常不好 xff0c 于是 xff0c 开始着手让vi编辑界面有色彩 开始直接设置 etc virc 修改完成之后 xff0c 由于系统没有mur
  • windows上psycopg2安装过程

    psycopg2是python操作postgresql的扩展库 xff0c 在windows下 xff0c 可以通过pip install psycopg2来安装 刚开始安装时我的pip是anaconda自带的pip 在anaconda3
  • windows上安装Scrapy

    Scrapy是一个python系统网络爬虫框架 xff0c 应用广泛 通过pip install Scrapy安装 xff0c 始终提示Unable to find vsvarsdll bat 通过pip install Twisted x
  • BZOJ 4730: Alice和Bob又在玩游戏

    Description Alice和Bob在玩游戏 有n个节点 xff0c m条边 0 lt 61 m lt 61 n 1 xff0c 构成若干棵有根树 xff0c 每棵树的根节点是该连通块内编号最 小的点 Alice和Bob轮流操作 xf
  • 五分钟配置好vs2017+opencv3.4.1开发环境

    opencv提供了丰富的图像处理功能 xff0c 这里介绍vs2017 43 opencv开发环境配置 1 下载安装opencv 3 4 1 opencv官网地址 xff0c https opencv org xff0c 这里就下载wind
  • windows部署hadoop-2.7.0

    这里使用自己编译的hadoop 2 7 0版本部署在windows上 xff0c 记得几年前 xff0c 部署hadoop需要借助于cygwin xff0c 还需要开启ssh服务 xff0c 最近发现 xff0c 原来不需要借助cygwin