centOS7下Spark安装配置

2023-10-31

    环境说明:
        操作系统: centos7 64位 3台
        centos7-1 192.168.190.130 master
        centos7-2 192.168.190.129 slave1
        centos7-3 192.168.190.131 slave2

    安装spark需要同时安装如下内容:
    jdk  scale  

    1.安装jdk,配置jdk环境变量
    这里不讲如何安装配置jdk,自行百度。

    2.安装scala

    下载scala安装包,https://www.scala-lang.org/download/选择符合要求的版本进行下载,使用客户端工具上传到服务器上。解压:
    #tar -zxvf scala-2.13.0-M4.tgz

    再次修改/etc/profile文件,添加如下内容:
    export SCALA_HOME=$WORK_SPACE/scala-2.13.0-M4
    export PATH=$PATH:$SCALA_HOME/bin

    #source /etc/profile      // 让其立即生效
    #scala -version           //查看scala是否安装完成

    3.安装spark

    spark下载地址:http://spark.apache.org/downloads.html 
    说明:有不同的版本包下载,选则你需要的下载安装即可
    Source code: Spark 源码,需要编译才能使用,另外 Scala 2.11 需要使用源码编译才可使用
    Pre-build with user-provided Hadoop: “Hadoop free” 版,可应用到任意 Hadoop 版本
    Pre-build for Hadoop 2.7 and later: 基于 Hadoop 2.7 的预先编译版,需要与本机安装的 Hadoop 版本对应。可选的还有 Hadoop 2.6。我这里因为装的hadoop是3.1.0,所以直接安装for hadoop 2.7 and later的版本。
            注:hadoop的安装请查看我的上一篇博客,不在重复描述。

centOS7下Spark安装配置

#mkdir spark 
#cd /usr/spark
#tar -zxvf spark-2.3.1-bin-hadoop2.7.tgz
#vim /etc/profile
#添加spark的环境变量,加如PATH下、export出来
#source /etc/profile
#进入conf目录下,把spark-env.sh.template拷贝一份改名spark-env.sh
#cd /usr/spark/spark-2.3.1-bin-hadoop2.7/conf
#cp spark-env.sh.template spark-env.sh
#vim spark-env.sh
export SCALA_HOME=/usr/scala/scala-2.13.0-M4
export JAVA_HOME=/usr/lib/jvm/jre-1.8.0-openjdk-1.8.0.171-8.b10.el7_5.x86_64
export HADOOP_HOME=/usr/hadoop/hadoop-3.1.0
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export SPARK_HOME=/usr/spark/spark-2.3.1-bin-hadoop2.7
export SPARK_MASTER_IP=master
export SPARK_EXECUTOR_MEMORY=1G
#进入conf目录下,把slaves.template拷贝一份改名为slaves
#cd /usr/spark/spark-2.3.1-bin-hadoop2.7/conf
#cp slaves.template slaves
#vim slaves
#添加节点域名到slaves文件中
#master     //该域名为centos7-1的域名
#slave1     //该域名为centos7-2的域名
#slave2     //该域名为centos7-3的域名

启动spark
#启动spark之前先要把hadoop节点启动起来
#cd /usr/hadoop/hadoop-3.1.0/
#sbin/start-all.sh
#jps //检查启动的线程是否已经把hadoop启动起来了
#cd /usr/spark/spark-2.3.1-bin-hadoop2.7
#sbin/start-all.sh

备注:在slave1\slave2节点上也必须按照上面的方式安装spark,或者直接拷贝一份到slave1,slave2节点上
#scp -r /usr/spark root@slave1ip:/usr/spark

启动信息如下:

starting org.apache.spark.deploy.master.Master, logging to /usr/spark/logs/spark-root-org.apache.spark.deploy.master.Master-1-master.out
slave2: starting org.apache.spark.deploy.worker.Worker, logging to /usr/spark/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-slave2.com.cn.out
slave1: starting org.apache.spark.deploy.worker.Worker, logging to /usr/spark/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-slave1.com.cn.out
master: starting org.apache.spark.deploy.worker.Worker, logging to /usr/spark/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-master.out

测试Spark集群:
用浏览器打开master节点上的spark集群url:http://192.168.190.130:8080/

centOS7下Spark安装配置

转载于:https://blog.51cto.com/4837471/2141885

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

centOS7下Spark安装配置 的相关文章

随机推荐

  • 前端例程20220802:玻璃背光按钮

    演示 原理 使用元素包裹按钮 按钮设置为玻璃质感 设置光标悬停动画 使用元素的before和after两个元素作为背景灯光 设置光标悬停动画 代码
  • cmd for命令

    for命令式批处理命令中最复杂也是功能最为强大的一个命令 它可以对一组不同的文件或数据进行循环处理 FOR variable variable IN set DO command command parameters variable 指定
  • pytorch语义分割-全卷积网络

    文章目录 1 语义分割和实例分割 2 语义分割的数据集处理 3 转置卷积 4 全卷积神经网络 FCN 1 语义分割和实例分割 2 语义分割的数据集处理 最重要的语义分割数据集之一是Pascal VOC2012 matplotlib inli
  • linux 可能从硬盘安装吗,从硬盘安装linux(radHat)

    1 gt 从网上下载redhat iso安装文件 并放在同一文件夹中 2 gt 用WinISO解开第一张盘的 iso文件 如解到cd1文件加中 不用全部解出 只要dosutils子文件夹就可以了 3 gt 进入MS DOS打开cd1文件夹的
  • 使用可视化库matplotlib绘图时,plt.show()过后只出现Figure size 640x480 with 1 Axes而没有生成图片

    使用可视化库matplotlib绘图时 plt show 过后只出现
  • Tomcat源码:Acceptor与Poller、PollerEvent

    参考资料 Tomcat源码解析系列 十一 ProtocolHandler Tomcat源码解析系列 十二 NioEndpoint 前文 Tomcat源码 启动类Bootstrap与Catalina的加载 Tomcat源码 容器的生命周期管理
  • 联想计算机连接不上蓝牙耳机,thinkpad如何连接蓝牙耳机_thinkpad连接蓝牙耳机的步骤...

    现在的电脑一般都配备有蓝牙功能 可以方便用户们使用一些蓝牙设备 例如最近就有小伙伴问小编thinkpad如何连接蓝牙耳机 那么针对这一问题 今天小编就来为大家整理分享关于thinkpad连接蓝牙耳机的步骤 一起往下看吧 具体步骤如下 1 先
  • VB封装DLL并调用

    首先明确DLL函数是什么 DLL 动态链接库 Dynamic Link Library 一个DLL文件里面可以包含多个函数 其实就是实现共享函数的一种方式 一个应用程序可能需要多个DLL联合起来才可以正常使用 一 新建ActiveX Dll
  • SpringCloud PK K8s 谁更胜一筹

    SpringCloud PK K8s 谁更胜一筹 Spring Cloud 和 Kubernetes 都声称自己是开发和运行微服务的最佳环境 但它们在本质上有很大的不同 解决的问题也不同 在本文中 我们将看看每个平台是如何交付基于微服务架构
  • 在Eclipse中进行Junit测试的个人总结

    1 怎样在Eclipse中集成使用Junit 想要在Eclipse这个IDE中集成使用Junit 首先需要下载Junit的包 具体下载方式可以自行查阅或翻看我之前有关Junit的博客的前半部分 下载完成后 进入Eclipse 打开工程 左键
  • 转帖:如何注册Filter

    参考文章 http apps hi baidu com share detail 16291532 AX文件的一个对外接口DllRegisterServer 由外部调用 比如注册AX的时候 regsvr32 xxx ax 通常情况下 我们的
  • Web3和 NFT将如何影响电子商务?

    每日更新 欢迎交流 感兴趣可以点个关注 你有没有发现 万维网上有很多改变 并且改变速度还很快 也许你已经读到过青少年将数字资产卖到数百万美元 匿名的加密货币创始人颠覆了传统的金钱概念 那么 这些新的 令人兴奋的 而且通常是奇怪的东西到底是关
  • F#的尾递归编译优化需要再好好优化优化

    先来看一道简单的算法题 给定一个整数序列 给定一个目标值 求出该序列中任意三个数之和中最接近目标值的那个数 这道题很容易想到的算法 对序列做从小到大排序 固定其中一个数的下标a 对剩下的两个数双指针b c 指向a右侧区域 窗口 的两端 根据
  • 连Hibernate技术都不清楚,你敢说你自己会ORM框架?

    前言 ORM框架不是一个新话题 它已经伴随我们很多年了 它提供了概念性的 易于理解的数据模型 将数据库中的表和内存中的对象建立了很好的映射关系 在Java中常用的ORM框架主要有两个 Hibernate和iBatis 本篇文章主要介绍Hib
  • SpringBoot 2.6.3 web(静态资源、欢迎页、favicon.ico)

    一 静态资源 静态资源访问路径 static or public or resources or META INF resources 访问方式 项目根路径 静态资源文件名 静态映射 请求进来先在controller中判断能 不能处理 不能
  • SOAP教程[转]

    SOAP教程 需要帮助 SOAP是一个简单的基于XML的协议 它让应用程序跨HTTP进行信息交换 在我们的SOAP教程 你将了解什么是SOAP 以及它是怎样利用XML来让程序间的信息进行交换的 内容目录 SOAP 介绍This chapte
  • qt富文本编辑基本知识(QTextBlockFormat、QTextListFormat)

    可以参考该文章 QTextBlockFormat QTextListFormat 程序员大本营 核心知识如下 如果想开发一个富文本编辑器 html markdown等常见格式 Qt已经为用户完成了几乎所有与编辑有关的具体工作 我们所要做的就
  • yarn中的container概念

    http dongxicheng org mapreduce nextgen understand yarn container concept 步骤1 用户将应用程序提交到ResourceManager上 步骤2 ResourceMana
  • Go语言面试题--基础语法(6)

    文章目录 1 关于init函数 下面说法正确的是 2 下面这段代码输出什么以及原因 3 下面这段代码能否编译通过 如果可以 输出什么 1 关于init函数 下面说法正确的是 A 一个包中 可以包含多个 init 函数 B 程序编译时 先执行
  • centOS7下Spark安装配置

    环境说明 操作系统 centos7 64位 3台 centos7 1 192 168 190 130 master centos7 2 192 168 190 129 slave1 centos7 3 192 168 190 131 sla