spark-on-mesos

2023-11-13

参考网址：https://spark.apache.org/docs/latest/running-on-mesos.html
https://mesos-cn.gitbooks.io/mesos-cn/content/OverView/spark-on-mesos.html
http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/FileSystemShell.html#put
http://mesos.apache.org/documentation/latest/configuration/agent/
https://spark.apache.org/docs/latest/configuration.html

节点	mesos 角色	hdfs 角色	spark 角色
192.168.122.131	master.mesos	hdfs namenode、secondarynode	spark driver 、spark-shell
192.168.122.132	slave1.mesos	hdfs datanode
192.168.122.133	slave2.mesos	hdfs datanode

1、安装meos

安装mesos请参考官方网站或者我的一篇博客http://blog.csdn.net/wenwenxiong/article/details/78352181

2、安装hdfs

下载hadoop二进制包，修改配置文件core-site.xml 、hdfs-site.xml、mapred-site.xml、yarn-site.xml。最主要配置core-site.xml 、hdfs-site.xml。修改hadoop-env.sh中的JAVA _HOME变量。
配置的修改参考https://github.com/krejcmat/hadoop-docker/tree/master/hadoop-master/files/hadoop
各节点配置环境变量HADOOP_HOME、JAVA_HOME、PATH

#for java
export JAVA_HOME=/root/jdk1.8.0_65
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=$JAVA_HOME/lib:$JRE_HOME/lib:.
export PATH=$JAVA_HOME/bin:$PATH
#for maven
export PATH=/root/apache-maven-3.5.0/bin:$PATH

#for hadoop
export HADOOP_HOME=/root/hadoop-2.7.2
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

各节点运行下面命令启动 hdfs

hadoop-daemon.sh start namenode
hadoop-daemon.sh start secondarynamenode
hadoop-daemon.sh start datanode

3、上传spark二进制包到hdfs

在master.mesos节点上

hadoop fs -mkdir /sparkbinfile
hadoop fs -put spark-2.2.0-bin-hadoop2.7.tgz /sparkbinfile/

注意，上传的spark-2.2.0-bin-hadoop2.7.tgz要在conf/spark-env.sh中配置JAVA_HOME环境变量，否则运行spark-shell时会报JAVA_HOME not set 错误。

4、配置spark使用mesos调度

在master.mesos节点上
vim spark-2.2.0-bin-hadoop2.7/conf/spark-env.sh

export MESOS_NATIVE_JAVA_LIBRARY=/usr/local/lib/libmesos.so
export MASTER=mesos://master.mesos:5050
export SPARK_LOCAL_IP=192.168.122.131
export SPARK_LOCAL_HOSTNAME=master.mesos
export JAVA_HOME=/root/jdk1.8.0_65
export SPARK_EXECUTOR_URI=hdfs://master.mesos:9000/sparkbinfile/spark-2.2.0-bin-hadoop2.7.tgz

5、配置mesos-salve使用hadoop 命令

cat /etc/mesos-slave/hadoop_home 
/root/hadoop-2.7.2

注意，/root/hadoop-2.7.2/etc/hadoop/hadoop-env.sh要设置正确的JAVA_HOME环境变量，否则mesos-slave使用hadoop命令从hdfs中拉取spark二进制文件会报java command not find错误。

6、启动spark-shell

spark-2.2.0-bin-hadoop2.7/bin/spark-shell
saprk-shell启动后会注册Spark shell到mesos的frameworks中，并且预先激活几个Spark shell 0/1 mesos Active Tasks。只要spark-shell一直运行中，mesos中Spark shell frameworks得到的资源则不会减少（即使在spark shell中没有运行任务），停止saprk-shell后，Spark shell 0/1 mesos Active Tasks会成为完成状态，Spark shell mesos frameworks会成为Completed Frameworks，并且释放它所占用的资源（cpu，内存，存储很少占用）。

spark-mesos

mesos-spark-tasks

mesos-spark-frameworks

mesos-spark-agents

spark-jobs

spark-executes

spark-env

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

mesos

spark-on-mesos 的相关文章

spark-on-mesos

参考网址 https spark apache org docs latest running on mesos html https mesos cn gitbooks io mesos cn content OverView spark
巅峰对决之Swarm、Kubernetes、Mesos

转载自 http dockone io article 1138 感谢作者和编者的分享编者的话这篇文章对比了三大主流调度框架 Swarm Kubernetes和Mesos 文章不仅从理论上讨论了各个框架的优缺点还从两个实际的案例出发
make -j 8 g++：内部编译器错误：已杀死（程序 cc1plus）

当我在 Ubuntu12 04 上部署 Apache Mesos 时我按照官方文档进行操作在步骤 make j 8 中我在控制台中收到此错误 g internal compiler error Killed program cc1pl
解决Mesos主导Master

我们使用 Mesos 在集群上运行作业我们使用 haproxy 来指向例如 mesos seanmcl com到 Mesos Master 如果该 Master 恰好不是领导者 UI 将在一段时间后重定向浏览器delay 发送给领导者
Spark 工作负载需要 HDFS 吗？

HDFS 不是必需的但在某些地方会出现建议为了帮助评估运行 HDFS 所花费的精力将 HDFS 用于 Spark 工作负载有哪些好处最短的答案是不你不需要它即使没有 HDFS 您也可以分析数据但当然您需要在所有节点上复制数据
.dockercfg 文件应如何托管在 Mesosphere-on-AWS 设置中，以便只有 Mesosphere 可以使用它？

我们已经在 AWS 上的私有 VPC 中使用 Mesosphere 设置了一个测试集群我们有一些公开的 Docker 镜像很容易部署然而我们的大多数服务都是私有镜像托管在 Docker Hub 私有计划上并且需要身份验证才能访问
为什么向 Mesos 提交 Spark 应用程序会失败并显示“无法解析主 URL：'mesos://localhost:5050'”？

当我尝试将 Spark 应用程序提交到 Mesos 集群时出现以下异常 17 01 31 17 04 21 警告 NativeCodeLoader 无法为您的平台加载本机 hadoop 库在适用的情况下使用内置 java 类 17 01
在 mesos 集群上设置 Mesos-DNS dockerized

我在尝试在 mesos 集群上运行 mesos dns dockerized 时遇到一些麻烦我在 Windows 8 1 主机上设置了 2 个带有 ubuntu trusty 的虚拟机我的虚拟机名为docker虚拟机 and docke
Chronos 不运行作业

我已经为每个服务使用 Docker 映像设置了 Mesos 集群包括 Marathon 和 Chronos 我使用的 Docker 镜像如下动物园管理员 jplock zookeeper 3 4 5 https registry hub
将 Docker 容器与 Mesos/Marathon 链接

到目前为止我使用 Mesos Marathon 和 Docker 来管理服务器群以及放置在服务器上的容器取得了巨大成功然而我现在想更进一步开始做一些事情比如自动将 haproxy 容器链接到每个启动的主 docker 服务或者
如何为自定义Python项目编写Dockerfile？

我对 Docker 还很陌生我需要创建容器来将 Docker 容器作为 Apache Mesos 任务运行问题是我找不到任何相关的例子它们都以 Web 开发为中心但我的情况并非如此我有一个带有大量依赖项的纯Python项目例如B
如何使用 Apache Mesos/Marathon 运行一次性任务？

我正在尝试使用 Marathon 运行一项一次性任务我能够让任务容器运行但在任务命令完成后 marathon 会运行另一个任务依此类推如何防止 Marathon 运行多个任务命令或者如果 Marathon 无法做到这一点我怎
HDFS 对 DC/OS 中机器重启的弹性

我已在由 10 台 Core OS 机器 3 个主节点 7 个代理节点组成的 DCOS 集群上安装了 Universe 中的 HDFS 我的 HA HDFS 配置有 2 个名称节点 3 个日志节点和 5 个数据节点现在我的问题是 HD
在给定容器错误状态代码的情况下，在哪里可以找到更明确的错误？

我实际上是通过一个运行任务Mesos堆栈它使用Docker容器有时某些任务会失败以下是一些相关的TaskStatus消息和原因 message Container exited with status 1 reason REASON
如何从 Mesos 框架 Scheduler 类读取 mesos 任务 stdout/stderr？

我正在开发一个 Mesos 框架它工作得很好我唯一的问题是我无法从 Scheduler 类内部读取任务 stdout 或 stderr 我在下面提供了一个代码示例我想读取已完成任务的标准输出和标准错误最好在 statusUpdate
警告会话 0x0 服务器为空、意外错误、关闭套接字连接并尝试重新连接

我有两个节点每个节点上都安装了带有Mesos marathon和zookeeper的docker 这是我在主节点上的 docker compose 文件 version 3 7 services zookeeper image ubunt
如何获取 Mesos Agents Framework 执行器内存

在 Mesos Web UI 内部我可以在表中查看 Spark 执行器的内存使用情况 Agents gt Framework gt Executors 有一个表列出了我的 Spark 驱动程序的所有执行程序它们的内存使用情况在列中指示M
Mesos 任务 - 无法接受套接字：未来已丢弃

我只是想将 mesos 版本从 1 0 3 升级到 1 3 1 Chronos 调度程序能够通过 mesos 调度作业该作业运行良好并且能够查看 mesos 标准输出日志但是仍然在 mesos stderr 日志中看到以下内容 doc
如何删除 Apache Mesos 中的孤立任务？

该问题可能是由 Mesos 和 Marathon 引起的不同步 https github com mesosphere marathon issues 616 但是 GitHub 上提到的解决方案对我不起作用当我发现孤立任务时我所做的是
了解 mesos 上 Spark 作业的资源分配

我正在 Spark 中开发一个项目最近从使用 Spark Standalone 切换到使用 Mesos 进行集群管理我现在发现自己对新系统下提交作业时如何分配资源感到困惑在独立模式下我使用了类似的东西遵循一些建议这篇 Cloude

随机推荐

Spring- 上传文件 MultipartFile.transferTo() 报错 FileNotFoundException

上传文件时使用MultipartFile transferTo 将文件保存到本地路径报错 java io IOException java io FileNotFoundException C Users XXXXX AppData L
vue单文件组件1（webpack打包）

一 vue单文件组件开发流程 webpack打包 1 源文件目录结构 2 package json 3 webpack config js HTML Webpack Plugin依据html模板生成一个自动引用你打包后的文件 js或css
【数据结构(C语言描述)】环形队列

目录一基础知识二数组实现环队 2 1 初始化 2 2 判断环队是否为空 2 3 判断环队是否为满 2 4 入队 2 5 出队 2 6 取队头元素 2 7 取队尾元素 2 8 销毁环队三链表实现环队 3 1 初始化 3 2 判断环
STM32学习心得三十二：CAN通信基础知识、原理、配置及实验

记录一下方便以后翻阅主要内容 1 CAN通信基础知识 2 STM32 CAN控制器简介 3 相关实验代码解读参考资料 STM32中文参考手册 V10 第22章控制器局域网 bxCAN 实验功能 CAN实验需要两个开发板系统启动后
ctfshow-萌新-web1( 利用intval函数的特性获取敏感数据)

ctf show 萌新模块的web1关这一关考察的是intval 函数转换字符串时的特性以及SQL的拼接绕过这一关直接就给了源码并提示我们 id 1000 时就是flag 先分析一下源码首先是 intval 函数将参数id转换为数
PostgreSQL学习研究笔记（一）

何为PostgreSQL PostgreSQL 是以加州大学伯克利分校计算机系开发的 postgres 版本 4 2 为基础的对象关系型数据库管理系统 PostgreSQL是最初的伯克利代码的开源继承者任何人都可以以任何目的免费使用修改
T-Kernel Error Code

参考 tk errno h define E OK 0 Completed successfully define E SYS ERCD 5 0 System error define E NOCOP ERCD 6 0 Coprocesso
linux—通配符详解及总结

本博客主要详解关于linux中常使用的通配符的知识点主要分为三个步骤通配符和的详细解释举例截图说明个人的总结理解一通配符和的详细解释 ps 因为通配符中可添加很多变量所以这里我会简单举出几个例子来说明其他情况请类比
R 和 Rstudio 在线更新

R 在线更新最近安装 R 包的时候老是会遇到有些包不适应老版本无奈还是更新了新的版本卸载重装就太麻烦了而且以前的包还需要重新加载在线更新是最好的方法可以直接在 Rstudio 中直接更新直接运行以下命令就行 install p
Python还能这样学？独一档的学习路线与方法！两个月就能彻底掌握

为什么要选择学习Python 我大学本专业当时学的是过时很久的工程物流管理经常跟学长学姐们聊到他们的就业情况然后自己也对未来的就业之路产生了很大的怀疑后面经过一些了解以及学长学姐的介绍知道了Python 后面深入的了解了后我果断
基于Protege的知识建模实战

一 Protege简介用途和特点 1 Protege简介 Protege是斯坦福大学医学院生物信息研究中心基于Java开发的本体编辑和本体开发工具也是基于知识的编辑器属于开放源代码软件这个软件主要用于语义网中本体的构建是语义网中本
华为OD机试真题B卷 Java 实现【停车场车辆统计】，附详细解题思路

一题目描述特定大小的停车场数组cars 表示其中1表示有车 0表示没车车辆大小不一小车占一个车位长度1 货车占两个车位长度2 卡车占三个车位长度3 统计停车场最少可以停多少辆车返回具体的数目二输入描述整型字符串数组
DHCP DNS 综合案例分析

1 首先我们来配置一下192 168 1 2这台机器 1 1 操作系统 windows server 2003 R2 1 2 IP 192 168 1 2 24 GW 1922 168 1 1 DNS 192 168 1 2 注意这台机器
阿里云盘内测_【邀请码】阿里云盘内测码分享

备受瞩目的阿里云网盘已在苹果App Store上架并更名阿里云盘最新版本更名为v1 0 1 8 月下旬阿里巴巴推出了一款名为阿里云网盘的独立 App 该应用开发者为阿里旗下的阿里云团队定位是为 C 端用户提供可靠安全的存储备份
CUBEIDE 使用指南

cubeIDE includes 下一直有一个错误的路径如图不知道什么原因引入了一个错误的路径怎么也消不掉最后发现在工程文件里用记事本等打开 cproject文件删掉对应路径就好了图是已经删掉的了 2 include 路径问题
QT信号与槽机制

QT开发 QT信号与槽机制一 QT消息模型 QT封装了具体操作系统的消息机制遵循经典的GUI消息驱动事件模型 QT定义了与操作系统消息相关的自己的概念即信号与槽信号signal是由操作系统产生的消息槽slot是程序中的消息处理函数
Openmv，stm32串口（定时器配置）

新手学习记录中得先有from pyb import UART的包以及import json 初始化uart UART 3 115200 表示是在串口3处其波特率为115200 需要看openmv的原理图看uart3的TX和RX是哪两个
sklearn矩阵分解类库学习

sklearn decomposition模块提供矩阵分解算法其他PCA NMF 或ICA 其中大部分算法都被视为降维技术主成分分析 sklearn decomposition PCA n components None copy Tr
清空数组的方法

直接置空堆内存中的值其实没变 var b 1 2 3 4 var a b a console log a console log b splice splice表示起始位置第二个参数表示删除的长度第三个参数表示插入的元素 var ar
spark-on-mesos

参考网址 https spark apache org docs latest running on mesos html https mesos cn gitbooks io mesos cn content OverView spark