如何在 Yarn 上配置应用程序驱动程序自动重启

2024-02-27

来自 Spark 编程指南

要自动从驱动程序故障中恢复，用于运行流应用程序的部署基础架构必须监视驱动程序进程，并在驱动程序失败时重新启动驱动程序。不同的集群管理器有不同的工具来实现这一点。

火花独立

火花独立- Spark应用程序驱动程序可以提交在Spark Standalone集群中运行（请参阅集群部署模式），即应用程序驱动程序本身运行在其中一个工作节点上。此外，可以指示独立集群管理器监督驱动程序，并在驱动程序由于非零退出代码或由于运行驱动程序的节点故障而失败时重新启动它。有关更多详细信息，请参阅 Spark Standalone 指南中的集群模式和监督。
YARN- Yarn 支持类似的自动重启应用程序的机制。请参阅 YARN 文档了解更多详细信息。 ....

那么，问题是如何支持Spark的自动重启在 Yarn 上流式传输.

如此处记录的：https://spark.apache.org/docs/latest/running-on-yarn.html https://spark.apache.org/docs/latest/running-on-yarn.html

Spark.yarn.maxAppAttempts -
“提交应用程序的最大尝试次数。它不应大于 YARN 配置中的全局最大尝试次数。”

设置“YARN 配置中的全局最大尝试次数”：

https://hadoop.apache.org/docs/r2.4.1/hadoop-yarn/hadoop-yarn-common/yarn-default.xml https://hadoop.apache.org/docs/r2.4.1/hadoop-yarn/hadoop-yarn-common/yarn-default.xml

纱线.resourcemanager.am.最大尝试- “最大申请尝试次数。这是所有申请主的全局设置。每个应用主可以通过API指定其个人的最大尝试尝试次数，但个人的数量不能超过全局上限。如果是，资源管理器将覆盖它。默认数量设置为 2，以允许至少重试一次 AM”

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 Yarn 上配置应用程序驱动程序自动重启的相关文章

Spark JDBC 仅返回带有列名的数据帧

我正在尝试使用 Spark JDBC 连接到 HiveTable 代码如下 val df spark read format jdbc option driver org apache hive jdbc HiveDriver option
获取 Spark 中组的最后一个值

我有一个 SparkR DataFrame 如下所示 Create R data frame custId lt c rep 1001 5 rep 1002 3 1003 date lt c 2013 08 01 2014 01 01 20
在Spark的客户端模式下，驱动程序需要网络访问远程执行程序？

使用火花时在客户端模式例如yarn client 运行驱动程序的本地计算机是否直接与运行远程执行程序的集群工作节点通信如果是是否意味着机器运行驱动程序需要具有对工作节点的网络访问权限那么master节点向集群请求资源并将wor
保存的数据带有不需要的引号

我使用以下代码将数据框导出到 csv data write format com databricks spark csv options delimiter t codec org apache hadoop io compress Gz
Twitter API 与 Scala 2.12 一起使用

我正在使用 Scala 2 12 使用 SBT 构建构建 Spark 3 0 0 流应用程序鉴于所有用于执行此操作的库均适用于 Scala EDIT 我尝试使用库构建时得到的示例输出 object twitter is not a me
如何使用 Spark 执行插入覆盖？

我正在尝试将我们的 ETL Hive 脚本之一转换为 Spark 其中 Hive ETL 脚本维护一个表其中需要在每晚新同步之前删除部分数据 Hive ETL 使用插入覆盖的方式将主表删除超过 3 天的数据基本上创建一个临时表其中的数
在 Spark 中分发 scikit learn 分类器的推荐方法是什么？

我已经使用 scikit learn 构建了一个分类器现在我想使用 Spark 在大型数据集上运行 Predict proba 我目前使用以下方法对分类器进行腌制 import pickle pickle dump clf open cl
如何在 Spark 中创建空数据帧

我有一组基于 Avro 的配置单元表我需要从中读取数据由于Spark SQL使用hive serdes从HDFS读取数据因此比直接读取HDFS慢很多因此我使用数据块 Spark Avro jar 从底层 HDFS 目录读取 Avr
Spark：Aggregator和UDAF有什么区别？

在Spark的文档中 Aggregator 抽象类聚合器 IN BUF OUT 扩展可序列化用户定义聚合的基类可以是在数据集操作中用于获取组中的所有元素并将它们减少到单个值用户定义的聚合函数是抽象类 UserDefinedAgg
异常：java.lang.Exception：使用 master 'yarn' 运行时，必须在环境中设置 HADOOP_CONF_DIR 或 YARN_CONF_DIR。在火花中

我是新的阿帕奇火花我已经在spark独立模式下测试了一些应用程序但我想运行应用程序yarn模式我正在windows中运行apache spark 2 1 0 这是我的代码 c spark gt spark submit2 master
将 Spark 数据框中的时间戳转换为日期

我见过这里如何将DataFrame中的时间戳转换为日期格式 https stackoverflow com questions 40656001 how to convert timestamp to date format in da
从 SparkSession.read() 获取“org.apache.spark.sql.AnalysisException：路径不存在”[重复]

这个问题在这里已经有答案了我正在尝试读取提交的文件spark submit在客户端模式下连接到yarn集群将文件放入 HDFS 不是一个选项这是我所做的 def main args Array String if args null
如何将多行标签 xml 文件转换为 dataframe

我有一个包含多个行标签的 xml 文件我需要将此 xml 转换为正确的数据帧我使用了spark xml 它只处理单行标签 xml数据如下
Spark - scala - 如何检查配置单元中是否存在表

我必须使用 Spark 1 6 2 scala 检查配置单元中是否存在表如果没有我必须创建一个空数据框并将其保存为配置单元表如果存在则覆盖现有表我需要一个返回布尔值的函数基于该函数我可以做出上述决定是否创建新表或覆盖现有表 1
如何将模型从 ML Pipeline 保存到 S3 或 HDFS？

我正在尝试保存 ML Pipeline 生成的数千个模型正如答案中所示here https stackoverflow com questions 32121046 run 3000 random forest models by gro
过滤字符串上的 Spark DataFrame 包含

我在用火花1 3 0 http spark apache org releases spark release 1 3 0 html and 火花阿夫罗1 0 0 https github com databricks spark avro
如何使用 PySpark 预处理图像？

我有一个项目需要为 1 设置大数据架构 AWS S3 SageMaker 的概念验证使用 PySpark 预处理图像 2 执行 PCA and 3 训练一些机器或深度学习模型我的问题是了解如何使用 PySpark 操作图像数据但无法在
如何读取一次流数据集并输出到多个接收器？

我有 Spark 结构化流作业它从 S3 读取数据转换数据然后将其存储到一个 S3 接收器和一个 Elasticsearch 接收器目前我正在做readStream一次然后writeStream format start 两次这
带有安全 Kafka 抛出的 Spark 结构化流：无权访问组异常

为了在我的项目中使用结构化流我正在 hortonworks 2 6 3 环境上测试 Spark 2 2 0 和 Kafka 0 10 1 与 Kerberos 的集成我正在运行下面的示例代码来检查集成我能够在 Spark 本地模式下的
如何使用 Spark 2 屏蔽列？

我有一些表我需要屏蔽其中的一些列要屏蔽的列因表而异我正在读取这些列application conf file 例如对于员工表如下所示 id name age address 1 abcd 21 India 2 qazx 42 Ger

随机推荐

Python自动选择串口（适用于Arduino）

目前 Python 程序必须知道设备 Arduino 位于哪个端口然后 Python 才能与设备进行通信 Problem 每当设备拔出并重新插入时其 COM 端口都会发生变化因此必须再次向 Python 提供正确的串行端口以便它找到
为什么 Android 6 上没有授予 GCM 权限？

背景我正在尝试调查办公室的应用程序需要更改其权限以便更好地支持 Android 6 问题我发现哪些权限需要确认哪些不需要除了以下一项
运行程序所花费的时间

如何在文本框或输出中打印程序运行时间我希望将其显示到 for 循环中以获取每个 for 循环需要多少时间你可以尝试 DateTime dt DateTime Now for TimeSpan ts DateTime Now dt te
如何使用其他 Angular 组件中的“templateref”？

如何使用templateRef来自其他组件模板文件 I have BatmanComponent SpidermanComponent and a JokerComponent 其中一些具有相似的功能因此我决定创建一个HumanCompo
Xamarin 自定义表视图标头

我想在表视图部分标题的标题中添加一个按钮即加号按钮经过研究发现要做到这一点您必须创建一个自定义标题我不知道该怎么做如何在 xamarin 中为表视图部分创建自定义标头我也使用 Xaml 和 C 请参阅这些博客文章 https
使用自定义字体为警报对话框项目设置字体

我正在这样创建一个警报对话框 AlertDialog Builder alertDialog new AlertDialog Builder view getContext alertDialog setCustomTitle null a
使用 where 和 offset fetch 子句的简单选择在 Oracle 中不起作用

我正在尝试选择行where条件并且需要分页所以我添加了Fetch with offset 使其动态子句但随后它给出了此错误 ORA 00933 SQL 命令未正确结束位置 414 我的查询 SELECT up NAME upozil
是否可以使用ggplot2中的facet_grid()让annotation_logtics()仅出现在一个子图上？

我使用以下代码在 ggplot2 中使用facet grid 创建一个包含三个子图的图 day lt c 5 Aug 5 Aug 5 Aug 10 Aug 10 Aug 10 Aug 17 Aug 17 Aug 17 Aug station
[myArray addObject:[[objcBlock copy] autorelease]] 在释放数组时崩溃

我编写了一个类来声明性地描述 UIView 动画序列我的方法采用动画块的可变参数并将它们放入数组中所以在我的循环中我想这样做 animations addObject block copy autorelease I first cop
正则表达式匹配回句点或字符串开头

我想匹配一个单词然后获取它之前的所有内容直到第一次出现一个句点或字符串的开头例如给定此字符串并搜索单词 regex s Do not match this Or this Or this either I like regex It
Elasticsearch 不返回单数/复数匹配项

我正在使用 elasticsearch 的 php 库来索引和查找我的网站中的文档这是创建索引的代码 curl XPUT http localhost 9200 test d index numberOfShards 1 numberOf
如何在 SVG 中导出 PNG

我在导出包含 PNG 图像的 SVG 时遇到一些问题我在用着D3JS和以下代码 mysvg append image attr width 299 attr height 168 attr xlink href image png var
Passport.js 支持ajax 吗？

我想用passport js进行ajax登录我有设置 Passport js 的常用代码 route app post api auth login passport authenticate local login successRed
协议“Line”只能用作通用约束，因为它具有 Self 或关联类型要求

我正在快速使用协议我认为它类似于其他语言中的界面我正在测试它如何处理变量协议对我来说相当新因为我从未见过带有非静态变量的接口我创建了一个车站协议 protocol Station var id String get set va
如果没有 .cs 文件，Web 应用程序将无法发布

我有一个 asp net Web 应用程序项目正在通过 Visual Studio 2013 中的生成 gt 发布来发布我正在使用所选的预编译选项发布到文件系统我的项目在打包发布 Web 设置屏幕中选择了仅运行此应用程序所需的
@Id 注解属性的 Kotlin 内联类

在我的业务逻辑中我必须处理很多实体 ID 所有这些 ID 都是类型String 这可能会导致混乱尤其是当您将其中几个作为方法参数传递时所以我考虑引入一点类型安全内联类我知道内联类在 v1 3 中仍然被标记为实验性的然而有没有人
方向改变后的回调变为null

我有一个FragmentActivity有两个选项卡分别是ListFragments Each ListFragment有回调回调的示例回调在内部关联附加 method OnStatusUpdateListener mStatusUp
删除阿拉伯语中的垃圾字符

我需要从字符串中删除所有非阿拉伯字符最终在堆栈溢出人员的帮助下 https stackoverflow com questions 6642341 remove garbage characters in utf 6643116 6643
与 eclipse 项目相比，可运行 jar 运行速度太慢

我从 eclipse 项目中提取了一个 jar 文件但它运行速度太慢大约需要二十分钟才能完成而 eclipse 项目只需要几秒钟我使用所有三种不同的选择导出了带有库处理的可运行 jar 我还导出了包含所有库处理选项的 jar 文件
如何在 Yarn 上配置应用程序驱动程序自动重启

来自 Spark 编程指南要自动从驱动程序故障中恢复用于运行流应用程序的部署基础架构必须监视驱动程序进程并在驱动程序失败时重新启动驱动程序不同的集群管理器有不同的工具来实现这一点火花独立火花独立 Spark应用程序驱动程序可以提

如何在 Yarn 上配置应用程序驱动程序自动重启

如何在 Yarn 上配置应用程序驱动程序自动重启 的相关文章

随机推荐

热门标签

如何在 Yarn 上配置应用程序驱动程序自动重启的相关文章