Spark应用程序状态中的FAILED和ERROR有什么区别

2024-01-11

我正在尝试创建已提交的 Spark 应用程序的状态图。当应用程序被视为失败时，我有点迷失了。

各州来自这里：https://github.com/apache/spark/blob/d6dc12ef0146ae409834c78737c116050961f350/core/src/main/scala/org/apache/spark/deploy/master/DriverState.scala https://github.com/apache/spark/blob/d6dc12ef0146ae409834c78737c116050961f350/core/src/main/scala/org/apache/spark/deploy/master/DriverState.scala

这个阶段非常重要，因为当涉及到Big Data，Spark 很棒，但是让我们面对现实吧，我们还没有解决问题！

当任务/作业失败时，Spark 会重新启动它（回想一下，Spark 提供的主要抽象 RDD 是一个有弹性的分布式数据集，这不是我们在这里寻找的，但它会给出直觉）。

我使用 Spark 1.6.2，当标记为 FAILED 时，我的集群会重新启动作业/任务 3 次。

例如，我最近的一项工作必须重新启动整个阶段：

在集群/应用程序中，可以看到尝试 ID，这里应用程序正在进行第三次也是最后一次尝试：

如果该尝试被标记为FAILED（无论出于何种原因，例如内存不足、DNS 错误、GC 分配内存、磁盘故障、节点未响应 4 个心跳（可能已关闭）等），然后 Spark 重新启动作业。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

apachespark

Driver

Scheduling

distributedcomputing

Bigdata

Spark应用程序状态中的FAILED和ERROR有什么区别的相关文章

Spark Scala Cassandra 连接器删除所有行失败，并出现 IllegalArgumentException 要求失败异常

创建表 CREATE TABLE test word groups group text word text count int PRIMARY KEY group word 插入数据 INSERT INTO test word group
更改 Spark Streaming 中的输出文件名

我正在运行一个 Spark 作业就逻辑而言它的性能非常好但是当我使用 saveAsTextFile 将文件保存在 s3 存储桶中时输出文件的名称格式为 part 00000 part 00001 等有没有办法更改输出文件名谢谢
Spark 请求最大计数

我是 Spark 的初学者我尝试请求允许我检索最常访问的网页我的要求如下 mostPopularWebPageDF logDF groupBy webPage agg functions count webPage alias cntW
Spark-1.6.1 上的 DMLC 的 XGBoost-4j

我正在尝试在 Spark 1 6 1 上使用 DMLC 的 XGBoost 实现我能够使用 XGBoost 训练我的数据但在预测方面面临困难我实际上想以在 Apache Spark mllib 库中完成的方式进行预测这有助于计算训练
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
如何将数据帧转换为 JSON 并使用密钥写入 kafka 主题

我正在尝试以 JSON 格式向 kafka 写入一个数据帧并在 Scala 中向该数据帧添加一个键我目前正在使用 kafka spark 中的这个示例 df selectExpr CAST key AS STRING CAST valu
Kubernetes 反关联规则将 Deployment Pod 分散到至少 2 个节点

我在 k8s 部署中配置了以下反关联性规则 spec selector matchLabels app my app environment qa template metadata labels app my app environmen
使用嵌入qt的mysql？

我正在尝试使用嵌入 QT 的 mysql 我已经有一个与 mysqld 链接的 Qt mysql 插件该插件可以很好地加载嵌入式数据库但 QT 没有简单的方法来设置 dataDir 等嵌入式选项我在这里看到 http doc qt i
java.lang.ClassNotFoundException：找不到类 org.apache.hadoop.fs.azurebfs.SecureAzureBlobFileSystem

我是 Spark 和 Kubernetes 世界的新手我使用 docker image tool sh 实用程序使用与 Hadoop 3 2 捆绑在一起的官方 Spark 3 0 1 构建了 Spark docker 映像我还为 Jup
向数据框添加新列的问题 - Spark/scala

我是 Spark scala 的新手我正在尝试将一些数据从配置单元表读取到 Spark 数据帧然后根据某些条件添加一列这是我的代码 val DF hiveContext sql select from select from test
Spark s3 写入（s3 与 s3a 连接器）

我正在从事一项在 EMR 上运行的作业它在 s3 上保存了数千个分区分区为年月日我有过去 50 年的数据现在当 Spark 写入 10000 个分区时使用以下命令大约需要 1 小时s3a联系它非常慢 df repartit
Spark SQL中如何按列降序排序？

I tried df orderBy col1 show 10 但它是按升序排列的 df sort col1 show 10 也按升序排序我查看了 stackoverflow 发现的答案都已过时或称为 RDD https stackove
使用notebook时将jar添加到pyspark

我正在尝试将 mongodb hadoop 与 Spark 集成但不知道如何使 IPython 笔记本可以访问这些 jar 这是我想做的 set up parameters for reading from MongoDB via Had
如何使用 Spark-submit 命令获取提交到 Spark 集群的作业的应用程序 ID/作业 ID？

我正在使用 Spark submit 命令提交 Apache Spark 作业我想检索使用 Spark submit 命令提交的作业的应用程序 ID 或作业 ID 推荐的方式应该是什么可以解析 Spark submit 命令的输出以获取
Spark on Hive SQL 查询错误 NoSuchFieldError: HIVE_STATS_JDBC_TIMEOUT

针对 Hive 2 1 0 提交 Spark 1 6 0 SQL 应用程序时出现错误 Exception in thread main java lang NoSuchFieldError HIVE STATS JDBC TIMEOUT a
无法启动 Spark-Shell

我使用的是 Spark 1 4 1 我可以毫无问题地使用spark submit 但当我跑的时候 spark bin spark shell 我收到以下错误我已经配置了SPARK HOME and JAVA HOME 不过 Spark 1
将 n 个可变高度图像拟合为 3 个（相似长度）列布局

我正在寻找类似于的 3 列布局piccsy com http piccsy com 给定许多宽度相同但高度不同的图像有什么算法可以对它们进行排序以使列长度的差异最小最好使用 Python 或 JavaScript 非常感谢您提前的帮助
Spark如何选择节点来运行执行器？（spark on YARN）

Spark如何选择节点来运行执行器 spark on YARN 我们使用 Spark on Yarn 模式集群有 120 个节点昨天一个 Spark 作业创建了 200 个执行程序而节点 1 上有 11 个执行程序 Node2上有1
如何从本地模式下运行的 pyspark 中的 S3 读取数据？

我正在使用 PyCharm 2018 1 使用 Python 3 4 并通过 virtualenv 中的 pip 安装 Spark 2 3 本地主机上没有安装hadoop 因此没有安装Spark 因此没有SPARK HOME HADOOP
Spark Streaming 中是否需要检查点

我注意到 Spark 流示例也有检查点代码我的问题是检查点有多重要如果是为了容错那么在此类流应用程序中发生故障的频率是多少这一切都取决于您的用例假设您正在运行一个流作业它仅从 Kafka 读取数据并计算记录数如果您的应用程序在

随机推荐

Hadoop MapReduce 与 MPI（与 Spark、Mahout 与 Mesos） - 何时使用其中之一？

我是并行计算新手刚刚开始在 Amazon AWS 上尝试 MPI 和 Hadoop MapReduce 但我对何时使用其中一种而不是另一种感到困惑例如我看到的一个常见的经验法则可以总结为大数据非迭代容错 gt MapReduce
docker-machine 和 docker-compose 有什么区别？

我想我不明白首先我创建了 docker machine docker machine create d virtualbox dev eval docker machine env dev 然后我编写了 Dockerfile 和 doc
MVC 区域 - 非区域路由解析为区域

我已在我的 MVC 3 项目中添加了一个区域我似乎无法在非常简单的场景中使用路由看来总是想去区解决一下这是我的配置启动时 AreaRegistration RegisterAllAreas IgnoreRoute resource
HTML5：输入类型持续时间

有没有办法使用输入类型持续时间我正在尝试以某种方式进行输入用户可以添加类似这样的持续时间06 30 27 15 hh mm ss ms 并且应该只允许 0 23 0 59 0 59 0 59 任何帮助表示赞赏 NOTE 我想在 Angu
TypeError: jQuery(...).validate 不是一个函数

我将动态 html 内容添加到另一个 html 内容上这基本上是一个编辑表单 html 视图但是当我尝试验证 from 时它给出了 TypeError jQuery validate is not a function 错误我使用的
conda 'base' 和 'root' 环境有什么区别？

我最近一直在努力组织我的 conda 环境我最终重新安装了 miniconda 现在一切顺利我的问题是当我跑步时conda env list I get conda environments base Users rheft mini
是否有即将推出的 Cloud Spanner 框架？

我开始研究 Google 的 Cloud Spanner 它看起来确实很有趣由于ruby有rails MongoDB有Meteor RethinkDB有Horizo n 是否有关于Cloud Spanner拥有某种专用框架的讨论或者是否
在近实时分析中，为什么 Lambda-->Firehose-->S3 优于 Lambda-->S3？

许多用于无服务器实时分析的 AWS 参考架构建议通过 Kinesis Firehose 将处理后的数据从 Lambda 推送到 S3 e g https aws amazon com blogs big data create real t
PHP mail() 仅发送给单个收件人

我正在为客户端更新一些非 PHP 相关页面这些页面将表单输入发送到 PHP 但是如果不对代码进行任何更改客户端就会报告没有收到电子邮件相反他说它只向其中一封电子邮件发送电子邮件而不是向所有 3 封电子邮件发送电子邮件有人能指出
如何使用 Mongoid 查看原始 mongoDB 查询

我按照此页面查看了 mongoDB 查询结果我可以看到轻便摩托车日志但我看不到原始的 mongoDB 查询如何在 Rails 控制台服务器中显示 MongoDB 查询 https stackoverflow com question
在 /proc/net 中创建 ProcFS 条目

我尝试在里面创建一个条目 proc net来自内核模块如下所示 struct file filp filp open proc net O RDONLY 0 struct proc dir entry parent PDE filp gt
Rails 在 grouped_collection_select 中选择一个字段

I m using this code in my view to create a selection grouped collection select query city id states cities name id name
Adobe Acrobat Pro XI - 将 Javascript 添加到 PDF

这似乎是一个非常新手的问题但我一整天都在为这个问题绞尽脑汁我正在运行 Adob e Acrobat Professional XI 的试用版我希望将简单的 JavaScript 添加到 PDF 文件中目的是创建一个 PDF 文件打
帮助比较 argv 字符串

I have int main int argc char argv if argc 2 printf Mode of Use copy ex1 n return 1 formatDisk argv void formatDisk char
MVC 中的验证规则和业务规则

我有一个 MVC Web 项目根据最佳实践添加验证规则和业务规则的正确位置在哪里验证规则将是必填字段和必填格式商业规则将是该电子邮件已被存入数据库这是我目前正在做的注册模型 public class RegisterModel
基于 BGL 的新类中的自定义函数 addEdge 的返回值应该是多少？

我尝试实现一个基于的图形类https stackoverflow com a 950173 7558038 https stackoverflow com a 950173 7558038 添加边缘时我返回所添加边缘的边缘描述符但如果边
Android：检查互联网是否有可用网络

我使用此代码来检查网络连接 public boolean isOnline ConnectivityManager cm ConnectivityManager getSystemService Context CONNECTIVITY S
使用 Pycurl 获取 HTML

我一直在尝试使用 pycurl 检索 HTML 页面因此我可以使用 str split 和一些 for 循环解析它以获取相关信息我知道 Pycurl 检索 HTML 因为它将它打印到终端但是如果我尝试做类似的事情 html str
简单配置时收到 Wix 安装程序错误代码 2343。（WIX新手）

使用以下简单的 WIX 配置时我收到以下错误正在安装的应用程序是 WPF 产品 Web Miner 安装程序安装程序在安装此软件包时遇到意外错误这可能表明此包有问题错误代码为 2343 参数为
Spark应用程序状态中的FAILED和ERROR有什么区别

我正在尝试创建已提交的 Spark 应用程序的状态图当应用程序被视为失败时我有点迷失了各州来自这里 https github com apache spark blob d6dc12ef0146ae409834c78737c11605

Spark应用程序状态中的FAILED和ERROR有什么区别

Spark应用程序状态中的FAILED和ERROR有什么区别 的相关文章

随机推荐

热门标签

Spark应用程序状态中的FAILED和ERROR有什么区别的相关文章