了解spark.yarn.executor.memoryOverhead

2024-03-26

当我在纱线上运行 Spark 应用程序时，驱动程序和执行程序内存设置为--driver-memory 4G --executor-memory 2G

然后，当我运行该应用程序时，会抛出异常，抱怨说Container killed by YARN for exceeding memory limits. 2.5 GB of 2.5 GB physical memory used. Consider boosting spark.yarn.executor.memoryOverhead.

这里的 2.5 GB 是什么意思？（开销内存、执行程序内存或开销+执行程序内存？）我这么问是因为当我将内存设置更改为：

--driver-memory 4G --executor-memory 4G --conf --driver-memory 4G --conf spark.yarn.executor.memoryOverhead=2048，然后异常消失。

我想问，虽然我把开销内存提升到了2G，但还是低于2.5G，为什么现在还能用呢？

让我们了解一下spark中内存是如何划分到各个区域的。

执行器内存开销：

spark.yarn.executor.memoryOverhead = max(384 MB, .07 * spark.executor.memory)。在你的第一种情况下，memoryOverhead = max(384 MB, 0.07 * 2 GB) = max(384 MB, 143.36 MB) Hence, memoryOverhead = 384 MB假设您为每个执行器分配了单个核心，则在每个执行器中保留。

执行和存储内存：

默认情况下spark.memory.fraction = 0.6，这意味着执行和存储作为一个统一区域占用了剩余内存的 60%，即998 MB。除非您启用，否则没有分配给每个区域的严格边界spark.memory.useLegacyMode。除此之外，它们共享一个移动的边界。

用户内存：

分配执行内存和存储内存后剩余的内存池，完全取决于您以您喜欢的方式使用它。您可以在那里存储您自己的数据结构，这些数据结构将在 RDD 转换中使用。例如，您可以通过使用维护哈希表的mapPartitions 转换来重写Spark 聚合以运行此聚合。这包括 MemoryOverhead 后剩余的 40% 内存。在你的情况下是~660 MB.

如果您的工作不满足上述任何分配，那么很可能最终会出现 OOM 问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

apachespark

了解spark.yarn.executor.memoryOverhead 的相关文章

TaskSchedulerImpl：初始作业尚未接受任何资源；

这就是我正在尝试做的事情我创建了DataStax企业集群的两个节点在其上创建了一个java程序来获取一张表 Cassandra数据库表的计数该程序是在 eclipse 中构建的实际上是来自 windows 盒子从 Windows
获取 Spark 中组的最后一个值

我有一个 SparkR DataFrame 如下所示 Create R data frame custId lt c rep 1001 5 rep 1002 3 1003 date lt c 2013 08 01 2014 01 01 20
Spark数据框中过滤的多个条件

我有一个包含四个字段的数据框其中一个字段名称是 Status 我尝试在 filter 中对数据帧使用 OR 条件我尝试了以下查询但没有运气 df2 df1 filter Status 2 Status 3 df2 df1 filter
如何查找组中第一个非空值？（使用dataset api进行二次排序）

我正在研究一个代表事件流的数据集例如从网站跟踪事件时触发所有事件都有一个时间戳我们经常遇到的一个用例是尝试查找给定字段的第一个非空值例如类似的东西最能让我们到达那里 val eventsDf spark read json jso
pyspark：计算窗口上的不同值

我刚刚尝试做一个countDistinct越过一个窗口并得到这个错误 AnalysisException 不支持不同的窗口函数计数不同颜色 1926 有没有办法在 pyspark 的窗口上进行不同的计数这是一些示例代码 from py
Twitter API 与 Scala 2.12 一起使用

我正在使用 Scala 2 12 使用 SBT 构建构建 Spark 3 0 0 流应用程序鉴于所有用于执行此操作的库均适用于 Scala EDIT 我尝试使用库构建时得到的示例输出 object twitter is not a me
如何使用 Spark 执行插入覆盖？

我正在尝试将我们的 ETL Hive 脚本之一转换为 Spark 其中 Hive ETL 脚本维护一个表其中需要在每晚新同步之前删除部分数据 Hive ETL 使用插入覆盖的方式将主表删除超过 3 天的数据基本上创建一个临时表其中的数
Spark Worker 在 Heartbeater 中与 Spark Driver 通信的超时时间为 3600 秒

我没有配置任何超时值而是使用默认设置在哪里配置3600秒超时怎么解决呢错误信息 18 01 10 13 51 44 WARN Executor Issue communicating with driver in heartbeat
如何使用 Apache Livy 设置 Spark 配置属性？

我不知道在向 Apache Livy 提交 Spark 作业时如何以编程方式传递 SparkSession 参数这是测试 Spark 作业 class Test extends Job Int override def call jc J
Spark：Aggregator和UDAF有什么区别？

在Spark的文档中 Aggregator 抽象类聚合器 IN BUF OUT 扩展可序列化用户定义聚合的基类可以是在数据集操作中用于获取组中的所有元素并将它们减少到单个值用户定义的聚合函数是抽象类 UserDefinedAgg
Spark 按列重新分区，每列动态分区数

如何根据列中的项目数对 DataFrame 进行分区假设我们有一个包含 100 人的 DataFrame 列是first name and country 我们希望为一个国家地区的每 10 个人创建一个分区如果我们的数据集包含 80
Spark SQL / PySpark 中的逆透视

我手头有一个问题陈述其中我想在 Spark SQL PySpark 中取消透视表我已经浏览了文档我可以看到仅支持pivot 但到目前为止还不支持取消透视有什么方法可以实现这个目标吗让我的初始表如下所示 When I pivotPy
Python Spark DataFrame：用 SparseVector 替换 null

在 Spark 中我有以下名为 df 的数据框其中包含一些空条目 id features1 features2 185 5 0 1 4 0 1 0 null 220 5 0 2 3 0 1 0 10 1 2 6 0 1 225 null
如何在 Mac 上使用 homebrew 安装 apache-spark 2.3.3

brew install apache spark只安装最新版本的 Spark 2 4 和 brew search apache spark没有给出任何其他选项有没有办法用自制程序安装旧版本的 Spark Type brew tap ed
在 kubernetes 上安装 PySpark 软件包时出现 Spark-Submit：ivy-cache 文件未找到错误

我一整天都在与它斗争我能够安装并使用带有 Spark shell 或连接的 Jupiter 笔记本的包 graphframes 但我想使用 Spark Submit 将其移动到基于 kubernetes 的 Spark 环境我的火花版
如何读取一次流数据集并输出到多个接收器？

我有 Spark 结构化流作业它从 S3 读取数据转换数据然后将其存储到一个 S3 接收器和一个 Elasticsearch 接收器目前我正在做readStream一次然后writeStream format start 两次这
Spark SQL 失败，因为“常量池已超过 JVM 限制 0xFFFF”

我在 EMR 4 6 0 Spark 1 6 1 上运行此代码 val sqlContext SQLContext getOrCreate sc val inputRDD sqlContext read json input try inp
使用 Scala 获取 Spark 数据集中最新时间戳对应的行

我对 Spark 和 Scala 比较陌生我有一个具有以下格式的数据框 Col1 Col2 Col3 Col 4 Col 5 Col TS Col 7 1234 AAAA 1111 afsdf ewqre 1970 01 01 00 00
获取 int() 参数必须是字符串或数字，而不是“Column”- Apache Spark

如果我使用以下代码我会收到此异常 int argument must be a string or a number not Column df df withColumn FY F when df ID substr 5 2 isin
Spark DataFrame 序列化为无效 json

TL DR 当我倾倒 Spark 时DataFrame作为 json 我总是得到类似的结果 key1 v11 key2 v21 key1 v12 key2 v22 key1 v13 key2 v23 这是无效的 json 我可以手动编辑转储

随机推荐

C# - 解析 XSD 架构 - 将所有元素获取到组合框

我有 XSD 架构文件我需要使用架构文件中的元素填充组合框
Docker-compose 与 Loopback 和 Mongodb 无法连接 mongodb

我最近一直在学习docker 但无法在我的loopback api和mongodb之间建立连接该应用程序在本地开发环境中运行良好使用 docker compose 我的 mongodb 服务器运行在localhost 27017我的反应
何时将一个Vue组件拆分为多个组件（子组件）

创建 Vue 组件时如何决定何时将一个组件分离为具有多个子组件的父组件而不是只拥有一个具有更多逻辑的组件我在非 SPA 网站的几个地方使用 Vue 在网站的一个页面上我需要显示一个项目列表每个项目旁边都有一些图标来执行一些简单的操
为什么 unique_ptr::release 没有用 [[nodiscard]] 定义？

C 17 added nodiscard https en cppreference com w cpp language attributes nodiscard C 20添加了使用 nodiscard on empty方法例如vect
python 类内部的单元测试方法

对于单元测试来说非常新所以这可能非常简单但我不确定如何在函数中模仿自我论证我想测试的功能 class dataFeed def generateURL self ticker days period return https www
在 C++20 中，如何编写连续迭代器？

C 20 具有显式库支持std contiguous iterator tag 一些STL算法例如std copy 在连续迭代器上可以表现得更好但是我不清楚具体是如何程序员应该可以访问这个新功能为了便于论证我们假设我们有一个完全符
ASP.NET Core 上 CloudTableClient 类的最佳 DI 注册范围是哪个 [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我正在使用 ASP NET Core 2 2 和 Azure 表存储创建 Web 应用程序由于微软为我们提供了CloudTableClient
在React中的ArrayBuffer中显示PNG图像

我正在尝试在进行 JavaScript 调用后获取要在 React 应用程序中显示的图像 PNG 格式代码如下功能设备服务 getFile以 blob 形式返回文件数据是二进制的如何才能让这张图片在 React 中正确显示我尝试过
如何计算DataFrame中字符串的单词数？ [复制]

这个问题在这里已经有答案了假设我们有简单的数据框 df pd DataFrame one apple banana box of oranges pile of fruits outside one banana fruits df co
如何使用nodeJS从JSON对象中删除项目？

我使用的是节点 v8 11 无法从 mongoDB 创建并返回新对象的对象中删除项目创建后的示例响应 name device session id 5b7e78c3cc7bca3867bbd1c9 createdAt 2018 08 23
使用 PBKDF2 密钥派生通过 rust-crypto 正确创建用户可读的盐

我目前正在努力创建一个客户端标准文件 https github com standardnotes doc blob master Client 20Development 20Guide md 其中涉及使用 PBKDF2 来确保安全我在
如何使用 Java (Android) 从雅虎财经现金流量表中提取值？

这是该问题解决方案的后续内容如何从网页内的选项卡的 HTML 页面源中提取数据 https stackoverflow com questions 52939611 how to extract data from html page
C# 中引用类型后面的问号是什么意思？

参数类型后面的问号是引用类型的目的是什么例如一个构造函数OverflowException包含string and Exception 参数 public OverflowException string message Excepti
颠倒 d3.zoom 缩放和平移的顺序

如果您单击本例中的红色按钮 https bl ocks org interwebjill fe782e6f195b17f6fe6798a24c390d90 https bl ocks org interwebjill fe782e6f195
pandas 数据帧上的索引查找。为什么这么慢？如何加快速度？ [复制]

这个问题在这里已经有答案了假设我有一个 pandas 系列我想将其用作多重映射每个索引键有多个值 intval gt data1 a pd Series data np arange 100000 index np random ra
Mailchimp API：向带有标签的用户发送营销活动

我正在尝试使用 Django 的 mailchimp3 的 API 调用将露营发送到基于标签的分段即列出具有特定标签的成员但我不太找到正确的 json 结构来实现它这是我到目前为止所得到的 campaign creation type
REST 请求在“@SpringBootTest”中执行时被阻止，但在我运行应用程序时却未被阻止？

我有一个带有 Jersey REST api 的 Spring Boot 应用程序位于 rest Component ApplicationPath rest public class RestApplication extends Re
使用 JS 客户端删除 Google Drive 文件

我尝试使用 Google Drive 中的示例文档 https developers google com drive v2 reference files delete 所以代码是 var request gapi client driv
ASP.NET MVC2 LINQ - 存储库模式，分页代码应该放在哪里？

我正在努力添加用于分页的 HtmlHelper 但从性能和可维护性的角度来看我不确定将分页代码的某些部分放在正确和或最有益的位置我不确定 Linq to SQL 数据操作的 Skip Take 和 Count 部分是否应该位于存储库或
了解spark.yarn.executor.memoryOverhead

当我在纱线上运行 Spark 应用程序时驱动程序和执行程序内存设置为 driver memory 4G executor memory 2G 然后当我运行该应用程序时会抛出异常抱怨说Container killed by YARN

了解spark.yarn.executor.memoryOverhead

了解spark.yarn.executor.memoryOverhead 的相关文章

随机推荐

热门标签