Spark 中执行器和任务的内存分配

2024-03-31

我的集群配置如下：- 7 个节点，每个节点有 32 个核心和 252 GB 内存。

纱线配置如下：-

yarn.scheduler.maximum-allocation-mb - 10GB
yarn.scheduler.minimum-allocation-mb - 2GB
yarn.nodemanager.vmem-pmem-ratio - 2.1
yarn.nodemanager.resource.memory-mb - 22GB
yarn.scheduler.maximum-allocation-vcores - 25
yarn.scheduler.minimum-allocation-vcores - 1
yarn.nodemanager.resource.cpu-vcores - 25

地图缩减配置如下：-

mapreduce.map.java.opts - -Xmx1638m
mapreduce.map.memory.mb - 2GB
mapreduce.reduce.java.opts - -Xmx3276m
mapreduce.reduce.memory.mb - 4Gb

火花配置如下：-

spark.yarn.driver.memoryOverhead 384
spark.yarn.executor.memoryOverhead 384

现在，我尝试通过将值设置为主纱线以及执行器内存、执行器数量、执行器核心的不同值来运行spark-shell。

Spark-shell --master 纱线 --executor-内存 9856M --num-executors 175 --executor-cores 1

在这种情况下，执行程序内存 + 384 对于纱线调度程序来说不能超过 10GB 最大值。所以在这种情况下 9856M + 384 MB = 10GB 所以它工作正常。现在，一旦 Spark shell 启动，执行程序总数为 124 个，而不是要求的 175 个。在 Spark shell 启动日志或 Spark UI 中看到每个执行程序的存储内存为 6.7 GB（即 10GB 的 67%）。

Spark shell 进程的 top 命令输出如下：-

PID     USER      PR    NI  VIRT  RES   SHR S  %CPU %MEM  TIME+  
8478    hdp66-ss  20    0   13.5g 1.1g  25m S  1.9  0.4   2:11.28

所以虚拟内存是13.5G，物理内存是1.1G

Spark-shell --master 纱线 --executor-内存 9856M --num-executors 35 --executor-cores 5

在这种情况下，执行程序内存 + 384 对于纱线调度程序来说不能超过 10GB 最大值。所以在这种情况下 9856M + 384 MB = 10GB 所以它工作正常。现在，一旦 Spark shell 启动，执行程序的总数为 35 个。在 Spark shell 启动日志或 Spark UI 中看到每个执行程序的存储内存为 6.7 GB（即 10GB 的 67%）。

Spark shell 进程的 top 命令输出如下：-

PID     USER      PR    NI  VIRT  RES   SHR S  %CPU %MEM  TIME+  
5256    hdp66-ss  20    0   13.2g 1.1g  25m S  2.6  0.4   1:25.25

所以虚拟内存是13.2G，物理内存是1.1G

Spark-shell --master 纱线 --executor-内存 4096M --num-executors 200 --executor-cores 1

在这种情况下，执行程序内存 + 384 对于纱线调度程序来说不能超过 10GB 最大值。所以在这种情况下 4096M + 384 MB = 4GB 所以它工作正常。现在，一旦 Spark shell 启动，执行程序的总数为 200。在 Spark shell 启动日志或 Spark UI 中看到每个执行程序的存储内存为 2.7 GB（即 4GB 的 67%）。

Spark shell 进程的 top 命令输出如下：-

PID     USER      PR    NI  VIRT  RES   SHR S  %CPU %MEM  TIME+  
21518   hdp66-ss  20    0   19.2g 1.4g  25m S  3.9  0.6   2:24.46

所以虚拟内存是19.2G，物理内存是1.4G。

那么有人可以解释一下这些记忆和执行者是如何开始的吗？为什么在 Spark UI 上看到的内存是执行程序内存请求的 67%？以及每个执行器的虚拟内存和物理内存是如何决定的。

Spark 几乎总是分配用户为执行器请求的 65% 到 70% 的内存。 Spark 的这种行为是由于 SPARK JIRA TICKET 造成的“SPARK-12579”.

此链接指向位于 Apache Spark 存储库中的 scala 文件，该文件用于计算执行程序内存等。 https://github.com/apache/spark/blob/master/core/src/main/scala/org/apache/spark/memory/UnifiedMemoryManager.scala

    if (conf.contains("spark.executor.memory")) {
  val executorMemory = conf.getSizeAsBytes("spark.executor.memory")
  if (executorMemory < minSystemMemory) {
    throw new IllegalArgumentException(s"Executor memory $executorMemory must be at least " +
      s"$minSystemMemory. Please increase executor memory using the " +
      s"--executor-memory option or spark.executor.memory in Spark configuration.")
  }
}
val usableMemory = systemMemory - reservedMemory
val memoryFraction = conf.getDouble("spark.memory.fraction", 0.6)
(usableMemory * memoryFraction).toLong

}

上面的代码对您所看到的行为负责。这是针对集群可能没有用户请求的内存的情况的安全保障。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Spark 中执行器和任务的内存分配的相关文章

如果为 null 则替换为 0，否则在同一列中使用默认值

在SparkR shell 1 5 0中创建了一个示例数据集 df test lt createDataFrame sqlContext data frame mon c 1 2 3 4 5 year c 2011 2012 2013 2
使用 parse.com 并遇到分配内存问题

我是编程新手过去 3 个月我一直在制作应用程序并学到了一些东西但我还没有遇到如何解决这个问题我一直使用 Parse com 作为我的服务器发送图片保存用户数据等有了所有这些数据如果我多次打开某些活动特别是带有图片的活动应
读取进程的进程内存不会返回所有内容

我正在尝试扫描第三方应用程序的内存我已经查到地址了现在是在0x0643FB78 问题是从那以后我就再也爬不上去LPMODULEENTRY32 gt modBaseAddr is 0x00400000 and LPMODULEENTRY
在Python Spark中查看RDD内容？

在 pyspark 中运行一个简单的应用程序 f sc textFile README md wc f flatMap lambda x x split map lambda x x 1 reduceByKey add 我想使用 forea
Spark：如何从spark shell运行spark文件

我正在使用CDH 5 2 我能够使用火花外壳运行命令如何运行包含 Spark 命令的文件 file spark 有没有办法在没有 sbt 的情况下在 CDH 5 2 中运行编译 scala 程序在命令行中您可以使用 spark sh
VS2010 .NET 内存分析 - 非常慢

运行 VS2010 的 NET 内存分配分析需要很长时间才能完成该程序本身运行了大约 3 分钟并生成了 35GB 的内存分配探查器的输出文件约为 28GB 报告分析流程接管三个小时在具有 8GB RAM 的双 Xeon 上即可完成
Spark - java.lang.OutOfMemoryError：请求的数组大小超出 VM 限制

我正在尝试对 Cloudera 的 Spark 2 1 0 中的数据帧进行 groupBy 操作该集群位于总 RAM 约为 512GB 的 7 节点集群上我的代码如下 ndf ndf repartition 20000 by user
Spark 上的 Hive 2.1.1 - 我应该使用哪个版本的 Spark

我在跑蜂巢2 1 1 Ubuntu 16 04 上的 hadoop 2 7 3 根据Hive on Spark 入门 https cwiki apache org confluence display Hive Hive on Spark
Android - 减少位图绘制的内存使用量

我的应用程序中有一张地图显示了 Gowalla 的位置我使用带有简单默认标记的 ItemizedOverlay 但在绘制项目时我将默认标记替换为从 Gowalla 下载 9 并缓存在磁盘上的位置图标问题是如果屏幕上有很多位置例
每当调用 malloc/free 时输出到 stderr

使用 Linux GCC C 每当调用 malloc free new delete 时我想向 stderr 记录一些内容我试图了解库的内存分配因此我想在运行单元测试时生成此输出我使用 valgrind 进行内存泄漏检测但我找不到
.net中连续内存存储的误解？

http msdn microsoft com en us library ms379570 v vs 80 aspx http msdn microsoft com en us library ms379570 v vs 80 aspx
如何使用 Apache Livy 设置 Spark 配置属性？

我不知道在向 Apache Livy 提交 Spark 作业时如何以编程方式传递 SparkSession 参数这是测试 Spark 作业 class Test extends Job Int override def call jc J
Spark：Aggregator和UDAF有什么区别？

在Spark的文档中 Aggregator 抽象类聚合器 IN BUF OUT 扩展可序列化用户定义聚合的基类可以是在数据集操作中用于获取组中的所有元素并将它们减少到单个值用户定义的聚合函数是抽象类 UserDefinedAgg
内存地址是否指向一个字节的信息？

以下是 DTS 文件的摘录 linux arch powerpc boot dts 板名 dts memory device type memory reg lt 0x00000000 0x40000000 gt 1GB at 0 嵌入式设
Scala 和 Spark：Windows 上的 Dataframe.write._

有人设法使用 Spark 写入文件尤其是 CSV 吗数据框 http spark apache org docs latest api scala index html org apache spark sql Dataset在 Win
链接到大地址感知 DLL

假设我有一个使用 LARGEADDRESSAWARE 链接器标志集构建的 DLL 现在我有一个动态链接到该 DLL 的应用程序这是否会使我的应用程序具有大型地址意识如果不是那么为任何 DLL 设置此标志是否有意义讨论here htt
-XX:MinHeapFreeRatio 和 -XX:MaxHeapFreeRatio 的目的是什么

请告诉我这些选项的目的谷歌搜索后我想 MinHeapFreeRatio 表示 GC 后将确保堆内存中指定的最小空间百分比是可用的和 MaxHeapFreeRatio告诉 GC后堆内存中的空闲空间不会超过指定的百分比如果空闲内存超过指定
演员邮箱溢出。斯卡拉

我目前正在与 scala 的两位演员合作一 producer 产生一些数据并将其发送到parcer 生产者发送一个HashMap String HashMap Object List Int 通过消息以及this标记发件人 parcer
从 pandas udf 记录

我正在尝试从 python 转换中调用的 pandas udf 进行日志记录因为在执行器上调用的代码不会显示在驱动程序的日志中我一直在寻找一些选项但到目前为止最接近的选项是这个one https stackoverflow com q
Java GuardedString - 用于加密的随机密钥是否存储在 Java 堆内存中？如果不是，那么密钥保存在哪里？

Oracle 的 org identityconnectors common security GuardedString 要转换为 GuardedString 的原始数据需要由 EncryptorImpl class 随机生成的加密密钥

随机推荐

以良好的质量和内存效率缩小资源中的位图

我想缩小 500x500px 资源以始终适合由屏幕宽度确定的特定尺寸目前我使用 Android 开发者网站高效加载大位图 http developer android com training displaying bitmaps lo
on_message() 和 @bot.command 问题

当我有on message 在我的代码中它会停止所有其他的 bot command来自工作的命令我尝试过await bot process commands message 但这也行不通这是我的代码 bot event command
SQL Server - PIVOT - 两列转换为行

我在一个专栏中看到了很多关于 PIVOT 的问题每个问题都比其他问题更复杂但是我找不到我需要的任何内容老实说我什至不知道pivot在这种情况下是否能帮助我假设我的源表中有这些数据 SELECT 1 as RowId Random
混淆 .fmt 行为与嵌套列表

The docs https docs raku org routine fmt比如说fmt 返回一个字符串其中列表中的每个元素都已根据以下格式进行格式化 format 第一个参数并且每个元素由 separator 第二个论点根据该描
EmguCV (OpenCV) ORBDetector 仅发现不良匹配

Problem 所以总的来说我对计算机视觉还很陌生我目前正在尝试通过分析 2 个图像来计算单应性我想使用单应性来校正 1 个图像的视角以匹配另一个图像但我得到的比赛却很糟糕而且错误所以我所做的单应性扭曲完全关闭了当前状态我正在
在“data.table”中使用动态列名

我想计算 data table 中每一列的平均值并按另一列分组我的问题与另外两个问题类似 one https stackoverflow com questions 12391950 variably selecting assigni
创建 IEnumerable.Find()

我想写 IEnumerable
Hibernate Envers：检索具有集合属性的实体的正确修订

我有两个经过审计的实体 A 和 B 实体 A 拥有实体 B 的集合注释为一对多关系将 A 的新实例插入数据库时 A 和 B 的所有行都处于同一修订版假设为修订版 1 然后 A 上有一个更新仅影响实体 B 的实例因此更新后实体
WiX RemoveRegistryKey 元素的行为不符合广告

卸载时我似乎无法删除注册表项请注意这不是重复this https stackoverflow com questions 3317281 wix doesnt remove registrykey on uninstall问题因为我不
scikit-learn - 将管道预测转换为原始值/规模

我创建了一个管道如下所示使用Keras Scikit Learn API https keras io scikit learn api estimators estimators append standardize Standard
如何使用 jquery 禁用列表框中的多重选择？或者JavaScript？

我的页面中有一个列表框 td 我需要禁止从列表框中选择多个项目吗我正在做一些事情比如选择一个项目然后单击删除按钮我的页面会从列表框中删除一项但是如果我选择多个项目则会抛出一条错误消息任何人都可以帮我解决如何停用或禁用列表框
熊猫重新索引日期索引按组重新访问

之前已经问过这个问题这里已经提出了一个可行的解决方案Pandas 在 Groupby 中重新索引日期 https stackoverflow com questions 32275540 pandas reindex dates in g
GraphViz：未使用新安装程序设置 Windows PATH，从 R 调用时出现问题

在 R 库中我使用dot程序来自 GraphViz 来生成一些图形通常为 png 格式 dot是一个通常的可执行文件我通过systemR 命令到目前为止一切都运行良好因为 GraphViz 安装程序正在添加dot到 PATH
以 Vararg 作为第一个参数的 Kotlin 方法

Note我查看了以下问题答案来解决问题但没有任何运气从 Kotlin 调用 Java Varargs 方法 https stackoverflow com questions 36626152 call java varargs me
具有特定数字的浮点精度

以下值给出了错误的精度仅通过特定数字即可观察到这一点可能是浮动表示问题但想知道具体原因 String m 154572 49 154 572 49 Float f Float parseFloat m System out print
了解 Go 中的 http handlerfunc 包装器技术

我看到一个马特赖尔撰写的文章 https medium com statuscode how i write go http services after seven years 37c208122831关于如何使用服务器类型和包装器类型
字符串驻留和文字字符串声明的搜索成本

两个问题当我们声明文字字符串时我们会在堆的字符串池中查找是否有相同的字符串这也是实习吗班级的方法实习生String 在我看来每个文字字符串声明都需要进行二分搜索或其他操作因此它至少需要花费log n when n是池中现有字符串
从 sqlalchemy 关系中选择具有最大值的项目

给定这对类 class Thing Base id Column Integer primary key True class ThingInfo Base id Column Integer primary key True thing
Angular 中的 window.onload

Angular 中是否有相当于 window onload 事件的事件我想淡出并删除预加载器但前提是加载了所有资源例如图像由于 viewConteneLoaded 仅指示将 html 插入视图我正在使用 ngRotue 因此监听它
Spark 中执行器和任务的内存分配

我的集群配置如下 7 个节点每个节点有 32 个核心和 252 GB 内存纱线配置如下 yarn scheduler maximum allocation mb 10GB yarn scheduler minimum allocatio

Spark 中执行器和任务的内存分配

Spark 中执行器和任务的内存分配 的相关文章

随机推荐

热门标签

Spark 中执行器和任务的内存分配的相关文章