如何从容器内部获取 YARN ContainerId？

2024-04-10

我正在 YARN 上运行 Spark 作业，并且希望获取 YARN 容器 ID（作为在一组 Spark 作业中生成唯一 ID 的要求的一部分）。我可以看到容器.getId() https://hadoop.apache.org/docs/r2.6.0/api/org/apache/hadoop/yarn/api/records/Container.html#getId()方法来获取 ContainerId，但不知道如何从 YARN 获取对当前正在运行的容器的引用。这可能吗？ YARN容器如何获取自己的信息？

我能得到一些东西的唯一方法是使用日志目录。以下工作在 Spark shell 中进行。

import org.apache.hadoop.yarn.api.records.ContainerId

def f(): String = {
  val localLogDir: String = System.getProperty("spark.yarn.app.container.log.dir")
  val containerIdString: String = localLogDir.split("/").last
  val containerIdLong: Long = ContainerId.fromString(containerIdString).getContainerId
  containerIdLong.toHexString
}

val rdd1 = sc.parallelize((1 to 10)).map{ _ => f() }
rdd1.distinct.collect().foreach(println)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop

apachespark

hadoopyarn

如何从容器内部获取 YARN ContainerId？的相关文章

将 Spark 数据框中的时间戳转换为日期

我见过这里如何将DataFrame中的时间戳转换为日期格式 https stackoverflow com questions 40656001 how to convert timestamp to date format in da
以有效的方式从 BigQuery 读取到 Spark 中？

使用时BigQuery 连接器 https cloud google com hadoop examples bigquery connector spark example要从 BigQuery 读取数据我发现它首先将所有数据复制到 G
司机下令停车后 Spark 工作人员停下来

基本上主节点也充当从节点之一一旦主服务器上的从服务器完成它就会调用 SparkContext 来停止因此该命令传播到所有从服务器从而在处理过程中停止执行其中一名工作人员登录时出错信息 SparkHadoopMapRedUtil
如何在 Apache Spark 中基于列的子集实现“ except ”？

我正在 Spark 中使用两个模式 table1 and table2 scala gt table1 printSchema root user id long nullable true item id long nullable tr
Spark 执行器 STDOUT 到 Kubernetes STDOUT

我在 Spark Worker 中运行的 Spark 应用程序将执行程序日志输出到特定文件路径 worker home directory app xxxxxxxx 0 stdout I used log4j properties将日志从
如何将多行标签 xml 文件转换为 dataframe

我有一个包含多个行标签的 xml 文件我需要将此 xml 转换为正确的数据帧我使用了spark xml 它只处理单行标签 xml数据如下
使用 mlib 执行 Spark-Shell，错误：对象 jblas 不是包 org 的成员

在spark shell中当我执行import org jblas DoubleMatrix 它会在 RHEL 上抛出错误对象 jblas 不是包 org 的成员实际上我用谷歌搜索了 jblas 并安装了 gfortran htt
遍历 ArrayWritable - NoSuchMethodException

我刚刚开始使用 MapReduce 并且遇到了一个奇怪的错误我无法通过 Google 回答该错误我正在使用 ArrayWritable 制作一个基本程序但是当我运行它时在Reduce过程中出现以下错误 java lang Runti
如何将模型从 ML Pipeline 保存到 S3 或 HDFS？

我正在尝试保存 ML Pipeline 生成的数千个模型正如答案中所示here https stackoverflow com questions 32121046 run 3000 random forest models by gro
如何通过sparkSession向worker提交多个jar？

我使用的是火花2 2 0 下面是我在 Spark 上使用的 java 代码片段 SparkSession spark SparkSession builder appName MySQL Connection master spark ip
如何使用 Amazon 的 EMR 在 CLI 中使用自定义 jar 指定 mapred 配置和 java 选项？

我想知道如何指定mapreduce配置例如mapred task timeout mapred min split size等等当使用自定义 jar 运行流作业时当我们使用 ruby 或 python 等外部脚本语言运行时我们可以使
如何通过Python访问Hive？

https cwiki apache org confluence display Hive HiveClient HiveClient Python https cwiki apache org confluence display Hi
如何将模型结果保存到文本文件？

我正在尝试将从模型生成的频繁项集保存到文本文件中该代码是 Spark ML 库中 FPGrowth 示例的示例 Using saveAsTextFile直接在模型上写入 RDD 位置而不是实际值 import org apache spa
Spark问题中读取大文件 - python

我已经使用 python 在本地安装了 Spark 并在运行以下代码时 data sc textFile C Users xxxx Desktop train csv data first 我收到以下错误 Py4JJavaError Tra
Hive - 线程安全的自动递增序列号生成

我遇到一种情况需要将记录插入到特定的 Hive 表中其中一列需要是自动递增的序列号即在任何时间点都必须严格遵循 max value 1 规则记录从许多并行的 Hive 作业插入到这个特定的表中这些作业每天每周每月批量运行现在
Scala Spark 包含与不包含

我可以使用 contains 过滤 RDD 中的元组如下所示但是使用不包含来过滤 RDD 又如何呢 val rdd2 rdd1 filter x gt x 1 contains 我找不到这个的语法假设这是可能的并且我没有使用Dat
Spark 中的 Distinct() 函数如何工作？

我是 Apache Spark 的新手正在学习基本功能有一个小疑问假设我有一个元组键值的 RDD 并且想从中获取一些唯一的元组我使用distinct 函数我想知道该函数基于什么基础认为元组是不同的是基于键值还是两者 di
Spark 中的 StandardScaler 未按预期工作

知道为什么 Spark 会这样做吗StandardScaler 根据定义StandardScaler StandardScaler 将一组特征标准化为均值为零标准差为 1 withStd 标志将数据缩放为单位标准差而标志 withMe
将 Tuple2 的值部分（即映射）合并为按 Tuple2 的键分组的单个映射

我在 Scala 和 Spark 中这样做我有和Dataset of Tuple2 as Dataset String Map String String 下面是值的示例Dataset A 1 gt 100 2 gt 200 3 gt 1
Spark scala 模拟 Spark.implicits 用于单元测试

当尝试使用 Spark 和 Scala 简化单元测试时我使用 scala test 和mockito scala 以及mockito Sugar 这只是让你做这样的事情 val sparkSessionMock mock SparkSes

随机推荐

检测音量按钮按下情况

音量按钮通知功能未被调用 Code func listenVolumeButton Option 1 NSNotificationCenter defaultCenter addObserver self selector volumeCh
Visual Studio - 将文本粘贴到 cshtml 中会删除文本

在 Visual studio 2022 v 17 2 1 中当我将一些文本粘贴到 cshtml 文件中时相同的文本似乎被复制但随后立即被删除包括现有文本的一部分这似乎只在覆盖jquery代码时发生在任何地方
Hibernate @Formula 不包括架构

我有一个拥有财产的实体 Formula像这样 Entity Table name areasAuxiliar public final class AreaAuxiliar implements Serializable Id Column
为什么 Firebase 云函数模拟器上没有调用 firestore onWrite 触发器？

我有一个 firestore 里面有一个名为 chats 的集合我使用 firestore 模拟器插入一个新文档我期待onWrite当我跑步时触发被调用index js本地在我的firebase云函数模拟器 https firebase
TypeScript 编译器参数“skipLibCheck”的用法

我一直在研究进一步的解释跳过库检查TypeScript 编译器参数来确定将此设置为的安全性true 我找到的最深入的解释如下新 skipLibCheck TypeScript 2 0 添加了一个新的 skipLibCheck 编译器选项
检查向量索引是否为空

在我的代码中我需要这样做 if edges j ConnectedToNode i problem line edges push back Edge i j nodes i Position nodes j Position dista
Google 开发者控制台：“指定的项目 ID 不可用。请选择另一个。这些标识符必须是唯一的。”

我从 Google Developers Console 中删除了一个项目并尝试创建另一个具有相同名称 id 的项目但没有成功指定的项目 ID 不可用请选择另一个这些标识符必须是唯一的但现在无论我选择什么名称或 ID 我都会遇
如何使用 linq 进行 LIKE 查询？ [复制]

这个问题在这里已经有答案了如何在 Linq 中执行 LIKE 查询我有以下查询要执行 var results from c in db costumers where c FullName LIKE FirstName LastName
测试预期会出现异常，但抛出了异常（它显示在输出中），但测试还是失败了

您好这里有一个针对车辆构造函数的测试该测试用没有驾驶执照的驾驶员初始化车辆并且应该抛出异常代码构造函数 public Voertuig String Merk Datum datumEersteIngebruikname int A
React Hooks：如何向服务器发出 POST 请求

我是初学者我试图以简单的形式从 React js 实现 POST 请求但我不知道如何将 POST 请求发送到数据库我想我需要
如何将猴子补丁应用到 GAE？

你能告诉我如何将此补丁应用到谷歌应用程序引擎以及将其放在哪里吗谢谢 def user init self email None auth domain None user id None federated identity None f
关于使用 Saxon 使用默认命名空间对 xml 进行 xpath 解析

我想要一些与使用 saxon 解析默认名称空间的 xpath 相关的信息我正在使用 Saxon HE 9 5 1 3 jar 在我的代码中使用 xpath 2 功能在类路径中包含 saxon 库后我在解析具有默认命名空间的 XML 文
使用 Junit5 在 Spring Boot 应用程序中测试服务层时如何避免数据库连接

我正在尝试对内部调用存储库方法的服务方法进行单元测试我的测试方法如下 SpringBootTest public class EmployeeServiceImplTest MockBean private EmployeeReposit
使用 Qt，有哪些好方法可以分解包含 GUI 逻辑的大型源文件？

我正在使用 Qt 5 开发一个 C 项目它有一个包含大量 UI 元素的复杂窗口该窗口是使用 Qt Designer 设计的并从 UI 文件加载我发现 Qt 的典型模式是在其主类中编写窗口 UI 的所有逻辑即他们文档中的单一继承方
WPF MVVMLight：根据另一个 DataGrid 的 SelectedItem 更新 DataGrid

开发一个WPF应用程序使用MVVMLight My Model由一个Attribute类和一个DataSet类与ObservableCollection
Checkmarx Java 修复 Log Forging - 清理用户输入

任何人都可以建议以下 getCourses 方法中的 courseType 变量所需的正确清理验证过程我正在使用该变量写入日志文件我尝试过 HtmlUtils HtmlEscape 但没有得到预期的结果 Thanks RequestM
获取iPhone照片库的图像名称

我正在做一个项目从 iPhone 照片库或以其他方式从相机胶卷中获取图像我已经做到了没有任何问题但我需要从照片库中检索名称有没有办法做到这一点任何帮助表示赞赏 Thanks 查看 ALAssetsLibrary 它在 iOS 4
可以从 Http 请求主体发布 ODataQueryOptions 吗？

我正在实现一个 Web API 接口来支持一些相当复杂的查询来运行它并且遇到了最大请求 URI 长度的问题我的 Web API 方法的定义如下所示使用 Automapper 执行 DTO 投影 public IQueryable
使一个协议符合另一个协议

我有两个协议 Pen and 专业仪器我想做任何Pen成为一个专业仪器 protocol Pen var title String get var color UIColor get protocol Watch Also Instrum
如何从容器内部获取 YARN ContainerId？

我正在 YARN 上运行 Spark 作业并且希望获取 YARN 容器 ID 作为在一组 Spark 作业中生成唯一 ID 的要求的一部分我可以看到容器 getId https hadoop apache org docs r2 6 0

如何从容器内部获取 YARN ContainerId？

如何从容器内部获取 YARN ContainerId？ 的相关文章

随机推荐

热门标签

如何从容器内部获取 YARN ContainerId？的相关文章