Oozie/yarn：src 文件系统上的资源已更改

2023-11-21

我有一个 Oozie 工作流程，其中一个步骤是 java 步骤，运行存储在本地文件系统上的 jar（该 jar 存在于所有节点上）。

最初，该 jar 是通过 RPM 安装的，因此它们都具有相同的时间戳。

在实验时，我手动复制了这个 jar 的新版本，现在我收到消息：

org.apache.oozie.action.ActionExecutorException: JA009: org.apache.hadoop.yarn.exceptions.YarnException: Failed to submit application_1516602562532_15451 to YARN : Application application_1516602562532_15451 failed 2 times due to AM Container for appattempt_1516602562532_15451_000002 exited with  exitCode: -1000
For more detailed output, check the application tracking page: http://ip-10-0-0-239.eu-west-1.compute.internal:8088/cluster/app/application_1516602562532_15451 Then click on links to logs of each attempt.
Diagnostics: java.io.IOException: Resource file:/opt/tst/tst.jar changed on src filesystem (expected 1516886392000, was 1516891496000
Failing this attempt. Failing the application.

主线是：

资源文件：/opt/tst/tst.jar 在 src 文件系统上更改（预期为 1516886392000，实际为 151689149600）。

这2个数字是时间戳，expected一个确实是旧罐子的TS，在所有服务器上都相同，wasTS 是数据节点之一上新 jar 的时间戳（因为它们是scp循环播放，TS 略有不同）。

我的问题是：我如何告诉纱线停止抱怨并使用新的纱线？

一些注意事项：

Hortonworks 2.6，基于hadoop 2.7，
jar只被我放在本地FS上，而不是hdfs中，
与 Spark 无关（我的问题在 Google 上经常出现与 Spark 相关的问题），
yarn.sharedcache.enabled is false（默认）所以yarn scmadmin -runCleanerTask与这里无关，
我可以通过重用旧的 jar 来解决当前的问题，并且我可以确保所有 DN 都具有相同的 TS，但我想知道如何才能使用新版本（请注意，oozie 指向的 jar 是符号链接）当新版本发布时不必更新 oozie），
我宁愿将文件保留在本地 FS 上，而不必将其放在 hdfs 上，
jar 名称非常具体，它不会与任何其他 jar 冲突，
工作流程以用户身份运行yarn我在 hdfs 上的纱线用户目录中找不到我的 jar 的任何副本（在 oozie dir 下也找不到），
我可以在yarn local dir /filecache下找到jar的副本，但它们的md5与我的任何（当前）版本都不匹配。

这是我的两分钱，你可以建造yarn自己相关jar并添加到你当前的工作环境中。

这可能是跳过这种“烦人的”条件检查的解决方法。

一般步骤如下：

1、获取你使用的yarn的源代码。您可以从 Hadoop 官方网站下载它。 2、搜索错误日志如changed on file system在 Hadoop 源代码中。 3、注释掉 4、重建Yarn相关jar 5、将其放入您的工作环境中。

您可以参考如何修复 src 文件系统问题上的资源更改更多细节。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop

hadoopyarn

oozie

Oozie/yarn：src 文件系统上的资源已更改的相关文章

公平调度器和容量调度器有什么区别？

我是 Hadoop 世界的新手想了解公平调度程序和容量调度程序之间的区别另外我们什么时候应该使用每一个请简单地回答一下因为我在网上读了很多东西但从中得到的不多公平调度是一种为作业分配资源的方法使得所有作业随着时间的推移平均获得
如何强制 Spark 执行代码？

我如何强制 Spark 执行对 map 的调用即使它认为由于其惰性求值而不需要执行它我试过把cache 与地图调用但这仍然没有解决问题我的地图方法实际上将结果上传到 HDFS 所以它并非无用但 Spark 认为它是无用的简短回
错误 hive.HiveConfig：无法加载 org.apache.hadoop.hive.conf.HiveConf。确保 HIVE_CONF _DIR 设置正确

我正在尝试将数据从 sqoop 导入到 hive MySQL use sample create table forhive id int auto increment firstname varchar 36 lastname varch
更改spark_temporary目录路径

是否可以更改 temporarySpark在写入之前保存临时文件的目录特别是由于我正在编写表的单个分区因此我希望临时文件夹位于分区文件夹内是否可以由于其实现原因无法使用默认的 FileOutputCommiter FileOut
如何用snappy解压hadoop的reduce输出文件尾？

我们的 hadoop 集群使用 snappy 作为默认编解码器 Hadoop作业减少输出文件名就像part r 00000 snappy JSnappy 无法解压缩文件 bcz JSnappy 需要以 SNZ 开头的文件归约输出文件以某种
伪模式下没有名称节点错误

我是hadoop新手正处于学习阶段根据 Hadoop Definitve 指南我已将 hadoop 设置为伪分布式模式一切正常昨天我什至能够执行第三章中的所有示例今天当我重新启动我的unix并尝试运行start dfs sh然
Hadoop - 直接从 Mapper 写入 HBase

我有一个 hadoop 作业其输出应写入 HBase 我并不真正需要减速器我想要插入的行类型是在映射器中确定的如何使用 TableOutputFormat 来实现此目的从所有示例中我看到的假设是 reducer 是创建 Put 的
AWS EMR 引导操作为 sudo

我需要更新 etc hosts适用于我的 EMR 集群 EMR AMI 4 3 中的所有实例整个脚本无非就是 bin bash echo e ip1 uri1 gt gt etc hosts echo e ip2 uri2 gt gt e
Oozie shell 操作：exec 和文件标签

我是 Oozie 的新手我读过一些 Oozie shell 操作示例但这让我对某些事情感到困惑我见过一些例子但没有
Hadoop fs 查找块大小？

在 Hadoop fs 中如何查找特定文件的块大小我主要对命令行感兴趣例如 hadoop fs hdfs fs1 data 但看起来这并不存在有Java解决方案吗 The fsck其他答案中的命令列出了块并允许您查看块的数量但是要
如何在hadoop mapreduce/yarn中设置VCORES？

以下是我的配置 mapred site xml map mb 4096 opts Xmx3072m reduce mb 8192 opts Xmx6144m yarn site xml resource memory mb 40GB min
使用 HttpClient 的 .NET Core SPNEGO 身份验证

我目前正在编写一个简单的基于 NET Core 的客户端用于通过 WebHCat 与 Hadoop 集群进行交互并且我正在尝试弄清楚如何使用 SPNEGO 进行身份验证就像在curl 或 Powershell Core 等中一样使用
org.apache.hadoop.security.AccessControlException：客户端无法通过以下方式进行身份验证：[TOKEN，KERBEROS] 问题

我正在使用 java 客户端通过 Kerberos 身份验证安全访问 HDFS 我尝试打字klist在服务器上它显示已经存在的有效票证我收到的异常是客户端无法通过以下方式进行身份验证 TOKEN KERBEROS 帮助将不胜感激这是一
关于 Hadoop 和压缩输入文件的非常基本的问题

我已经开始研究 Hadoop 如果我的理解是正确的我可以处理一个非常大的文件它会被分割到不同的节点上但是如果文件被压缩那么文件就无法分割并且需要由单个节点处理有效地破坏了运行一个mapreduce 一个并行机器集群我的问题是
像袋子一样压平元组

我的数据集如下所示 A 1 2 B 2 9 我想展平 Pig 中的元组基本上为内部元组中找到的每个值重复每个记录这样预期的输出是 A 1 A 2 B 2 B 9 我知道当元组 1 2 和 2 9 是袋时这是可能的你的洞察力很好可以
如何在 HBase 中预分割表

我将数据存储在具有 5 个区域服务器的 HBase 中我使用 url 的 md5 哈希作为我的行键目前所有数据仅存储在一台区域服务器中所以我想预先分割区域以便数据在所有区域服务器上统一传输我希望通过行键的第一个字符将表分成五个区
名称节点与辅助名称节点

Hadoop 具有一致性和分区容忍性即它属于 CAP 理论的 CP 类别 Hadoop不可用因为所有节点都依赖于名称节点如果名称节点崩溃集群就会崩溃但考虑到 HDFS 集群有一个辅助名称节点为什么我们不能称 hadoop 为可用
Hadoop2.2.0无法访问网页http://:8088

我设置了一个包含两个节点 hadoop01 master 10 0 0 151 和 hadoop02 slaves 10 0 0 152 的 hadoop 集群当输入 start dfs sh 然后访问网站 my ip 上面就是 10 0
Hive 中的 CASE 语句

好的我有以下代码来用二进制标志标记表中具有最高 Month cd 的记录 Select t1 month cd t2 max month cd CASE WHEN t2 max month cd null then 0 else 1 en
HBase中删除多行的有效方法

有没有一种有效的方法可以删除 HBase 中的多行或者我的用例是否不适合 HBase 有一个表称为图表其中包含图表中的项目行键的格式如下 chart date reversed ranked attribute value reve

随机推荐

如果从菜单调用活动，如何使用 onActivityResult(..)

这是我的问题 class main extends menuActivity public void onActivityResult int requestCode int resultCode Intent data if result
带有 SQL Server 2012 的实体框架 6 给出 System.Data.Entity.Core.ProviderInknownException

我有 Visual Studio 2012 并且正在将实体框架堆栈与 EF 6 结合使用我所做的一切都正确但在添加迁移时出现错误 System Data Entity Core ProviderInknownException 这是课程
将 Typescript 与 React-Redux 结合使用时出现类型错误

我正在尝试将react redux与typescript一起使用当我尝试使用connect 和mapStateToProps注入道具时出现类型错误我的组件如下所示 function mapStateToProps state retu
如何以编程方式检测进程在堆上分配的字节数？

如何以编程方式检测进程在堆上分配的字节数该测试应该从流程本身开始进行我认为 mallinfo 就是你想要的 include
Android Webview的shouldOverrideUrlLoading方法

When is shouldOverrideUrlLoading方法调用 webView setWebViewClient new WebViewClient Override public boolean shouldOverrideUr
如何判断

我看到媒体元素接口公开类似的属性paused seeking and ended 然而列表中缺少的是playing 我知道有playing events当元素出现时会发生火灾starts演奏以及timeupdate events播放时定
无法创建 django_migrations 表（ORA-02000：缺少 ALWAYS 关键字）

我正在 Django 2 0 1 中使用数据库 Oracle 11g 启动一个项目当我运行 python manage py migrate 时出现错误 django db migrations exceptions Migration
如何在unix shell脚本中获取最后一个下划线（_）之后的子字符串

我有一个像这样的字符串 this is test string1 22 this is also test string12 6 我想分割并提取最后一个下划线周围的字符串那就是我想要这样的输出 this is test string1 a
如何将回调作为参数传递给另一个函数

我是 ajax 和回调函数的新手如果我对概念的理解有误请原谅我 Problem 我可以发送一个回调函数作为另一个将执行回调的函数的参数 function firstFunction some code a callback functi
HTML5 类似占位符

CKEditor 4 x 是否有插件或内置功能可以像 HTML5 输入文本区域占位符一样工作我唯一发现的是http ckeditor com addon placeholder 但这似乎有很大不同您可以使用配置助手插件 Demo ht
打印/全屏/电子邮件图标

在 Plone 2 中对象视图中有打印全屏和电子邮件图标如何在 Plone 4 中启用这些功能它们似乎不存在于 Plone 4 1 的默认安装中但我一定缺少一些东西我想知道什么 Thanks IIRC 可以在 Plone 4 的
JavaScript 正则表达式替换整个单词

我有一个变量 var str devtest11 devtest1 我用这种方式来替换 devtest1与另一个字符串 str replace new RegExp devtest1 g aaaa 然而其结果 aaaa1 aaaa 不是我
C# 中有 SFTP 通信吗？ [复制]

这个问题在这里已经有答案了可能的重复适用于 NET 的 SFTP 库 C 中有 SFTP 通信吗有一个 NET 组件称为SFTP黑匣子正是这样做的功能列表对我来说似乎足够了他们甚至对各种 NET SFTP 实现进行了比较here
一次读取 4 个字节

我正在加载一个充满整数的大文件我刚刚开始使用 C 并且正在尝试文件流内容从我读过的所有内容来看我似乎只能以字节为单位读取所以我必须设置一个 char 数组然后将其转换为 int 指针有没有办法可以一次读取 4 个字节并消除对
sklearn 的 PLSRegression：“ValueError：数组不得包含 infs 或 NaN”

使用时sklearn cross decomposition PLSRegression import numpy as np import sklearn cross decomposition pls2 sklearn cross de
如何使用 PFX（Bouncy Castle 或其他）以编程方式对可执行文件进行代码签名

我正在尝试确定使用 Bouncy Castle 托管代码或 C 中的非托管代码对可执行文件进行代码签名的最佳方法由于 CAPICOM 现已被弃用我想如果需要以非托管方式完成那么 mssign32 dll 中的 SignerSign 方
使用 scipy truncnorm 拟合数据

我有遵循高斯分布的数据然而数据仅对于一系列值 xa xb 来说才是真正的高斯分布所以我想使用以下方法拟合截断正态分布scipy stats truncnorm同时利用我知道范围 xa xb 的事实我的目标是找到地点和规模我不明白如
sqlite：如何在内存中使用

我正在尝试将数据存储在内存中这就是我现在所拥有的 sq lite driver Class forName org sqlite JDBC database path if it s new data base it will be cr
如何在父元素和父元素的兄弟元素上方显示子元素？

我的问题与这个问题相关使用 CSS 在父元素上方显示子元素该问题的答案设置overflow visible 仅适用于一个孩子的一位家长然而我有这些元素的行我需要孩子显示在父母上方的父母行我可以让孩子显示在原始父母之上但我无法
Oozie/yarn：src 文件系统上的资源已更改

我有一个 Oozie 工作流程其中一个步骤是 java 步骤运行存储在本地文件系统上的 jar 该 jar 存在于所有节点上最初该 jar 是通过 RPM 安装的因此它们都具有相同的时间戳在实验时我手动复制了这个 jar 的新

Oozie/yarn：src 文件系统上的资源已更改

Oozie/yarn：src 文件系统上的资源已更改 的相关文章

随机推荐

热门标签

Oozie/yarn：src 文件系统上的资源已更改的相关文章