在 Google Dataproc 集群实例中的 Spark-Submit 上运行应用程序 jar 文件

2023-12-03

我正在运行一个 .jar 文件，其中包含我需要打包在其中的所有依赖项。这种依赖关系之一是com.google.common.util.concurrent.RateLimiter并已经检查过它的类文件是否在此 .jar 文件中。

不幸的是，当我在 google 的 dataproc-cluster 实例的主节点上点击命令 spark-submit 时，我收到此错误：

Exception in thread "main" java.lang.NoSuchMethodError: com.google.common.base.Stopwatch.createStarted()Lcom/google/common/base/Stopwatch;
at com.google.common.util.concurrent.RateLimiter$SleepingStopwatch$1.<init>(RateLimiter.java:417)
at com.google.common.util.concurrent.RateLimiter$SleepingStopwatch.createFromSystemTimer(RateLimiter.java:416)
at com.google.common.util.concurrent.RateLimiter.create(RateLimiter.java:130)
at LabeledAddressDatasetBuilder.publishLabeledAddressesFromBlockstem(LabeledAddressDatasetBuilder.java:60)
at LabeledAddressDatasetBuilder.main(LabeledAddressDatasetBuilder.java:144)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:497)
at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:672)
at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.scala:180)
at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:205)
at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:120)
at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)

似乎发生了一些事情，覆盖了我的依赖关系。已经反编译了Stopwatch.class来自此 .jar 的文件并检查该方法是否存在。当我在 google dataproc 实例上运行时，就发生了这种情况。我做到了grep在执行过程中spark-submit我得到了旗帜-cp像这样：

/usr/lib/jvm/java-8-openjdk-amd64/bin/java -cp /usr/lib/spark/conf/:/usr/lib/spark/lib/spark-assembly-1.5.0-hadoop2.7.1.jar:/usr/lib/spark/lib/datanucleus-api-jdo-3.2.6.jar:/usr/lib/spark/lib/datanucleus-rdbms-3.2.9.jar:/usr/lib/spark/lib/datanucleus-core-3.2.10.jar:/etc/hadoop/conf/:/etc/hadoop/conf/:/usr/lib/hadoop/lib/native/:/usr/lib/hadoop/lib/*:/usr/lib/hadoop/*:/usr/lib/hadoop-hdfs/lib/*:/usr/lib/hadoop-hdfs/*:/usr/lib/hadoop-mapreduce/lib/*:/usr/lib/hadoop-mapreduce/*:/usr/lib/hadoop-yarn/lib/*:/usr/lib/hadoop-yarn/*

我能做些什么来解决这个问题吗？

谢谢。

正如您所发现的，Dataproc 在调用 Spark 时会在类路径上包含 Hadoop 依赖项。这样做主要是为了让 Hadoop 输入格式、文件系统等的使用变得相当简单。缺点是您最终将得到 Hadoop 的 guava 版本，即 11.02（请参阅HADOOP-10101).

如何解决这个问题取决于您的构建系统。如果使用 Maven，则可以使用 maven-shade 插件将您的 guava 版本重新定位到新的包名称下。这方面的一个例子可以在GCS Hadoop Connector 的包装，但其关键在于 pom.xml 构建部分中的以下插件声明：

  <plugin>
    <groupId>org.apache.maven.plugins</groupId>
    <artifactId>maven-shade-plugin</artifactId>
    <version>2.3</version>
    <executions>
      <execution>
        <phase>package</phase>
        <goals>
          <goal>shade</goal>
        </goals>
        <configuration>
          <relocations>
            <relocation>
              <pattern>com.google.common</pattern>
              <shadedPattern>your.repackaged.deps.com.google.common</shadedPattern>
            </relocation>
          </relocations>
        </execution>
      </execution>
    </plugin>

类似的重定位可以通过 sbt 的 sbt-assemble 插件、ant 的 jarjar 以及 gradle 的 jarjar 或 Shadow 来完成。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 Google Dataproc 集群实例中的 Spark-Submit 上运行应用程序 jar 文件的相关文章

无法解析类型为 xxx 的任何 bean；限定符：[@javax.enterprise.inject.Any()]

我有一个 LoginProvider 接口 public interface LoginProvider boolean login String username String password 以及两种不同的实现 public clas
“_加载小部件时出现问题”消息

加载小部件时如果找不到资源或其他内容则会显示加载小部件时出现问题就这样惊人的此消息保留在主屏幕上甚至没有说明加载时遇到问题的小部件我通过反复试验弄清楚了这一点但我想知道发生这种情况时是否有任何地方可以找到错误消息 Andr
添加动态数量的监听器(Spring JMS)

我需要添加多个侦听器如中所述application properties文件就像下面这样 InTopics Sample QUT4 Sample T05 Sample T01 Sample JT7 注意这个数字可以多一些也可以少一些
对话框上的 EditText 不返回任何文本

我太累了找不到错误我没有发现任何错误但我没有从 editText 收到任何文本请看下面的代码活动密码 xml
Grails 2.3.0 自动重新加载不起作用

我最近将我们的项目升级到 grails 2 3 0 一切工作正常除了每当我更改代码时自动重新加载都无法工作的问题这包括所有项目工件控制器域服务 gsps css 和 javascript 文件我的旧版本 grails 可以正常工
Android 自定义视图不能以正确的方式处理透明度/alpha

我正在绘制自定义视图在此视图中我使用两个不同的绘画和路径对象在画布上绘画我基本上是在绘制两个重叠的形状添加 Alpha 后视图中重叠的部分比图像的其余部分更暗这是不希望的但我不知道如何解决它这是我的代码片段用于展示我如何在
记录骆驼路线

我的项目中有几个 Camel 上下文如果可能的话我想以逆向工程方式记录路线因为我们希望保持与上下文相关的文档最新最好的方法是什么我们倾向于预先实际设计路线并使用来自EIP book http www eaipatterns co
hive - 在值范围之间将一行拆分为多行

我在下面有一张表想按从开始列到结束列的范围拆分行即 id 和 value 应该对开始和结束之间的每个值重复包括两者 id value start end 1 5 1 4 2 8 5 9 所需输出 id value current
Java 服务器-客户端 readLine() 方法

我有一个客户端类和一个服务器类如果客户端向服务器发送消息服务器会将响应发送回客户端然后客户端将打印它收到的所有消息例如如果客户端向服务器发送 A 则服务器将向客户端发送响应 1111 所以我在客户端类中使用 readLine 从服
Git 无法识别重命名和修改的包文件

我有一个名为的java文件package old myfile java 我已经通过 git 提交了这个文件然后我将我的包重命名为new所以我的文件在package new myfile java 我现在想将此文件重命名和内容更改提交
如何将 Jfreechart（饼图）添加到 netbeans 的面板中

我正在使用 netbeans gui 编辑器并且正在尝试添加一个本身位于内部框架中的 Jfreechart 并且这个内部框架我想将其添加到面板中正如您在此图中看到的那样抱歉我无法直接发布图像因为我新手 http www flick
获取给定类文件的目录路径

我遇到的代码尝试从类本身的 class 文件所在的同一目录中读取一些配置文件 File configFiles new File this getClass getResource getPath listFiles new Filenam
计算日期之间的天数差异

在我的代码中日期之间的差异是错误的因为它应该是 38 天而不是 8 天我该如何修复 package random04diferencadata import java text ParseException import java t
在 Spring Boot Actuator 健康检查 API 中启用日志记录

我正在使用 Spring boot Actuator APIproject https imobilenumbertracker com 拥有一个健康检查端点并通过以下方式启用它 management endpoints web base
如何在 Eclipse Java 动态 Web 项目中使用 .properties 文件？

我正在 Eclipse 中开发动态 Web 项目我创建了一个 properties 文件来存储数据库详细信息用户名密码等我通过右键单击项目和 New gt File 添加它我使用了Java util包Properties类但它不
逃离的正确方法是什么？使用 Oracle 12c MATCH_RECOGNIZE 时 JDBCPreparedStatement 中的字符？

以下查询在 Oracle 12c 中是正确的 SELECT FROM dual MATCH RECOGNIZE MEASURES a dummy AS dummy PATTERN a DEFINE a AS 1 1 但它不能通过 JDBC
尝试使用等于“是”或“否”的字符串变量重新启动 do-while 循环

计算行程距离的非常简单的程序一周前刚刚开始我有这个循环用于解决真或假问题但我希望它适用于简单的是或否我为此分配的字符串是答案 public class Main public static void main String a
Android AutoCompleteTextView 带芯片

我不确定我是否使用了正确的词语来描述此 UI 功能但我已附上我希望在我的应用程序中实现的目标的快照它由 Go SMS 使用用户在编辑文本中键入联系人在用户从完成下拉列表中选择联系人后该联系人将被插入到编辑文本中如附图所示编辑文
嵌入式 Jetty - 以编程方式添加基于表单的身份验证

有没有一种方法可以按如下方式以编程方式添加基于表单的身份验证我用的是我自己的LdapLoginModule 最初我使用基本身份验证并且工作正常但现在我想在登录页面上进行更多控制例如显示徽标等有没有好的样品我正在使用嵌入式 jett
在哪里存储 Java 的 .properties 文件？

The Java教程 http download oracle com javase tutorial essential environment properties htmlon using Properties 讨论如何使用 Prop

随机推荐

如何有条件地合并R中的两个数据框（公共列，条件）

我已经尝试这样做了大约 2 3 天但仍然找不到答案我想做的是我有两个数据框 x y 下面给出了它们的示例 X Response No Tab No Survey Date AC Name Mandal Name Village Name
我可以在 TreeSet 中插入重复的条目。如何克服这个问题

我有一个名为 Employee 的课程其中有employeeName and employeeId作为其成员变量我正在创建新的 Employee 对象然后将其添加到TreeSet我想根据以下内容对其进行排序employeeId 但我认
ASP.NET Web API - 不允许使用 PUT 和 DELETE 动词 - IIS 8

我最近从 Visual Studio 2010 升级到 Visual Studio 2012 RC 安装程序还会安装 IIS 8 Express Visual Studio 现在将其用作默认 Web 服务器 IIS 8 阻止我使用 PUT
CALAyer 子类中的不可动画属性

我定义了一个子类CALayer具有所讨论的可动画属性here 我现在想向该层添加另一个不可设置动画的属性以支持其内部簿记我将新属性的值设置为drawInContext 但我发现下次调用时它总是重置为 0 是因为 Core Animat
对话框窗口选择文件的数量限制？

Python版本 2 7 Tk版本 8 5 参考我之前的问题如何将对话框窗口中选定的文件添加到字典中我正在尝试从对话框窗口中选择 500 个文件并提取它们的名称作为字典的键文件总大小约为200M 我不知道为什么我得到一本空字典但是如
在 C 中强制执行强类型检查（typedef 的类型严格性）

有没有办法对相同类型的 typedef 强制执行显式强制转换我必须处理 utf8 有时我会对字符计数和字节计数的索引感到困惑所以最好有一些 typedef typedef unsigned int char idx t typedef
仅从 YouTube 的 URL 获取视频 ID

如何仅从 youtube 的 URL 获取视频 ID 例如 http www youtube com watch v aPm3QVKlBJg 有时 URL 会在 v 之后包含其他信息例如但我不需要其他信息只需要视频 ID 我只能想到使
如何尽早访问即将到来的 Asp.Net Identity 更改？

由于 Asp Net Identity 的每个版本之间都有很多更改是否有办法尽早访问未来即将发生的更改我们已经开始将夜间构建发布到aspnetwebstacknightly myget feed 目前 1 0 0 RTM 候选版本已经发
WPF：如何自动生成行标题而不仅仅是列标题？

我有一个WPF app with a DataGrid 我在用着AutoGenerateColumns True 填充它因为列数和行数并不总是相同问题是它仅自动生成列标题而不是行标题所以我决定做他们在这里所做的事情 http tech
如何在 Haskell 中产生无穷大？

类似于如何在 Haskell 中生成 NaN 在C中有INFINITY宏定义为math h 再次在http hackage haskell org package ClassyPrelude 0 1 docs Prelude Math
不支持 GLSL 1.30

我已经在具有良好显卡的 ubuntu 系统上成功运行了 gl 程序然而当我在带有图形移动 4 系列的旧英特尔机器上运行它时我收到以下错误 QGLShader compile Vertex 0 1 10 error GLSL 1 30
为什么使用共享库时对象和库的顺序不影响链接？

我有以下源代码 foo h void foo foo cpp include foo h include
检索组成员时出现 Microsoft Graph 3.0 java.net.SocketTimeoutException

我最近将我的应用程序升级为春季启动 2 4 4 微软图 3 0 0 在升级应用程序时我遵循了升级指南我正在使用以下代码检索组成员 public void getGroupMembersWithDevices final IGroup
定义与 IN 运算符一起使用的变量 (T-SQL)

我有一个使用 IN 运算符的 Transact SQL 查询像这样的东西 select from myTable where myColumn in 1 2 3 4 有没有办法定义一个变量来保存整个列表 1 2 3 4 我该如何定义它 d
Windows 版 Git 的官方 GUI 是哪一个？ [关闭]

Closed 这个问题是无关目前不接受答案 Windows 版 Git 的官方 GUI 是哪一个我很困惑git scm and msysgit 我知道有一个来自 github 的 GUI我也想用位桶也适用于私人免费托管我认为 Wind
if 语句中 setState() 的问题

if 语句中的 setState morePage true pageNum 1 if morePage this setState pageNum this state pageNum 1 console log this state p
我的电子邮件总是进入垃圾邮件文件夹[关闭]

Closed 这个问题是无关目前不接受答案在我的服务器中我通过 PHP 发送邮件但我的邮件总是进入垃圾邮件文件夹我做了spf记录但这并不重要我还在这个域中使用谷歌应用服务请帮忙邮件原文 Delivered To email
XPath 和 PHP：无法正常工作

这是我的代码 XML lt lt
Code First 迁移 - Update-database -script 命令生成的 SQL 脚本不起作用

我必须通过 Entity Framework 5 使用以下模型创建一个数据库 public class Post public int PostId get set MaxLength 200 public string Title get
在 Google Dataproc 集群实例中的 Spark-Submit 上运行应用程序 jar 文件

我正在运行一个 jar 文件其中包含我需要打包在其中的所有依赖项这种依赖关系之一是com google common util concurrent RateLimiter并已经检查过它的类文件是否在此 jar 文件中不幸的是当我在

在 Google Dataproc 集群实例中的 Spark-Submit 上运行应用程序 jar 文件

在 Google Dataproc 集群实例中的 Spark-Submit 上运行应用程序 jar 文件 的相关文章

随机推荐

热门标签

在 Google Dataproc 集群实例中的 Spark-Submit 上运行应用程序 jar 文件的相关文章