无法将本地jar提交到spark集群：java.nio.file.NoSuchFileException

2024-02-19

~/spark/spark-2.1.1-bin-hadoop2.7/bin$ ./spark-submit --master spark://192.168.42.80:32141 --deploy-mode cluster file:///home/me/workspace/myproj/target/scala-2.11/myproj-assembly-0.1.0.jar

Running Spark using the REST application submission protocol.
Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties
17/06/20 16:41:30 INFO RestSubmissionClient: Submitting a request to launch an application in spark://192.168.42.80:32141.
17/06/20 16:41:31 INFO RestSubmissionClient: Submission successfully created as driver-20170620204130-0005. Polling submission state...
17/06/20 16:41:31 INFO RestSubmissionClient: Submitting a request for the status of submission driver-20170620204130-0005 in spark://192.168.42.80:32141.
17/06/20 16:41:31 INFO RestSubmissionClient: State of driver driver-20170620204130-0005 is now ERROR.
17/06/20 16:41:31 INFO RestSubmissionClient: Driver is running on worker worker-20170620203037-172.17.0.5-45429 at 172.17.0.5:45429.
17/06/20 16:41:31 ERROR RestSubmissionClient: Exception from the cluster:
java.nio.file.NoSuchFileException: /home/me/workspace/myproj/target/scala-2.11/myproj-assembly-0.1.0.jar
    sun.nio.fs.UnixException.translateToIOException(UnixException.java:86)
    sun.nio.fs.UnixException.rethrowAsIOException(UnixException.java:102)
    sun.nio.fs.UnixException.rethrowAsIOException(UnixException.java:107)
    sun.nio.fs.UnixCopyFile.copy(UnixCopyFile.java:526)
    sun.nio.fs.UnixFileSystemProvider.copy(UnixFileSystemProvider.java:253)
    java.nio.file.Files.copy(Files.java:1274)
    org.apache.spark.util.Utils$.org$apache$spark$util$Utils$$copyRecursive(Utils.scala:608)
    org.apache.spark.util.Utils$.copyFile(Utils.scala:579)
    org.apache.spark.util.Utils$.doFetchFile(Utils.scala:664)
    org.apache.spark.util.Utils$.fetchFile(Utils.scala:463)
    org.apache.spark.deploy.worker.DriverRunner.downloadUserJar(DriverRunner.scala:154)
    org.apache.spark.deploy.worker.DriverRunner.prepareAndRunDriver(DriverRunner.scala:172)
    org.apache.spark.deploy.worker.DriverRunner$$anon$1.run(DriverRunner.scala:91)
17/06/20 16:41:31 INFO RestSubmissionClient: Server responded with CreateSubmissionResponse:
{
  "action" : "CreateSubmissionResponse",
  "message" : "Driver successfully submitted as driver-20170620204130-0005",
  "serverSparkVersion" : "2.1.1",
  "submissionId" : "driver-20170620204130-0005",
  "success" : true
}

来自火花工人的日志：

 2017-06-20T20:41:30.807403232Z 17/06/20 20:41:30 INFO Worker: Asked to launch driver driver-20170620204130-0005
2017-06-20T20:41:30.817248508Z 17/06/20 20:41:30 INFO DriverRunner: Copying user jar file:///home/me/workspace/myproj/target/scala-2.11/myproj-assembly-0.1.0.jar to /opt/spark/work/driver-20170620204130-0005/myproj-assembly-0.1.0.jar
2017-06-20T20:41:30.883645747Z 17/06/20 20:41:30 INFO Utils: Copying /home/me/workspace/myproj/target/scala-2.11/myproj-assembly-0.1.0.jar to /opt/spark/work/driver-20170620204130-0005/myproj-assembly-0.1.0.jar
2017-06-20T20:41:30.885217508Z 17/06/20 20:41:30 INFO DriverRunner: Killing driver process!
2017-06-20T20:41:30.885694618Z 17/06/20 20:41:30 WARN Worker: Driver driver-20170620204130-0005 failed with unrecoverable exception: java.nio.file.NoSuchFileException: home/me/workspace/myproj/target/scala-2.11/myproj-assembly-0.1.0.jar

知道为什么吗？谢谢

UPDATE

下面的命令对吗？

./spark-submit --master spark://192.168.42.80:32141 --deploy-mode cluster file:///home/me/workspace/myproj/target/scala-2.11/myproj-assembly-0.1.0.jar

UPDATE

我想我对火花以及为什么我遇到这个问题有了更多的了解火花提交错误：ClassNotFoundException https://stackoverflow.com/questions/44684375/spark-submit-error-classnotfoundexception。关键点是虽然这里使用了 REST 这个词REST URL: spark://127.0.1.1:6066 (cluster mode)，应用jar提交后不会上传到集群，这和我的理解不一样。因此，spark集群无法找到应用程序jar，并且无法加载主类。

我将尝试了解如何设置spark集群并使用集群模式提交应用程序。不知道客户端模式是否会使用更多资源来进行流作业。

您正在以集群模式提交应用程序，这意味着将在某处创建 Spark 驱动程序应用程序，该文件必须存在于此处。

这就是为什么对于 Spark，建议使用 HDFS 或 S3 等分布式文件系统。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scala

apachespark

Kubernetes

sparksubmit

无法将本地jar提交到spark集群：java.nio.file.NoSuchFileException 的相关文章

无法使用 minikube 设置 Istio

我按照 Istio 的官方文档为带有 minikube 的示例 bookinfo 应用程序设置了 Istio 但我得到了无法连接到服务器 net http TLS 握手超时错误这些是我遵循的步骤我安装了 kubectl 和 miniku
“函数是第一等值”这到底是什么意思？

有人可以用一些很好的例子清楚地解释它吗在解释函数式编程时我在 Scala 中遇到了这句话一流并不是一个正式定义的概念但它通常意味着一个实体具有三个属性有可能used 不受限制只要普通值可以即从函数传递和返回放入容器等
Scala Function.tupled 和 Function.untupled 等效于变量 arity，或者使用元组调用变量 arity 函数

昨晚我试图围绕接受和调用通用函数做一些事情即类型在调用站点上已知但可能因调用站点而异因此定义应该是跨参数通用的例如假设我有一个函数f A B C gt Z 其实这样的还有很多fs 我事先不知道所以我无法确定类型或数量A B C
';'预期但发现“导入” - Scala 和 Spark

我正在尝试使用 Spark 和 Scala 来编译一个独立的应用程序我不知道为什么会收到此错误 topicModel scala 2 expected but import found error import org apache sp
Kubernetes Web UI（仪表板）缺少图表

我已经使用 Kubeadm v1 6 安装了 Docker v1 13 和 Kubernetes 然后我安装了 Web UI 仪表板我可以访问它但缺少 CPU 内存使用图为什么会发生这种情况对我来说安装后使用图就起作用了heaps
Kubernetes 的艰难之路 - 如何设置节点不可调度

我正在从头开始配置 Kubernetes 集群原因它是虚拟机内的本地设置一切都很好除了master节点被创建为可调度的我尝试过分配master通过将所需参数传递给 kubelet 二进制文件来对节点进行标签和适当的污点不能解决问
通过过滤对 Pyspark Dataframe 进行分组

我有一个数据框如下 cust id req req met 1 r1 1 1 r2 0 1 r2 1 2 r1 1 3 r1 1 3 r2 1 4 r1 0 5 r1 1 5 r2 0 5 r1 1 我必须观察客户看看他们有多少要求看看
Haskell scala 互操作性

我是 Scala 初学者来自面向对象范式在了解 Scala 的函数式编程部分时我被引导到 Haskell 纯函数式编程语言探索 SO 问题答案我发现 Java Haskell 具有互操作性我很想知道 Scala Haskell
匹配同一端口上不同路径的 Istio 虚拟服务路由

我想知道如何在同一端口上匹配 gRPC 路由以下是我希望通过 VirtualService 实现的目标的示例 apiVersion networking istio io v1alpha3 kind VirtualService meta
如何在Gradle中支持多种语言（Java和Scala）的多个项目？

我正在尝试将过时的 Ant 构建转换为 Gradle 该项目包含约50个Java子项目和10个Scala子项目 Java 项目仅包含 Java Scala 项目仅包含 Scala 每个项目都是由 Java 和 Scala 构建的这大大减慢
Scala（或 Java）中泛型函数的特化

是否可以在 Scala 中专门化泛型函数或类例如我想编写一个将数据写入 ByteBuffer 的通用函数 def writeData T buffer ByteBuffer data T buffer put data 但由于 put
在 Akka 中配置嵌套 Router

我有一些嵌套的路由器应创建它FromConfig 我想要的是这样的 test akka actor deployment worker router round robin nr of instances 5 slave router b
多个 scala 库导致 intellij 出错？

我正在使用 intellij 14 和 scala 2 11 6 使用 homebrew 安装并使用符号链接 ln s usr local Cellar scala 2 11 6 libexec src usr local Cellar s
如何使用 PySpark 预处理图像？

我有一个项目需要为 1 设置大数据架构 AWS S3 SageMaker 的概念验证使用 PySpark 预处理图像 2 执行 PCA and 3 训练一些机器或深度学习模型我的问题是了解如何使用 PySpark 操作图像数据但无法在
Scala：如何将可变参数指定为类型？

代替 def foo configuration String String 我希望能够写 type Configuration String String def foo configuration Configuration 主要用例是
Spark问题中读取大文件 - python

我已经使用 python 在本地安装了 Spark 并在运行以下代码时 data sc textFile C Users xxxx Desktop train csv data first 我收到以下错误 Py4JJavaError Tra
更改 build.sbt 自定义任务中的版本

我在 build sbt 中定义了一个自定义任务 val doSmth taskKey Unit smth doSmth version 1 0 SNAPSHOT 但它不会改变版本我真正想要的是自定义 sbt 发布任务它将始终将相同的版
带有安全 Kafka 抛出的 Spark 结构化流：无权访问组异常

为了在我的项目中使用结构化流我正在 hortonworks 2 6 3 环境上测试 Spark 2 2 0 和 Kafka 0 10 1 与 Kerberos 的集成我正在运行下面的示例代码来检查集成我能够在 Spark 本地模式下的
从 HList 获取元素

我尝试了 HList 并按预期进行了以下工作 val hl 1 foo HNil val i Int hl 0 val s String hl 1 但是我无法让以下代码正常工作让我们暂时假设对列表进行随机访问是一个聪明的主意 class
可选择将项目添加到 Scala 映射

我正在寻找这个问题的惯用解决方案我正在构建一个valScala 不可变 Map 并希望有选择地添加一项或多项 val aMap Map key1 gt value1 key2 gt value2 if condition key3 gt

随机推荐

iFrame 中的 Firebug 和 jQuery 选择器

我正在开发一个 Web 应用程序并使用 jQuery 插件 Colorbox 弹出一个窗口其中显示用于编辑父窗口元素的表单我正在使用 Firebug 来调试我的 Javascript 和 jQuery 并且我注意到我无法使用 jQue
Azure 队列创建最佳实践和规模

我正在研究 Windows Azure 上的大规模 Web 性能应用程序的架构目前是理论上的并想请教一下您有关 Windows Azure 队列不是 SB 以及如何最好地扩展创建它们的知识我基本上关注的是 MVC 前端 Web 角
嵌套列表理解

我尝试在内部列表理解中使用外部列表理解的值 x for x in range y for y in range 3 但不幸的是这引发了NameError因为这个名字y未知尽管外部列表理解指定了它这是 Python 的限制尝试过 2
JS：如何在回调中使用生成器和yield

我使用 JS 生成器在回调中生成一个值setTimeout function sleep Using yield here is OK yield 5 setTimeout function Using yield here will th
正则表达式匹配两个 {} 之间的所有内容

我在这里查看了不同的答案但不幸的是它们都不适合我的情况所以我希望你不要介意因此我需要匹配两个大括号之间的所有内容除了匹配以开头且没有这些大括号的情况例如这是一个超级文本匹配这个匹配这个这是另一个例子 deal wit
Python 日志记录：提供主模块的日志文件路径

有什么办法我可以提供filename我的主模块中的记录器我正在使用以下方法但是它不起作用所有日志都转到xyz log文件而不是main log 根据 nosklo 的建议进行更新记录器 py formatter logging Fo
带有表格布局的表格：固定；以及如何使一列更宽

所以我有一张这种风格的桌子 table layout fixed 这使得所有列具有相同的宽度我想让一列第一列更宽然后其余列以相等的宽度占据表格的剩余宽度如何实现这一目标 table border collapse collapse
PHP 的否定检查与“!”是否对应于“!=”或“!==”？

在 PHP 中是 if foo 相当于 if foo true or with if foo true 或者两者是完全不同的东西注意 OR 比较变量的值是否相等并根据需要进行类型转换 OR 检查两个变量是否具有相同的类型并且具有相同的
AWS Elastic Beanstalk 中使用 PlaywrightCrawler 包时出现错误

当尝试在我的服务器环境中使用 PlaywrightCrawler 包时我收到以下错误日志 32mINFO 39m 33m PlaywrightCrawler 39m Starting the crawl 33mWARN 39m 33m P
使用映射模板添加或更新 JSON 对象的属性 (AWS API Gateway)

在我的 AWS APIGW Rest API 中我尝试添加和或更新提交的请求正文 JSON 上的属性我能找到的每个示例都涉及构建新的 JSON 对象而不是更新现有对象在集成请求映射模板中我的传入数据正文如下所示如果发布的是新对
MIT App Inventor 2：模拟器无法启动伴侣

当我跑步时aiStarter exe以管理员身份然后单击连接到模拟器 http ai2 appinventor mit edu http ai2 appinventor mit edu 然后模拟器启动显示带有 android 的黑屏
vscode“智能感知”和“转到定义”非 js/ts 文件

在前端开发中我们经常不仅在 javascript 中导入 javascript typescript 文件我们使用别名和相对路径导入此类文件 Example import brandsQuery from graphql queries
多个标签的Python正则表达式

我想知道如何检索每个结果 p tag import re htmlText p p size 4 item1 p p size 4 item2 p p size 4 item3 p print re match
使用 SQLite3 在 php 中创建新数据库

如何使用 SQLite3 在 PHP 中创建新数据库 db new SQLite3 dbname 只是打开数据库但我想创建如果不存在要创建你需要使用new陈述 create or open if exists the database
在Rails中，为什么在没有运行bundle或bundle安装时会有一个新的Gemfile.lock？（还有一个新的 Gemfile 时间戳）

很奇怪的是突然间出现了一个新的Gemfile lock在我的文件夹中即使我还没有运行bundle or bundle install or bundle update几天了另外我已经合并了所有更改并在 1 小时前提交并推送所以这个
如何忽略“firebase-admin 似乎已安装在不受支持的环境中。”？

我正在使用 firebase 并正在为我的团队构建一个管理仪表板仪表板用于向我们的平台添加所有用户都可以看到的内容起初我使用 Firebase JS SDK 实现它并禁用安全规则来测试它到目前为止一切正常然后我尝试使用适用于
如何以编程方式枚举 Azure 订阅和租户？

如何以编程方式枚举 Azure 订阅和租户这与我之前的问题有关 NET Azure SDK 中的登录 AzureRmAccount 及相关等效项 https stackoverflow com questions 44619481 lo
非最大化 matlab GUI 图

有没有办法创建一个以最大化窗口启动的 GUI 我尝试添加set gcf Units normalized Position 0 0 1 1 在我的图形用户界面的末尾mygui OpeningFcn 功能但 GUI 未正确最大化请参阅打印
Woocommerce 按属性名称 asc 订购产品

我在 Woocommerce 中有一个包含产品的自定义页面模板但我想按属性的术语名称 asc 订购产品我有三个任期我不知道正确的方法我尝试过
无法将本地jar提交到spark集群：java.nio.file.NoSuchFileException

spark spark 2 1 1 bin hadoop2 7 bin spark submit master spark 192 168 42 80 32141 deploy mode cluster file home me works

无法将本地jar提交到spark集群：java.nio.file.NoSuchFileException

无法将本地jar提交到spark集群：java.nio.file.NoSuchFileException 的相关文章

随机推荐

热门标签