驱动核心数必须为正数

2023-12-28

我已将 Spark 从版本 3.1.1 升级到 3.2.1。现在，所有现有 Spark 作业都会因以下错误而中断。

Exception in thread "main" org.apache.spark.SparkException: Driver cores must be a positive number
at org.apache.spark.deploy.SparkSubmitArguments.error(SparkSubmitArguments.scala:634)
at org.apache.spark.deploy.SparkSubmitArguments.validateSubmitArguments(SparkSubmitArguments.scala:257)
at org.apache.spark.deploy.SparkSubmitArguments.validateArguments(SparkSubmitArguments.scala:234)
at org.apache.spark.deploy.SparkSubmitArguments.<init>(SparkSubmitArguments.scala:119)
at org.apache.spark.deploy.SparkSubmit$$anon$2$$anon$3.<init>(SparkSubmit.scala:1026)
at org.apache.spark.deploy.SparkSubmit$$anon$2.parseArguments(SparkSubmit.scala:1026)
at org.apache.spark.deploy.SparkSubmit.doSubmit(SparkSubmit.scala:85)
at org.apache.spark.deploy.SparkSubmit$$anon$2.doSubmit(SparkSubmit.scala:1043)
at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:1052)
at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)

我们在集群模式下使用 Spark 和 apache mesos，并与 cassandra 位于同一位置。

我尝试了几个选项：

e.g. appl/spark/bin/spark-submit --name "Testjob" --deploy-mode cluster --master mesos://<master node>:7077 --executor-cores 4 --driver-memory 1G --driver-cores 1 -class ....

您有解决此问题的任何提示或解决方案吗？

非常感谢... 干杯

不幸的是，我认为不可能在集群模式下使用 Mesos 运行 Spark 3.2.x，因为此功能 https://issues.apache.org/jira/browse/SPARK-35013以及 MesosClusterDispatcher 的工作方式。基本上，Dispatcher 正在提交 Spark 应用程序，并使用 --driver-cores 参数作为浮点数，然后 Spark (SparkSubmitArguments.scala) 将其读取为 String 并像这样解析它：

driverCores.toInt

当然这失败了。

我提出了一个快速解决 https://github.com/apache/spark/pull/37016为此，但与此同时，我只是根据 PR 中所做的更改构建了代码。我也将此报告为bug https://issues.apache.org/jira/browse/SPARK-39617.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

apachespark

驱动核心数必须为正数的相关文章

获取 emr-ddb-hadoop.jar 将 DynamoDB 与 EMR Spark 连接

我有一个 DynamoDB 表需要将其连接到 EMR Spark SQL 才能对该表运行查询我获得了带有发行标签 emr 4 6 0 和 Spark 1 6 1 的 EMR Spark Cluster 我指的是文档使用 Spark 分
如何使用 Scala 在 Spark 中漂亮地打印 JSON 数据帧？

我有一个数据帧我想将其作为有效的 json 写入 json 文件我当前的代码如下所示 val df DataFrame myFun df toJSON saveAsTextFile myFile json 输出的格式为如何将文件内容组
使用 mlib 执行 Spark-Shell，错误：对象 jblas 不是包 org 的成员

在spark shell中当我执行import org jblas DoubleMatrix 它会在 RHEL 上抛出错误对象 jblas 不是包 org 的成员实际上我用谷歌搜索了 jblas 并安装了 gfortran htt
Spark：替换嵌套列中的空值

我想更换所有n a以下数据框中的值unknown 它可以是scalar or complex nested column 如果它是一个StructField column我可以循环遍历列并替换n a using WithColumn 但我希
如何从字符串列中提取数字？

我的要求是从列中的评论列中检索订单号comment并且总是开始于R 订单号应作为新列添加到表中输入数据 code id mode location status comment AS SD 101 Airways hyderabad D
过滤字符串上的 Spark DataFrame 包含

我在用火花1 3 0 http spark apache org releases spark release 1 3 0 html and 火花阿夫罗1 0 0 https github com databricks spark avro
在 Spark MLlib 上使用 Java 中的 Breeze

在尝试从Java使用MLlib时使用微风矩阵运算的正确方法是什么例如scala 中的乘法很简单 matrix vector 相应的功能在Java中是如何表达的有一些方法例如 colon times 可以通过正确的方式调用 breez
使用 Scala 获取 Spark 数据集中最新时间戳对应的行

我对 Spark 和 Scala 比较陌生我有一个具有以下格式的数据框 Col1 Col2 Col3 Col 4 Col 5 Col TS Col 7 1234 AAAA 1111 afsdf ewqre 1970 01 01 00 00
获取 int() 参数必须是字符串或数字，而不是“Column”- Apache Spark

如果我使用以下代码我会收到此异常 int argument must be a string or a number not Column df df withColumn FY F when df ID substr 5 2 isin
如何将 Pyspark Dataframe 标题设置到另一行？

我有一个如下所示的数据框 col1 col2 col3 id name val 1 a01 X 2 a02 Y 我需要从中创建一个新的数据框使用 row 1 作为新的列标题并忽略或删除 col1 col2 等行新表应如下所示 id na
错误：无法找到或加载主类 org.apache.spark.launcher.Main [重复]

这个问题在这里已经有答案了如果有人能帮我解决以下路径问题我将不胜感激我非常怀疑这与缺少路径设置有关但不知道如何修复它 rxie ubuntu Downloads spark echo PATH usr bin java usr lo
如何根据条件添加新列（而不面临 JaninoRuntimeException 或 OutOfMemoryError）？

尝试根据这样的条件创建具有多个附加列的 Spark 数据框 df withColumn name1 someCondition1 withColumn name2 someCondition2 withColumn name3 someCo
如何将包含多个字段的大型 csv 加载到 Spark

新年快乐我知道以前曾提出回答过此类类似的问题但是我的问题有所不同我有大尺寸的 csv 有 100 个字段和 100MB 我想将其加载到 Spark 1 6 进行分析 csv 的标题看起来像附件sample http www roc
pyspark 将 twitter json 流式传输到 DF

我正在从事集成工作spark streaming with twitter using pythonAPI 我看到的大多数示例或代码片段和博客是他们从Twitter JSON文件进行最终处理但根据我的用例我需要所有字段twitter J
如果两个阶段使用相同的 DataFrame，spark 是否会读取同一文件两次？

以下代码读取相同的 csv 两次即使只调用一个操作端到端可运行示例 import pandas as pd import numpy as np df1 pd DataFrame np arange 1 000 reshape 1 1
如何使用 Scala 从 Spark 更新 ORC Hive 表

我想更新 orc 格式的 hive 表我可以从 ambari hive 视图进行更新但无法从 sacla spark shell 运行相同的更新语句 objHiveContext sql select from table name 能
如何将 Dataframe 列名称与 Scala 案例类属性相匹配？

本示例中的 Spark sql 列名来自case class Person case class Person name String age Int val people RDD Person An RDD of case class o
PySpark - 系统找不到指定的路径

Hy 我已经多次运行 Spark Spyder IDE 今天我收到这个错误代码是相同的 from py4j java gateway import JavaGateway gateway JavaGateway os environ SP
Spark 请求最大计数

我是 Spark 的初学者我尝试请求允许我检索最常访问的网页我的要求如下 mostPopularWebPageDF logDF groupBy webPage agg functions count webPage alias cntW
Apache Spark 两个 RDD 之间的差异

假设我有这个示例作业在带有 Java API 的 Groovy 中 def set1 def set2 0 upto 10 set1 lt lt it 8 upto 20 set2 lt lt it def rdd1 context pa

随机推荐

SQL Server 错误：“SQL Server 子查询返回超过 1 个值”

子查询返回超过 1 个值当子查询跟在 gt 后面或子查询用作表达式时这是不允许的我在调试以下代码时收到此有线错误消息 WHEN NOT EXISTS SELECT 1 FROM defs WITH NOLOCK WHERE defau
Neo4J 数据库大小/缩小

我们有一个包含约 1000 万个节点和约 3 亿个关系的 Neo4j 数据库数据库已增长至约 80 Gig 日常工作会删除旧数据并添加新数据因此节点和关系的大约数量保持相当恒定然而 db 文件的物理文件大小不断增长例如 relati
具有多核 CPU 的 JAX pmap

使用多核CPU的正确方法是什么jax pmap 以下示例在 CPU 核心后端上为 SPMD 创建环境变量测试 JAX 是否识别设备并尝试设备锁定 import os os environ XLA FLAGS xla force host
使用 XUnit 进行 .Net Core DynamodDB 单元测试

使用C net core 2 0 dynamo db 我有我的 Web api 它与我的 dynamo db 数据库交互具有 Get 和 Post 方法方法示例 HttpGet api data public async Task
使用 JAXB 编译多个包含同一元素的重复定义的 XSD

问题如何使 xjc Jaxb 为同一命名空间中包含重复元素定义的多个模式生成正确的 java 类信息我有三个 xsd 模式 A B 和 C 它们都具有相同的目标命名空间它们都是给我的 3 个 shemas 我无论如何都不允许以任何方
如何使用 setBorder 和 JFrame 在 Java 中为矩形添加边框

我正在尝试添加边框Rectangle元素由于某种原因它无法工作是否与JFrame 我可以设置我的整个JFrame有边界但找不到setBorder和我的矩形这是我的代码 package trivia import java awt C
在 Mocha 测试中使用 for 循环

我是摩卡新手我想尝试使用 for 循环来创建测试用例我想测试我制作的一个函数该函数接受标准 12 小时时间的输入并将其输出为 24 小时军用时间这就是它的样子 exports main function time var hr p
相邻的 svg：多边形边不相交

我正在使用彼此相邻的多边形绘制条形图如下所示如果仔细观察每个多边形之间都有空白放大我正在努力阻止这种情况发生我发现了 SVGshape rendering https developer mozilla org en US do
JPA CascadeType Persist 不适用于 Spring 数据

我有两个实体用户 Data EqualsAndHashCode exclude id Entity Table name users public class User Id SequenceGenerator name user id
合并TFS中的多个文件

我们使用 TFS 作为我们软件的版本控制系统目前该软件在两个独立的分支中有两个版本分支版本1 0 和分支版本2 0 版本 1 0 中的每个修复都必须合并到版本 2 0 中我从要合并的文件的上下文菜单中手动合并我的问题是某些修
如何在 Android 中将 JSON ARRAY 数据发布到服务器

我想将以下 JSON 数据发送到服务器并读取 android 中的响应下面是 Json 数据 class OrderItemListDto orderItemList class OrderItemDto orderId 24 itemI
如果在单个查询中 $pull 之后数组计数为零，mongodb 会删除文档

我有一个要求我的comments架构如下所示 id 1 comments userId 123 comment nice userId 124 comment super 我想根据以下内容提取元素userId场地我正在执行以下查询 co
使用 tr1 在 C++ 中生成超出范围的随机数

我试图从 0 1 范围内的实数均匀分布生成数字但编译器生成的数字超出了 0 1 范围这是代码 int main void Solver solve mt19937 mteng mteng seed rdtsc uniform real
Leaflet图层控件仅在单击时打开

有没有办法只在单击时打开传单图层控件默认情况下当鼠标悬停鼠标移开时它会展开折叠我只想点击打开您可以使用一些 jQuery 来完成此任务将折叠选项设置为 false 然后创建一个按钮来显示隐藏图层控件 btn onclic
通过flutter在Firestore中添加嵌套数据

我来自以下问题如何在 Firebase 中管理添加和更新数据 https stackoverflow com questions 61910157 how to manage add and update data in firebase
如何获取UIImage中形状的UIBezierPath或将UIImage裁剪为某种形状

我是 iOS 新手我想知道我是否可以获得UIBezierPath of a UIImage 我有一个UIImage的面部布局并想要得到UIBezierPath 这有助于我裁剪UIImage 或者谁能告诉我其他裁剪方法UIImages 但
Groovy instance.metaclass 与 this.metaclass

我有一个以下脚本 task myTask class Person Person Person instance this println this metaClass class name println this getMetaClas
如何在 SwiftUI 中重置子视图？

下面是我正在使用的代码的简化版本但每当我重置键盘时它仍然显示以前的键盘无论如何当我调用 ResetKeyboard 时它会用新的 KeyboardView 替换键盘吗 struct GameView View State var
Ember.js——如何在嵌套/重复视图中定位插座，以及这种 ui 布局的最佳实践是什么？

我正在重构一个继承的 Ember 应用程序其中存在相当多的非 MVC 混乱我希望尽可能保持模块化并希望在多个屏幕中重用各种 ui 组件以帮助防止代码重复看起来直销店是做到这一点的最佳方式现在我有一个显示许多元素的 UI 每个
驱动核心数必须为正数

我已将 Spark 从版本 3 1 1 升级到 3 2 1 现在所有现有 Spark 作业都会因以下错误而中断 Exception in thread main org apache spark SparkException Driver

驱动核心数必须为正数

驱动核心数必须为正数 的相关文章

随机推荐

热门标签

驱动核心数必须为正数的相关文章