Spark 作业因 java.io.NotSerializedException: org.apache.spark.SparkContext 失败

2023-11-22

当我尝试应用方法（ComputeDwt）时，我遇到了上述异常RDD[(Int,ArrayBuffer[(Int,Double)])]输入。我什至正在使用extends Serialization在 Spark 中序列化对象的选项。这是代码片段。

input:series:RDD[(Int,ArrayBuffer[(Int,Double)])] 
DWTsample extends Serialization is a class having computeDwt function.
sc: sparkContext

val  kk:RDD[(Int,List[Double])]=series.map(t=>(t._1,new DWTsample().computeDwt(sc,t._2)))

Error:
org.apache.spark.SparkException: Job failed: java.io.NotSerializableException: org.apache.spark.SparkContext
org.apache.spark.SparkException: Job failed: java.io.NotSerializableException: org.apache.spark.SparkContext
at org.apache.spark.scheduler.DAGScheduler$$anonfun$abortStage$1.apply(DAGScheduler.scala:760)
at org.apache.spark.scheduler.DAGScheduler$$anonfun$abortStage$1.apply(DAGScheduler.scala:758)
at scala.collection.mutable.ResizableArray$class.foreach(ResizableArray.scala:60)
at scala.collection.mutable.ArrayBuffer.foreach(ArrayBuffer.scala:47)
at org.apache.spark.scheduler.DAGScheduler.abortStage(DAGScheduler.scala:758)
at org.apache.spark.scheduler.DAGScheduler.org$apache$spark$scheduler$DAGScheduler$$submitMissingTasks(DAGScheduler.scala:556)
at org.apache.spark.scheduler.DAGScheduler.org$apache$spark$scheduler$DAGScheduler$$submitStage(DAGScheduler.scala:503)
at org.apache.spark.scheduler.DAGScheduler.processEvent(DAGScheduler.scala:361)
at org.apache.spark.scheduler.DAGScheduler.org$apache$spark$scheduler$DAGScheduler$$run(DAGScheduler.scala:441)
at org.apache.spark.scheduler.DAGScheduler$$anon$1.run(DAGScheduler.scala:149)

谁能告诉我可能是什么问题以及应该采取什么措施来克服这个问题？

The line

series.map(t=>(t._1,new DWTsample().computeDwt(sc,t._2)))

引用 SparkContext (sc）但 SparkContext 不可序列化。 SparkContext 旨在公开在驱动程序上运行的操作；它不能被在工作线程上运行的代码引用/使用。

你必须重新构建你的代码，以便sc未在您的地图函数闭包中引用。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

scala

Hadoop

apachespark

Spark 作业因 java.io.NotSerializedException: org.apache.spark.SparkContext 失败的相关文章

为什么spark在sql查询末尾附加'WHERE 1=0'

我正在尝试使用 Apache Spark 执行简单的 mysql 查询并创建一个数据框但由于某些原因 Spark 附加 WHERE 1 0 在我想要执行的查询末尾并抛出异常说明 You have an error in your SQL
Java中的文字赋值[重复]

这个问题在这里已经有答案了定义上有什么区别 double example 23 1d or double example 23 1 为什么long float double可以以l f d结尾之间没有区别double example 2
Glassfish：在部署期间修改 EAR 的部署描述符

经过几天的搜索尝试和摇头我将这个问题发布到 SO 尽管它seems已经得到答复这是场景我有一个 EAR 应用程序目前包含一个 WAR 和一个 EJB 模块 EJB 模块使用 JPA persistence xml 并且一些无状态
EL 通过 Scriptlet

在 JSP 中使用 EL 相对于 scriptlet 的优势是什么 EL 被认为是无脚本语言 EL 使 JSP 免受容易出错原始 Java 代码并强制您根据 MVC 思想编写 JSP EL 或像 JSTL 这样的标签库不可能实现的任何事情
EMF Eclipse：带有自定义字段（属性）的枚举

好吧在 Java 中这是可能的 import org eclipse emf common util Enumerator public enum MyEnum implements Enumerator LITERAL1 0 Name
我需要一个字数统计程序[关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions 我需要弄清
从猪的单行输入生成多行输出

我的要求是通过在 Pig 脚本中使用单行输入来生成多行输出可能的解决方案有哪些这个想法是将你的输入线转换成一个袋子然后将其压平这里可能有两种情况阅读文字 txt load pig fun input text txt using
org.apache.commons.codec.digest.Md5Crypt.md5Crypt 函数。 linux下出现异常，windows下正常

我们正在使用commons codec加密密码使用org apache commons codec digest Md5Crypt md5Crypt功能在Windows环境下工作正常但在CentOS上却抛出异常我们有3台centOS
为什么下面代码的输出是Thread[main,5,main]

public class test1 public static void main String args TODO Auto generated method stub Thread t Thread currentThread Sys
如何通过HBase REST服务获取Phoenix表数据

我使用 Phoenix JDBC 驱动程序在以下代码片段中创建了一个 HBase 表 Class forName org apache phoenix jdbc PhoenixDriver Connection conn DriverMan
反应式 Spring Webflux REST 控制器内部重定向

我正在为 spring 反应项目创建简单的控制器服务器在设置重定向到另一个位置时我在调用时发现错误http localhost 8080 There was an unexpected error type Internal Serve
java中日期转换dd-MMM-yyyy到dd-MM-yyyy

在Java中将23 Mar 2011转换为23 03 2011的最简单方法是什么感谢大家这似乎解决了这个问题 try Calendar cal Calendar getInstance cal setTime new SimpleDat
JFrame Glasspane 也优于 JDialog，但不应该

我有一个带有 Glasspane 的 JFrame 未装饰该框架打开一个 JDialog 也未装饰也有一个 glassPane 并隐藏自身 setVisible false Glasspanes 通过 setGlassPane 设置对
“___ 中的方法 ___() 是在无法访问的类或接口中定义的”编译错误

我发现了一个奇怪的编译限制我无法解释并且我不明白这个限制的原因示例1 考虑这些类 In package e1 public class C1 enum E1 A B C public E1 x In package e2 import
Java LRU 缓存使用 LinkedList

堆栈溢出的新手所以请不要介意我以菜鸟的方式问这个问题我正在尝试使用链表实现 LRU 缓存我在这里看到了使用 linkedHashMap 和其他数据结构的其他实现但对于这种情况我正在尝试使用链表创建最佳优化版本正如我在技术期间被问
如何列出hadoop hdfs中目录及其子目录中的所有文件

我在 hdfs 中有一个文件夹其中有两个子文件夹每个子文件夹大约有 30 个子文件夹最后每个子文件夹都包含 xml 文件我想列出所有 xml 文件仅给出主文件夹的路径在本地我可以这样做apache commons io 的 h
ASTParser：解析绑定后查找声明节点

我创建了一个启用了绑定的 AST 当我稍后解析绑定时我得到了一个有效的 ITypeBinding 但是当我想要获取绑定的声明 Node 时它总是返回 null 除非 ITypeBinding 在 sourceFile 中声明这是我
Retrofit 2.0：预期为 BEGIN_OBJECT，但在第 1 行第 1 列路径 $ [重复] 处为 STRING

这个问题在这里已经有答案了我在邮递员上传递了更新用户请求并获得了成功的响应参见图片现在当我尝试使用 Retrofit 2 在我的应用程序中执行相同操作时出现错误 com google gson JsonSyntaxException
Scala Play 2.3 IntelliJ 14 *社区版 - 是否可以在没有命令行激活器命令的情况下运行项目

From http blog jetbrains com scala 2012 12 28 a new way to compile http blog jetbrains com scala 2012 12 28 a new way to
Java 可变 BigInteger 类

我正在使用 BigIntegers 进行计算该计算使用一个调用 multiply 大约 1000 亿次的循环并且从 BigInteger 创建新对象使其非常慢我希望有人编写或找到了 MutableBigInteger 类我在 jav

随机推荐

Java RSA 中字符串中的密钥

我在我的应用程序中使用 RSA 加密技术为了存储生成的公钥我将其转换为字符串然后将其保存在数据库中 Key publicKey null Key privateKey null KeyPair keyPair RsaCrypto ge
删除子图中的死角，同时保留标题和标签

您好我在 matlab 中遇到问题我想创建一个包含 10 个子图的图形 2X5 方向但问题是我想减少它们之间的死角区域我还需要保留第一行图像的标题 xlabel 和第二行图像的 xlabel 仅不需要 ylabel 到目前为止我
Visual Studio 2015 无法与 Apache Cordova 工具一起使用

我完整安装了 VS 2015 Enterprise Tools for Apache Cordova 当我打开或创建任何项目时它不会构建甚至不会在运行按钮上显示 Ripple 模拟器或设备信息我已经完全重新安装了但还是一样当我
使用网络音频 api 播放简单的声音

我一直在尝试按照一些教程中的步骤使用按钮通过网络音频 API 播放简单的编码本地 wav 或 mp3 文件我的代码如下 testAudioAPI js window AudioContext window AudioContext win
关于何时应该将直接缓冲区与 Java NIO 一起用于网络 I/O 的简单规则？

具有以简单直接的方式解释复杂事物的天赋的人可以解决这个问题吗使用 Java NIO 进行网络 I O 时为了获得最佳性能何时应使用直接 ByteBuffer 与常规 ByteBuffer 例如我应该读入堆缓冲区并从那里解析它执行多
Postgres：找不到适用于 jdbc 的驱动程序

我知道这可能与此处发布的问题重复抱歉这是我为数据库连接编写的代码 try Class forName org postgresql Driver catch ClassNotFoundException e e printStackTr
如何在 numpy 和 R 之间传递大型数组？

我正在使用 python 和 numpy scipy 为文本处理应用程序执行正则表达式和词干提取但我也想使用 R 的一些统计包将数据从 python 传递到 R 的最佳方法是什么然后回来另外我需要在某个时候将数组备份到磁盘所以如
有没有办法让SCNNode总是在其他节点前面？

我一直在尝试使用场景套件制作一个场景其中指定的对象始终位于其他对象的前面尽管事实上它实际上位于其他对象的后面与此类似的效果用于blender 显然搅拌机使用 GUI 和大量数学来转换 2D 对象但我需要在具有 SCNGeometr
如何在 Rails 应用程序中运行 rake 任务

我想做的事在 model rb 中在 after commit 中我想运行 rake 任务 ts reindex ts reindex 通常与 rake 一起运行 ts index 如果您希望此 rake 代码在请求周期内运行那么您
如何从 Chrome 扩展程序打开 mailto: 链接？

我有一个名为 URL 缩短的 Chrome 扩展程序Shrtr 目前它允许用户将缩短的 URL 复制到剪贴板但在下一个版本中我添加了使用电子邮件发送缩短的 URL 的功能mailto 链接即mailto subject
Django 添加占位符到 django 内置登录表单

我正在使用 django 内置登录forms我想在用户名和密码中添加占位符我的模板 div class form group div class col md 12 form username add class form control
Android Market - 上传 APK 文件时出错

刚才我已经开发了一个应用程序现在我准备将其上传到Android市场但是当我尝试上传时它显示以下错误消息市场不接受使用调试证书签名的 apk 创建有效期至少 50 年的新证书 Market 要求用于签署 apk 的证书至少在 2033
序列化 .net 对象并省略文档类型？

我编写了一些 net 代码来使用 XMLSerializer 类序列化对象 public static string serialize object o Type type o GetType System Xml Serializati
Jquery - 不可滚动 div 上的滚动事件

example http jsbin com ofiy 2 edit preview 我尝试用不可滚动的div 绿色的滚动一个div 红色的我的问题是当我在绿色 div 上滚动时 jqueryscroll 不着火 HTML div s
当 rpm 文件中存在用于 rpm 安装的“缺少”lib 时

我正在为 centos 生成一个 rpm 文件但是当我尝试在干净的机器上安装它时它失败了 gt Running transaction check gt Package grass x86 64 0 6 4 4 1 el6 will b
Facebook 登录无法在 Safari/ iPhone 中打开

我正在创建一个显示 Facebook 好友的应用程序首先用户需要单击登录按钮然后在填写登录 ID 和密码后会出现一个简单的弹出屏幕其中将显示好友列表一切正常可以在 Firefox Chrome IE 上运行但不会在 Safar
Apache POI - 使用 XSSFWorkbok + servlet 响应

我的 java 应用程序在启用下载 XLSX 文件时遇到问题按照此链接中显示的示例使用 Apache POI 创建 excel 文件供用户下载我尝试了两种配置来下载保存电子表格首先使用 XLS 文件 response setCon
Java/JavaScript 日期：这是真的吗？

假设用户在与应用程序服务器不同的时区通过浏览器运行我的 Web 应用程序我使用 JavaScript 在客户端序列化日期date getTime 方法我通过 Json 发送结果毫秒然后通过调用在服务器端创建一个 Java Date 对
UITextField - 仅允许数字和标点输入/键盘

我已经尝试过下面的代码但只允许输入键盘上的数字我的应用程序要求键盘使用句号句号用于金钱交易我尝试的代码是 BOOL textField UITextField textField shouldChangeCharactersInR
Spark 作业因 java.io.NotSerializedException: org.apache.spark.SparkContext 失败

当我尝试应用方法 ComputeDwt 时我遇到了上述异常RDD Int ArrayBuffer Int Double 输入我什至正在使用extends Serialization在 Spark 中序列化对象的选项这是代码片段 inp

Spark 作业因 java.io.NotSerializedException: org.apache.spark.SparkContext 失败

Spark 作业因 java.io.NotSerializedException: org.apache.spark.SparkContext 失败 的相关文章

随机推荐

热门标签

Spark 作业因 java.io.NotSerializedException: org.apache.spark.SparkContext 失败的相关文章