调用 z:org.apache.spark.api.python.PythonRDD.collectAndServe 时发生 py4j.protocol.Py4JJavaError

2024-03-24

我在我的机器（Ubuntu）上安装了apache-spark和pyspark，并且在Pycharm中，我还更新了环境变量（例如spark_home、pyspark_python）。我正在尝试做：

import os, sys
os.environ['SPARK_HOME'] = ".../spark-2.3.0-bin-hadoop2.7"
sys.path.append(".../spark-2.3.0-bin-hadoop2.7/bin/pyspark/")
sys.path.append(".../spark-2.3.0-bin-hadoop2.7/python/lib/py4j-0.10.6-src.zip")
from pyspark import SparkContext
from pyspark import SparkConf
sc = SparkContext('local[2]')
words = sc.parallelize(["scala", "java", "hadoop", "spark", "akka"])
print(words.count())

但是，我收到一些奇怪的警告：

py4j.protocol.Py4JJavaError: An error occurred while calling z:org.apache.spark.api.python.PythonRDD.collectAndServe.
: java.lang.IllegalArgumentException
at org.apache.xbean.asm5.ClassReader.<init>(Unknown Source)
at org.apache.xbean.asm5.ClassReader.<init>(Unknown Source)
at org.apache.xbean.asm5.ClassReader.<init>(Unknown Source)
at org.apache.spark.util.ClosureCleaner$.getClassReader(ClosureCleaner.scala:46)
at org.apache.spark.util.FieldAccessFinder$$anon$3$$anonfun$visitMethodInsn$2.apply(ClosureCleaner.scala:449)
at org.apache.spark.util.FieldAccessFinder$$anon$3$$anonfun$visitMethodInsn$2.apply(ClosureCleaner.scala:432)
at scala.collection.TraversableLike$WithFilter$$anonfun$foreach$1.apply(TraversableLike.scala:733)
at scala.collection.mutable.HashMap$$anon$1$$anonfun$foreach$2.apply(HashMap.scala:103)
at scala.collection.mutable.HashMap$$anon$1$$anonfun$foreach$2.apply(HashMap.scala:103)
at scala.collection.mutable.HashTable$class.foreachEntry(HashTable.scala:230)
at scala.collection.mutable.HashMap.foreachEntry(HashMap.scala:40)
at scala.collection.mutable.HashMap$$anon$1.foreach(HashMap.scala:103)
at scala.collection.TraversableLike$WithFilter.foreach(TraversableLike.scala:732)
at org.apache.spark.util.FieldAccessFinder$$anon$3.visitMethodInsn(ClosureCleaner.scala:432)
at org.apache.xbean.asm5.ClassReader.a(Unknown Source)
at org.apache.xbean.asm5.ClassReader.b(Unknown Source)
at org.apache.xbean.asm5.ClassReader.accept(Unknown Source)
at org.apache.xbean.asm5.ClassReader.accept(Unknown Source)
at org.apache.spark.util.ClosureCleaner$$anonfun$org$apache$spark$util$ClosureCleaner$$clean$14.apply(ClosureCleaner.scala:262)
at org.apache.spark.util.ClosureCleaner$$anonfun$org$apache$spark$util$ClosureCleaner$$clean$14.apply(ClosureCleaner.scala:261)
at scala.collection.immutable.List.foreach(List.scala:381)
at org.apache.spark.util.ClosureCleaner$.org$apache$spark$util$ClosureCleaner$$clean(ClosureCleaner.scala:261)
at org.apache.spark.util.ClosureCleaner$.clean(ClosureCleaner.scala:159)
at org.apache.spark.SparkContext.clean(SparkContext.scala:2292)
at org.apache.spark.SparkContext.runJob(SparkContext.scala:2066)
at org.apache.spark.SparkContext.runJob(SparkContext.scala:2092)
at org.apache.spark.rdd.RDD$$anonfun$collect$1.apply(RDD.scala:939)
at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:151)
at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:112)
at org.apache.spark.rdd.RDD.withScope(RDD.scala:363)
at org.apache.spark.rdd.RDD.collect(RDD.scala:938)
at org.apache.spark.api.python.PythonRDD$.collectAndServe(PythonRDD.scala:153)
at org.apache.spark.api.python.PythonRDD.collectAndServe(PythonRDD.scala)
at java.base/jdk.internal.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at java.base/jdk.internal.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
at java.base/jdk.internal.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.base/java.lang.reflect.Method.invoke(Method.java:564)
at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:244)
at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:357)
at py4j.Gateway.invoke(Gateway.java:282)
at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132)
at py4j.commands.CallCommand.execute(CallCommand.java:79)
at py4j.GatewayConnection.run(GatewayConnection.java:214)
at java.base/java.lang.Thread.run(Thread.java:844)

我怎么解决这个问题？

事实上，我找到了一个棘手的解决方案。为了解决以下问题：

确保您正确安装了 Py4j。最好使用官方版本安装。去做，

从以下位置下载最新的官方版本https://pypi.org/project/py4j/ https://pypi.org/project/py4j/.
解压缩文件并导航到新创建的目录，例如 cd py4j-0.x。
run

sudo python(3) setup.py 安装

然后将你的 Java 降级到版本 8（之前我使用的是版本 10）。为此，首先使用以下命令删除当前版本的 Java：

sudo apt-get purge openjdk-\* icedtea-\* icedtea6-\*

然后使用以下命令安装 Java 8：

sudo apt install openjdk-8-jre-headless

现在该代码对我来说可以正常工作。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

apachespark

PySpark

pycharm

py4j

调用 z:org.apache.spark.api.python.PythonRDD.collectAndServe 时发生 py4j.protocol.Py4JJavaError 的相关文章

通过sparklyr将cassandra表导入spark - 可以仅选择某些列吗？

我一直在与sparklyr要将大型 cassandra 表带入 Spark 请使用 R 注册它们并执行dplyr对他们进行操作我已经成功导入 cassandra 表代码如下 import cassandra table into spa
如何根据功能（自动）通过属性查看或隐藏字段？

我只想查看员工他的经理和 hr group hr user 组的 working hours 字段如何隐藏该字段自动执行无需编辑表单或触发按钮 class InheritHrEmployee models Model inherit
如何在 pandas 数据框中导入 tfrecord 文件？

我有一个 tfrecord 文件想将其导入 pandas 数据框或 numpy 数组中我找到了读取 tfrecords 的工具但它们只能在张量流会话中工作这不是我的用例感谢我能得到的任何帮助在 Colab 中你可以输入或者在你
有没有办法将类实例定义为 None ？

例如当我有这样一个Node类定义 class Node def init self val None next None self val val self next next def bool self return self val
python3导入找不到模块

我正在尝试测试书中的一个例子我得到了一个ImportError 该示例开始如下 from tkinter import from PP4E Gui Tools widgets import frame button entry 如果我放一
如何使用计划库运行异步函数？

我正在使用discord py rewrite 编写一个discord 机器人并且我想每天在特定时间运行一个函数我对异步函数完全没有经验而且我无法弄清楚如何在不使用 await 的情况下运行异步函数这只是我的一段代码这就是为什么有
在函数中调用 patsy 时出现命名空间问题

我正在尝试为 statsmodels 公式 API 编写一个包装器这是一个简化版本该函数的作用远不止于此 import statsmodels formula api as smf def wrapper formula data kw
Apache Spark Parquet：无法构建空组

我使用 Apache Spark 2 1 1 使用过 2 1 0 它是相同的今天切换我有一个数据集 root muons array nullable true element struct containsNull true reco
如何确定通过“from m import *”导入了什么？

我正在对导入语句进行一些修补我需要确切地知道哪些成员是由from m import 该文档似乎表明当 all 不存在时将导入所有不以下划线开头的成员这在所有情况下都是正确的吗我知道inspect getmembers dir an
Python 滚动文本模块

我想使用scrolledtext模块创建一个ScrolledText小部件以便在python中创建GUI 我已经成功创建了 ScrolledText 小部件但是我无法向其添加水平滚动条 e3 ScrolledText window3 w
如何reshape()numpy中奇数行和偶数行的总和

示例1 a np array 1 11 111 2 22 222 3 33 333 4 44 444 5 55 555 6 66 666 7 77 777 8 88 888 gt gt gt a array 1 11 111 2 22 22
将文件转换为 Ascii 抛出异常

后果我之前的问题 https stackoverflow com questions 31742609 how to strip the leading unciode characters from a file 31742694 nor
尝试导入 cv2(opencv-python) 包时出错

我正在尝试使用 cv2 opencv python 包访问我的网络摄像头当我尝试导入它时出现此错误 Traceback most recent call last File server py line 6 in
Pygame 简单循环在 Mac 上运行速度非常慢

E 在 OS X 和 Linux 上进行相同的测试后我可以确认以下情况仅发生在 OS X 上在 Linux 上它实际上以 1000 fps 的速度运行正如我碰巧想知道的那样有什么解释吗感谢 TextMate 我更喜欢在 Mac
PyCharm 上的远程调试

我的源代码存储在远程计算机上我想远程编码和调试我的Python源代码我应该如何配置PyCharm启用远程调试对于远程调试您需要将源代码复制到本地计算机设置项目配置到远程计算机的部署并添加远程 Python 解释器以在远程系统上运
如何在 AWS Glue 中使用 Spark 包？

我想使用 DatastaxSpark Cassandra 连接器 https mvnrepository com artifact com datastax spark spark cassandra connector 2 12 2 5
Python中基于行输入的条件求和

我正在尝试用Python 做一个条件和积简化的思路如下 A 1 1 2 3 3 3 B 0 50 0 25 0 99 0 80 0 70 0 20 我想要作为输出 Total1 0 50 1 0 25 1 Total2 0 99 2 To
导入后属性未添加到模块中

我做了以下实验室 vagrant ubuntu xenial test tree pack1 init py mod1 py pack2 init py mod2 py mod3 py test py 2 directories 6 fil
pytest - ModuleNotFoundError - python 3.6.4

我有一个具有以下布局的项目 MANIFEST in README md init py company init py api init py auth py debug py exceptions py reporting py rest
使用“容器ip”连接到docker容器

我在 mac 上运行 docker 我想使用 docker 容器的 ip 不是虚拟机的 ip 连接到它原因是 Spark 驱动程序将自身注册到容器 IP 172 17 0 2 并且从 mac 运行的客户端尝试连接到该地址有没有办法从 m

随机推荐

用 protected 覆盖受保护的内部！

这是一extension为了这question https stackoverflow com questions 2375556 overriding and overridden methods must have same acces
Autotools：如何清理lighttpd项目中“./configure”创建的文件？

我正在尝试lighttpd用于嵌入式 Linux 项目我获得了最新的源代码包并开始编写一个主 Makefile 其中封装了所有配置编译安装用于测试等内容反之亦然我想清理每一步清理后应该不再有生成的文件这对于重复测试很重要
调查 apache 基准测试失败的请求

我今天才开始用AB 阅读了几个关于新的 AB 教程并想尝试一下对我的网站进行负载测试使用它几次后我收到了大量失败的请求您能解释一下失败的请求是什么意思吗我怎样才能进一步调查这个问题 AB 结果示例 jailshell 3 2 ab
通过 es.map() 和 JSONStream.stringify() 将 JSONStream.parsed() 数据传输到文件流时，节点堆耗尽

我正在尝试通过 JSONStream parse 通过管道传输输入流从巨大的 GeoJSON 文件创建以将流分解为对象然后通过 event stream map 以允许我转换对象然后通过 JSONStream stringify 创
MongoDB 根据现有字段计算分数并将其放入同一集合中的新字段中

我正在研究 Mongodb 并且我有一个集合比方说Collection1 我必须计算现有字段的分数Collection1 并将结果放入新字段Field8 in Collection1 收藏1 db Collection1 find pre
我如何实例化？包含代码

编译器不允许我将保留在最后一行我不明白为什么如何编译这样一个通用结构我尝试将代码更改为 X a new A
为什么我需要“sys.argv”来在 PyQt 中启动 QApplication？

我尝试了解 PyQt 的作用我首先没有做的事情之一是 QApplication sys argv 为什么我必须给 QApplication 这个参数我知道什么sys argv做但在我的脚本中我不需要它这调用了C 类的构造函数QApp
通过 jQuery 下载八位字节流

我已经实现了以下代码我有一个像这样的 html 按钮 HTML
随机但独特的配对，有条件

我需要一些帮助指导来设置 PHP 脚本以随机配对数组中的项目这些项目每次都应该随机配对这些项目不应与自身匹配 item1 1 不应与 item1 1 配对 Most的项目有一个配偶 ie 项目 1 1 和项目 1 2 这些物品不应与它
使用 e.preventDefault() 后提交表单；

我有一个表单我正在使用 e preventDefault 停止提交我也尝试过返回 false 我会使用以下代码手动告诉表单在短暂延迟后提交 form delay 2000 submit 不幸的是 e preventDefault 似乎禁
带有 FileSystemWatcher 的 Windows 窗体未启动子窗体

我有一个简单的 C 4 0 Windows 窗体表单它创建一个监视目录的 FileSystemWatcher 实例添加文件后会触发适当的事件然后我在另一个目录中执行一些操作然后我创建一个子表单的实例子窗体挂起并且控件不绘制我
在生成 .equals() 时，有什么理由更喜欢 getClass() 而不是 instanceof？

我正在使用 Eclipse 生成 equals and hashCode 并且有一个选项标记为使用 instanceof 来比较类型默认情况下不选中此选项并使用 getClass 来比较类型有什么理由让我更喜欢 getClass ov
如何激活 Android 应用程序中的“分享”按钮？

我想将分享按钮添加到我的 Android 应用程序中像那样我添加了共享按钮但按钮未激活我点击了但什么也没发生我在 MainActivity java 中的代码 private ShareActionProvider mS
R：仅当键值相同且键在连续行中重复时，如何对行中的值求和？

我有以下这种结构的数据表 id key value 1 A 1000 1 A 2000 1 B 2001 1 A 2002 1 A 2004 2 B 2002 2 C 2002 我的目标是按 id 和 key 对值求和但不仅仅是按 id
如何在 VS Code 中配置侧边栏和面板的默认大小？

我每天都会在两个屏幕上使用特定的布局前半部分用于我的浏览器接下来的 3 个由 vscode 使用它需要第一个屏幕 Browser Vscode Vscode Vscode Sidebar Editor Editor Panel 我的问
Angular 4 中的并行 HTTP 请求

我正在构建一个简单的天气应用程序它使用 REST 服务来显示用户输入的任何城市的当前天气数据仪表板页面应显示用户指定的 5 个城市的当前天气所以我的问题是给定 5 个城市的数组为该数组中的每个元素调用 REST 服务通过 Ang
使用 Scanner 对用户输入进行 junit 测试

我必须测试类中的一个方法该方法使用 Scanner 类接受输入 package com math calculator import java util Scanner public class InputOutput public St
从 JQuery 中的 CK 编辑器文本区域获取文本

我在应用程序中使用 CK Editor
如何断言两个具有 Javabean 值的 HashMap 相等？

我有两个HashMap
调用 z:org.apache.spark.api.python.PythonRDD.collectAndServe 时发生 py4j.protocol.Py4JJavaError

我在我的机器 Ubuntu 上安装了apache spark和pyspark 并且在Pycharm中我还更新了环境变量例如spark home pyspark python 我正在尝试做 import os sys os environ

调用 z:org.apache.spark.api.python.PythonRDD.collectAndServe 时发生 py4j.protocol.Py4JJavaError

调用 z:org.apache.spark.api.python.PythonRDD.collectAndServe 时发生 py4j.protocol.Py4JJavaError 的相关文章

随机推荐

热门标签