PYspark SparkContext 错误“调用 None.org.apache.spark.api.java.JavaSparkContext 时发生错误。”

2024-03-30

我知道这个问题之前已经发布过，但我尝试实施解决方案，但没有一个对我有用。我为 Jupyter Notebook 安装了 Spark 使用本教程：

https://medium.com/@GalarnykMichael/install-spark-on-mac-pyspark-
453f395f240b#.be80dcqat

在 MAC 上安装最新版本的 Apache Spark

当我尝试在 Jupyter 中运行以下代码时

wordcounts = sc.textFile('words.txt')

我收到以下错误：

name 'sc' is not defined

当我尝试添加代码时：

from pyspark import SparkContext, SparkConf
sc =SparkContext()

出现以下错误：

An error occurred while calling 
None.org.apache.spark.api.java.JavaSparkContext.
: java.lang.NoClassDefFoundError: Could not initialize class 
org.apache.hadoop.util.StringUtils
at
org.apache.hadoop.security.SecurityUtil.
getAuthenticationMethod(SecurityUtil.java:611)

在bash中添加路径：

export SPARK_PATH=~/spark-2.2.1-bin-hadoop2.7
export PYSPARK_DRIVER_PYTHON="jupyter"
export PYSPARK_DRIVER_PYTHON_OPTS="notebook"

#For python 3, You have to add the line below or you will get an error
# export PYSPARK_PYTHON=python3
alias snotebook='$SPARK_PATH/bin/pyspark --master local[2]'

请帮我解决这个问题。

这些步骤解决了我的问题[pyspark with jupyter notebook local setup for window os]

我的错误是Jupyter笔记本

下载并安装java8：https://www.oracle.com/java/technologies/downloads/#java8-windows https://www.oracle.com/java/technologies/downloads/#java8-windows
下载spark-3.2.1-bin-hadoop2.7：https://spark.apache.org/downloads.html https://spark.apache.org/downloads.html

使用 7zip 或其他工具解压 .tgz 文件
像 C:\spark-3.2.1-bin-hadoop2.7 一样

Note：我们将使用此路径作为环境变量

下载 winutils.exe ：https://github.com/steveloughran/winutils/tree/master/hadoop-2.7.1/bin https://github.com/steveloughran/winutils/tree/master/hadoop-2.7.1/bin

将其放入 C:\Hadoop\bin 位置

在window上下载并安装python：https://www.python.org/downloads/ https://www.python.org/downloads/
添加环境变量：

在“设置”窗口的“相关设置”下，单击“高级系统设置”。在“高级”选项卡上，单击“环境变量”。单击“新建”以创建新的环境变量。单击编辑以修改现有环境变量。

5.1.用户变量：

JAVA_HOME：C:\Program Files\Java\jdk-1.8
路径：%JAVA_HOME%\bin
HADOOP_HOME : C:\Hadoop
PYSPARK_DRIVER_PYTHON ：jupyter
PYSPARK_DRIVER_PYTHON_OPTS ：笔记本
PYSPARK_PYTHON : xxxxx\AppData\Local\Programs\Python\Python39\Scripts
SPARK_HOME：C:\spark-3.2.1-bin-hadoop2.7
SPARK_LOCAL_IP ：本地主机

5.2.系统变量：

C:\Program Files\Java\jdk-20\bin
C:\spark-3.2.1-bin-hadoop2.7\bin
C:\Hadoop\bin

Testing:

打开cmd并运行>> java -version

C:\Users\xxxxxxx>java -版本

它应该返回像

java version "1.8.0_371"
Java(TM) SE Runtime Environment (build 1.8.0_371-b11)
Java HotSpot(TM) 64-Bit Server VM (build 25.371-b11, mixed mode)

在cmd中运行C:\Users\xxxxxxx>pyspark

此命令将您重定向到http://localhost:8890/树

创建新笔记本并编写以下代码并运行

导入发现公园 findspark.init()

import pyspark # 仅在findspark.init()之后运行从 pyspark.sql 导入 SparkSession 火花 = SparkSession.builder.getOrCreate()

df = Spark.sql('''选择'spark'作为印度''') df.show()

按照上述步骤后

- - - - - - - 笔记 - - - - - - - - -

如果全部设置完毕并且您仍然显示错误“Using Spark's default log4j ERROR SparkContext .......”，请尝试以下步骤：

尝试关闭cmd窗口并重新打开它并尝试再次在cmd中执行>>pyspark命令
尝试重新启动系统并重新打开 cmd 并尝试再次重新运行 >>pyspark 命令
检查java版本，有时java最新版本在pyspark中引发错误尝试使用jdk-1.8和spark-3.2.1-bin-hadoop2.7，似乎jdk-1.8和spark-3.2.1-bin-hadoop2.7正在工作为我。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

MacOS

apachespark

terminal

PySpark

PYspark SparkContext 错误“调用 None.org.apache.spark.api.java.JavaSparkContext 时发生错误。” 的相关文章

如何通过终端运行 JavaScript 脚本？

例如如果您要运行 Python 脚本您可以输入python 文件名 py或者如果你想运行 C 程序制作文件名 then 文件名你如何做到这一点 js files 另一个答案是 NodeJS Node js 是一个基于 Chrome 的
Flutter Websockets MacOS：相同的代码可以在调试模式下工作，但不能在发布模式下工作：“（操作系统错误：提供了节点名或服务名..）”

Summary 我有一个在 Flutter 中使用 WebSockets 的程序该程序在debug模式但运行相同exact代码在release模式会导致错误 Context Flutter 文档告诉我们如何使用 WebSocket ht
npm install 不起作用，抛出错误

我正在尝试在 nodejs 中安装 yo 和其他一些软件包但是我不断收到错误我是节点新手所以我有点迷失我运行的是 Mac OS X 10 10 3 我正在使用的命令是 sudo npm install global yo 这样做会给
IntelliJ：线程“主”java.lang.NoClassDefFoundError中的异常：org/apache/spark/sql/types/DataType

附言有一个类似的问题here https stackoverflow com questions 40287289 java lang noclassdeffounderror org apache spark logging 但那是在
如何设置SPARK_HOME变量？

按照链接中的气泡水步骤进行操作http h2o release s3 amazonaws com sparkling water rel 2 2 0 index html http h2o release s3 amazonaws com
计算 pyspark df 列中子字符串列表的出现次数

我想计算子字符串列表的出现次数并根据 pyspark df 中包含长字符串的列创建一个列 Input ID History 1 USA UK IND DEN MAL SWE AUS 2 USA UK PAK NOR 3 NOR NZE 4
Spark 中的 StandardScaler 未按预期工作

知道为什么 Spark 会这样做吗StandardScaler 根据定义StandardScaler StandardScaler 将一组特征标准化为均值为零标准差为 1 withStd 标志将数据缩放为单位标准差而标志 withMe
java setFullScreenWindow 在 Mac 中隐藏登录对话框

我使用的是全屏窗口类似于屏幕保护程序使用这里的方法 GraphicsEnvironment getLocalGraphicsEnvironment getDefaultScreenDevice setFullScreenWindow t
Spark.sql.shuffle.partitions 的最佳值应该是多少，或者在使用 Spark SQL 时如何增加分区？

我实际上正在使用 Spark SQLhiveContext sql 它使用 group by 查询我遇到了 OOM 问题所以考虑增加价值spark sql shuffle partitions从默认的 200 到 1000 但这没有帮助
受信任的 1.5 小程序可以执行系统命令吗？

如果是的话这个能力有什么限制吗具体来说我需要以 Mac OSX 为目标我以前用过这个在 Windows 系统上启动东西但从未在 Mac 上尝试过 public void launchScript String args Strin
Spark 在 WholeTextFiles 上创建的分区少于 minPartitions 参数

我有一个文件夹里面有 14 个文件我在一个集群上使用 10 个执行器运行 Spark Submit 该集群的资源管理器为 YARN 我创建了我的第一个 RDD 如下所示 JavaPairRDD
如何在 swiftUI (macOS) 中检测按键按下和释放

除了标题之外没什么可说的我希望能够在按下按键和释放按键时在 macOS 上在 swiftUI 视图中执行操作在 swiftUI 中是否有任何好的方法可以做到这一点如果没有有什么解决方法吗不幸的是键盘事件处理是其中一个令人痛苦
dyld：惰性符号绑定失败

当我尝试运行时遇到一个奇怪的错误gatsby develop在新创建的 gatsby 项目中这不应该与 gatsby js 静态站点生成器有任何关系因为我在不同的场合也遇到了相同的错误当我跑步时gatsby develop在我的一个
AVCaptureDevice 找不到任何设备

这行代码是我今天遇到的问题 macOS 应用程序 NSArray devices AVCaptureDevice devicesWithMediaType AVMediaTypeVideo 我更新Xcode后系统总是让我空着devices
如何在不卸载应用程序的情况下删除木桶？

我最近安装了一个带有 homebrew cask 的应用程序但我想自己处理它的更新而不是通过brew cask upgrade 是否有命令或选项可以从本地列表中删除木桶而不卸载它如果我使用brew cask remove or bre
Java Swing For mac 中的 DJ Native Swing 浏览器

我有一个用 Swing 制作的 Java 应用程序并且使用了一个 DJ Native Swing 浏览器当我尝试在 OS X 上使用它时它抛出了一个NoClassDefFoundError尽管我添加了 swt jar 但始终如此有人
`pyqt5'错误`元数据生成失败`

我正在尝试安装pyqt5使用带有 M1 芯片和 Python 3 9 12 的 mac 操作系统我怀疑M1芯片可能是原因我收到一个错误metadata generation failed 最小工作示例 directly in the t
如何用 kevent() 替换 select() 以获得更高的性能？

来自Kqueue 维基百科页面 http en wikipedia org wiki Kqueue Kqueue 在内核和用户空间之间提供高效的输入和输出事件管道因此可以修改事件过滤器以及接收待处理事件同时每次主事件循环迭代仅使用对
OSX 上的 locale.getlocale() 问题

我需要获取系统区域设置来执行许多操作最终我想使用 gettext 翻译我的应用程序我打算在 Linux 和 OSX 上分发它但我在 OSX Snow Leopard 上遇到了问题 python Python 2 5 2 r252 60
获取 Mojave 上的鼠标坐标

我有一个非常基本的小命令行应用程序可以在下次单击鼠标时获取鼠标坐标 import

随机推荐

Docker 错误：仅允许一个“主机”网络实例[重复]

这个问题在这里已经有答案了我正在尝试运行一个容器其中我需要将网络驱动程序用作主机而不是桥接器我在 Centos 机器上运行它我的 docker compose yml 是 version 3 4 services testCo
Asp.net Mvc 2 Display性能问题？

在我最近使用 Asp net Mvc 2 的项目中我们发现 DisplayFor 存在性能问题我不太确定是否是real问题还是我错过了什么我希望一些 Asp net Mvc Guru 可以向我解释一下 Model public cla
如何使用 AIR mobile 在 Android 上正确控制舞台方向？

我有一个 AIR 应用程序我希望将其锁定为横向我从不希望应用程序旋转到纵向模式 Adobe 针对此问题的解决方案似乎是按如下方式配置我的 app xml 文件
无法使用 GOLANG 和 POLYMER http 将上传的文件保存在服务器上：没有这样的文件

我正在使用 vaadin upload 通过聚合物在网络应用程序上上传文件我使用 golang 作为后端
使用opencv python进行颜色检测

我正在尝试在 python 中运行一个使用 opencv 编写的脚本该脚本使用网络摄像头来跟踪彩色对象这里的对象是蓝色的 opencv 的文档中也提到了这一点here https opencv python tutroals readt
使用 Swift 的 UIView 动画选项

我该如何设置UIViewAnimationOptions to Repeat in an UIView动画块 UIView animateWithDuration 0 2 delay 0 2 options UIViewAnimationO
关注 Selenium Webdriver 和 Python 中的新窗口

在 Python 中使用 Selenium Webdriver 我可以单击打开新浏览器窗口的按钮但我不知道如何将焦点更改到新窗口我在互联网上进行了搜索但没有发现任何有用的信息问题是窗口没有标题我需要的是焦点在新窗口上这样我就可以
如何在小部件事件处理程序内访问小部件选项中保存的数据

我的数据保存在选项变量中但是在选择列表的事件 OnChange 中 this 引用 DOMElement 因此 this options 引用对象列表我能拥有的其他地方 var o this options 但这在这种情况下没有用如何
如何在 Android 中使用 .pls 文件进行流式传输？

我想使用此 url 为我的 Android 应用程序播放 pls 文件http playerservices streamtheworld com pls VIRGINRADIO DUBAIAAC pls我知道无法直接使用 MediaPla
如何从 NSString 中删除特定 NSString 之后的字符

我有一个字符串如下 NSString str1 Hello your bal 68094 我想删除之后的所有字符符号在字符串中遇到任何人都可以给我解决这个问题吗尝试以下解决方案 NSString str1 Hello your bal
windows上安装pear，路径错误

我正在尝试在 Windows 7 上安装 PEAR 我有 php 5 4d web soft php目录我也想将 PEAR 安装在这个目录中我跑 php go pear phar I see this 这条路对我来说没问题然后我运行
链接表MS Access 2010更改连接字符串

我正在开发一个现有的 MS Access 2010 项目该项目具有指向 Sql Server 数据库的链接表当我将鼠标移至链接表时我可以看到连接字符串 ODBC DRIVER SQL Server SERVER 10 0 0 1 UI
日期格式“YYYY-MM-DD HH:MM:SS”有名称吗？

对于通过电话或与我的同事交谈是否有已建立的此日期格式的缩写名称其他标准日期格式的名称也很有用那就是ISO标准日期 http en wikipedia org wiki ISO 8601 Dates and time http en w
多行文本框中是否可以有不同颜色的线条？

多行文本框中是否可以有不同颜色的线条我正在向文本框添加数据我想通过颜色向用户阐明不同类型的文本如果可能的话该怎么做如果您使用RichTextBox控制查看文档here http msdn microsoft com en us l
Docker 总是显示“Docker Engine running...”

你好我有新的现有项目并使用 docker 问题是我的 docker 桌面应用程序始终处于Docker Engine starting 但在我的图标中它已经显示了Docker Desktop is running 在 Windows 10
实体框架中的 int 到 string

如何在 Link to EF 中将 int 转换为字符串 clr 无法想象将 int 转换为字符串实体框架无法找出要翻译的 SQL 片段 ToString into 那么如何编写返回字符串而不是 int 的 linq 语句呢遗憾的是 E
二头肌中用户分配身份的输出参数？

我正在尝试检索客户ID使用 Azure Bicep 创建的托管标识但是文档 https learn microsoft com en us azure templates microsoft managedidentity userass
SQL Service Broker - 通信场景 - 从 SQL 2008 R2 迁移到 SQL 2014

Summary SQL Server 2014 相对于 2008 R2 中是否有任何新功能不允许出现以下情况相同的方法可以转移到新服务器吗该应用程序使用 SQL Service Broker 将数据从卫星 SQL Express 计算机
rugarch 不会加载，但可以安装得很好（在 Mac 上）

我在加载 rugarch 时遇到问题我可以安装没问题 install packages rugarch 但是当我尝试加载它时出现错误 library rugarch Error onLoad failed in loadNamespa
PYspark SparkContext 错误“调用 None.org.apache.spark.api.java.JavaSparkContext 时发生错误。”

我知道这个问题之前已经发布过但我尝试实施解决方案但没有一个对我有用我为 Jupyter Notebook 安装了 Spark 使用本教程 https medium com GalarnykMichael install spark o

PYspark SparkContext 错误“调用 None.org.apache.spark.api.java.JavaSparkContext 时发生错误。”

PYspark SparkContext 错误“调用 None.org.apache.spark.api.java.JavaSparkContext 时发生错误。” 的相关文章

随机推荐

热门标签