我正在尝试安装 apache Spark 以在我的 Windows 计算机上本地运行。我已遵循此处的所有说明https://medium.com/@loldja/installing-apache-spark-pyspark-the-missing-quick-start-guide-for-windows-ad81702ba62d.
安装完成后,我可以成功启动 pyspark,并执行以下命令
textFile = sc.textFile("README.md")
然后,当我执行对 textFile 进行操作的命令时,例如
textFile.first()
Spark 给我错误“worker 无法连接回”,并且我可以在控制台中看到来自worker.py 的异常,显示“ModuleNotFoundError:没有名为资源的模块”。查看源文件,我可以看到这个 python 文件确实尝试导入资源模块,但是该模块在 Windows 系统上不可用。我知道您可以在 Windows 上安装 Spark,那么我该如何解决这个问题呢?
我整个早上都在为同样的问题而奋斗。最好的选择是降级到 Spark 2.3.2
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)