Spark-2.1.0-bin-hadoop2.7\python：CreateProcess 错误=5，访问被拒绝

2024-04-12

我尝试在 pyspark 上运行这个简单的代码，但是当我执行收集时出现错误，访问被拒绝。我不明白出了什么问题，我认为我拥有所有权利。

x = sc.parallelize([("a", 1), ("b", 1), ("a", 1), ("a", 1),("b", 1), ("b", 1), ("b", 1), ("b", 1)], 3)
y = x.reduceByKey(lambda accum, n: accum + n)
for v in y.collect():
    print(v)

在本地但我有一个错误：

CreateProcess error=5, Access is denied

    17/04/25 10:57:08 ERROR TaskSetManager: Task 2 in stage 0.0 failed 1 times; aborting job
    Traceback (most recent call last):
      File "C:/Users/rubeno/PycharmProjects/Pyspark/Twiiter_ETL.py", line 40, in <module>
        for v in y.collect():
      File "C:\Users\rubeno\Documents\spark-2.1.0-bin-hadoop2.7\python\pyspark\rdd.py", line 809, in collect
        port = self.ctx._jvm.PythonRDD.collectAndServe(self._jrdd.rdd())
      File "C:\Users\rubeno\Documents\spark-2.1.0-bin-hadoop2.7\python\lib\py4j-0.10.4-src.zip\py4j\java_gateway.py", line 1133, in __call__
      File "C:\Users\rubeno\Documents\spark-2.1.0-bin-hadoop2.7\python\pyspark\sql\utils.py", line 63, in deco
        return f(*a, **kw)
      File "C:\Users\rubeno\Documents\spark-2.1.0-bin-hadoop2.7\python\lib\py4j-0.10.4-src.zip\py4j\protocol.py", line 319, in get_return_value
    py4j.protocol.Py4JJavaError: An error occurred while calling z:org.apache.spark.api.python.PythonRDD.collectAndServe.
    : org.apache.spark.SparkException: Job aborted due to stage failure: Task 2 in stage 0.0 failed 1 times, most recent failure: Lost task 2.0 in stage 0.0 (TID 2, localhost, executor driver): java.io.IOException: Cannot run program "C:\Users\\rubeno\Documents\spark-2.1.0-bin-hadoop2.7\python": CreateProcess error=5, Access is denied
        at java.lang.ProcessBuilder.start(Unknown Source)

您需要设置整个 pyspark 目录的权限。

右键单击目录 -> 属性 -> 安全选项卡，为“Everyone”设置“完全控制”并启用继承。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

apachespark

PySpark

Spark-2.1.0-bin-hadoop2.7\python：CreateProcess 错误=5，访问被拒绝的相关文章

Spark：如何从spark shell运行spark文件

我正在使用CDH 5 2 我能够使用火花外壳运行命令如何运行包含 Spark 命令的文件 file spark 有没有办法在没有 sbt 的情况下在 CDH 5 2 中运行编译 scala 程序在命令行中您可以使用 spark sh
如何使用 Spark 执行插入覆盖？

我正在尝试将我们的 ETL Hive 脚本之一转换为 Spark 其中 Hive ETL 脚本维护一个表其中需要在每晚新同步之前删除部分数据 Hive ETL 使用插入覆盖的方式将主表删除超过 3 天的数据基本上创建一个临时表其中的数
Spark - java.lang.OutOfMemoryError：请求的数组大小超出 VM 限制

我正在尝试对 Cloudera 的 Spark 2 1 0 中的数据帧进行 groupBy 操作该集群位于总 RAM 约为 512GB 的 7 节点集群上我的代码如下 ndf ndf repartition 20000 by user
Spark Worker 在 Heartbeater 中与 Spark Driver 通信的超时时间为 3600 秒

我没有配置任何超时值而是使用默认设置在哪里配置3600秒超时怎么解决呢错误信息 18 01 10 13 51 44 WARN Executor Issue communicating with driver in heartbeat
如何在 Spark 中创建空数据帧

我有一组基于 Avro 的配置单元表我需要从中读取数据由于Spark SQL使用hive serdes从HDFS读取数据因此比直接读取HDFS慢很多因此我使用数据块 Spark Avro jar 从底层 HDFS 目录读取 Avr
PySpark 用数组替换 Null

通过 ID 连接后我的数据框如下所示 ID Features Vector 1 50 Array 1 1 2 3 2 50 Null 我最终得到向量列中某些 ID 的空值我想用 300 维的零数组替换这些 Null 值与非空向量条
计算行的排名

我想根据一个字段对用户 ID 进行排名对于相同的字段值排名应该相同该数据位于 Hive 表中 e g user value a 5 b 10 c 5 d 6 Rank a 1 c 1 d 3 b 4 我怎样才能做到这一点可以使用ra
Spark 按列重新分区，每列动态分区数

如何根据列中的项目数对 DataFrame 进行分区假设我们有一个包含 100 人的 DataFrame 列是first name and country 我们希望为一个国家地区的每 10 个人创建一个分区如果我们的数据集包含 80
如何使用列的平均值将列添加到 DataFrame

有没有更好的办法 val mean df select avg date first getDouble 0 df withColumn mean lit mean 我认为避免采取行动是值得的可以使用以下方法避免额外的操作broadcas
将 Spark 数据框中的时间戳转换为日期

我见过这里如何将DataFrame中的时间戳转换为日期格式 https stackoverflow com questions 40656001 how to convert timestamp to date format in da
在 kubernetes 上安装 PySpark 软件包时出现 Spark-Submit：ivy-cache 文件未找到错误

我一整天都在与它斗争我能够安装并使用带有 Spark shell 或连接的 Jupiter 笔记本的包 graphframes 但我想使用 Spark Submit 将其移动到基于 kubernetes 的 Spark 环境我的火花版
从 SparkSession.read() 获取“org.apache.spark.sql.AnalysisException：路径不存在”[重复]

这个问题在这里已经有答案了我正在尝试读取提交的文件spark submit在客户端模式下连接到yarn集群将文件放入 HDFS 不是一个选项这是我所做的 def main args Array String if args null
pyspark：将多个数据帧字段传递给 udf

我是 Spark 和 Python 的新手任何帮助表示赞赏我有一个 UDF 并使用 US zipcd 纬度和经度创建了一个 Spark 数据框 UDF import math def distance origin destinatio
Spark：替换嵌套列中的空值

我想更换所有n a以下数据框中的值unknown 它可以是scalar or complex nested column 如果它是一个StructField column我可以循环遍历列并替换n a using WithColumn 但我希
列对象不可调用 Spark

我尝试安装 Spark 并运行教程中给出的命令但出现以下错误 https spark apache org docs latest quick start html https spark apache org docs latest q
无法在 SBT 中运行 Apache Spark 相关单元测试 - NoClassDefFoundError

我有一个简单的单元测试使用SparkContext 我可以在 IntelliJ Idea 中运行单元测试没有任何问题但是当尝试从 SBT shell 运行相同的测试时我收到以下错误 java lang NoClassDefFoun
使用 pyspark 计算所有可能的单词对

我有一个文本文档我需要找到整个文档中重复单词对的可能数量例如我有下面的word文档该文档有两行每行用分隔文档 My name is Sam My name is Sam My name is Sam My name is Sa
Spark日期格式问题

我在火花日期格式中观察到奇怪的行为实际上我需要转换日期yy to yyyy 日期转换后日期应为 20yy 我尝试过如下 2040年后失败 import org apache spark sql functions val df Seq
以编程方式结束/退出粘合作业

我正在使用 Glue 书签来处理数据我的工作是每天安排的但也可以手动启动由于我使用书签有时胶水作业可以在没有新数据要处理的情况下启动然后读取的数据帧为空在这种情况下我想好好地结束我的工作因为它没有什么关系我试过 if
如何在 Apache Spark 中通过 DStream 使用特征提取

我有通过 DStream 从 Kafka 到达的数据我想进行特征提取以获得一些关键词我不想等待所有数据的到达因为它是可能永远不会结束的连续流所以我希望以块的形式执行提取如果准确性会受到一点影响对我来说并不重要到目前为止我整理

随机推荐

按标准从 pandas 数据框（或 numpy ndarray？）中选择

我发现自己正在编写这种模式a lot tmp
成功后动态改变EndDialog中的RTF内容

多亏了这个question https stackoverflow com a 33679439 1076116 我能够执行自定义操作来临时更新和动态修改 MSI 数据库简而言之我正在做 CustomAction public stat
使用参数作为用户定义变量？

我们在非 GUI 模式下运行测试并传入各种参数如服务器端口线程等我们还希望在 GUI 模式下运行测试并能够在 GUI 中更改这些参数我想做的是使用 2 个用户定义的变量对象其中一个包含我们可以编辑的静态数据另一个包含参数
返回结构体数组还是结构体指针数组？

如果您需要退回struct从函数中您通常会返回一个指向struct反而如果您想返回结构数组建议返回结构体数组指向第一个元素的指针或者返回一个结构体指针数组我为以下两个选项画了一个图表 1 2 给出以下结构定义 struct v
小型 ARM 微控制器的 RTOS 内核之间的可量化差异 [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案有许多不同的 RTOS 可用于微控制器我专门寻找支持 ARM Cortex M 处理器的 RTOS 另外我对闭源解决方案不感兴趣试图从网站
离线、跨选项卡通信（仅限 JavaScript）

是否可以找到某些网站的国外实例 Ofc 这些是独立打开的选项卡不是通过 window open 我需要阻止用户打开 2 个选项卡并向之前打开的选项卡发送消息以告知无法打开 2 个选项卡 2个独立的选项卡可能会破坏页面离线存储和webSQ
GLubyte 与 GLshort 指数

查看 OpenGL 中顶点数组的文档我发现用于索引的两种最常见的内存类型是 GLubyte GL UNSIGNED BYTE 和 GLshort GL SHORT 我想知道使用两者作为索引是否有任何实际区别谢谢龙鹩莺 GL UNSIG
iOS 中键盘出现时将 UIView 向上移动

我有一个 UIView 它不在 UIScrollView 内我想在键盘出现时向上移动我的视图在我尝试使用此解决方案之前当键盘存在时如何使 UITextField 向上移动 https stackoverflow com questi
如何在 Swift 中优雅地检查 .first(where:) 闭包中的 case 枚举？

假设我有这个枚举 enum Item case foo String case bar String 以及它的列表 let items Item foo aa bar bb 我想找到first foo其中的一项这就是我所做的 items
SignTool.exe 偶尔会失败，退出代码为 1

作为构建系统的一部分我们使用带有证书的 Signtool exe 在构建二进制文件后对其进行签名偶尔很难说什么时候会发作签名失败 error MSB3073 The command C Program Files Microsoft
如何在具有不同画布大小的 ggplot2 绘图网格中保持一致的轴缩放

编辑清除描述和代码示例添加绘图我有一个数据集其中包含几种动物的位置我为每只动物创建了位置散点图网格因为图的 x y 是距离所以我想使每个图本身的 x y 保持相同的比例因此距离没有失真和跨图这样我可以比较具有相同比例的不
对数/线性 Z 缓冲区阴影贴图

问题在于伪影出现在距离很远的阴影中我想尝试制作一个对数深度缓冲区但我不明白应该在哪里完成以及如何完成我对全向阴影贴图使用点光源方法顶点着色器 version 460 core layout location 0 in vec3 a
通过代码隐藏结果向 html 标记添加属性会导致错误类型 (System.Web.UI.HtmlControls.HtmlElement) 不兼容

当我尝试向母版页中的 html 标记添加属性时就像后面的代码一样 prmimaryhtml tag Attributes Add lang en 我收到此错误 Parser Error Description An error occur
不断向Map添加数据

我需要在 for 循环之前将数据添加到 Map 或 HashMap 在 for 循环期间将数据添加到 Map 然后在循环后创建包含所有数据的文档在 Android 的 Java 中我使用了 Map
CMake 依赖于自定义目标中的“所有”目标

我正在制作一个需要以一种奇特的方式打包的库作为其中的一部分我有一个包含以下几行的脚本 only install the lib component nd put in the a special directory ADD CUSTOM
如何在Python中将字符串数据转换为JSON对象？

这是我从其中一项网络服务收到的示例字符串 body 7B 22type 22 3A 22change 22 2C 22url 22 3A 22http 3A 2F 2Fapi pachube com 2Fv2 2Ftriggers 2F41
为什么可以在没有 std::move 的情况下返回 std::unique_ptr ？

unique ptr
Ruby 路径设置不正确

好的我让 Ruby 完美地工作可以使用 Guard 来观看一些 sass 文件我重新启动了计算机苹果做了一些更新不知道这是否与问题有关重新启动后我重新打开防护装置然后收到此错误 System Library Framewor
如何将文本换行到 pre 标记中？

pre标签对于 HTML 中的代码块以及编写脚本时调试输出非常有用但是如何使文本自动换行而不是打印出一长行呢答案来自这一页 https longren io wrapping text inside pre tags in CSS p
Spark-2.1.0-bin-hadoop2.7\python：CreateProcess 错误=5，访问被拒绝

我尝试在 pyspark 上运行这个简单的代码但是当我执行收集时出现错误访问被拒绝我不明白出了什么问题我认为我拥有所有权利 x sc parallelize a 1 b 1 a 1 a 1 b 1 b 1 b 1 b 1 3 y x

Spark-2.1.0-bin-hadoop2.7\python：CreateProcess 错误=5，访问被拒绝

Spark-2.1.0-bin-hadoop2.7\python：CreateProcess 错误=5，访问被拒绝 的相关文章

随机推荐

热门标签

Spark-2.1.0-bin-hadoop2.7\python：CreateProcess 错误=5，访问被拒绝的相关文章