即使以管理员身份运行，在 Windows 上运行 Spark 也会出现错误 5（访问被拒绝）

2023-12-09

我从 Spark 开始，所以不太确定我的问题出在哪里，并在这里寻找有用的提示。我正在尝试以管理员身份在 Windows 7 计算机上运行 Spark (pyspark)，但它似乎不起作用（我仍然收到 WindowsError 5）。见下图：

我已经下载了该文件（版本 1.2.0，为 Hadoop 2.4 或更高版本预先构建），通过命令行使用 tar 解压缩它，并在调用 bin\pyspark 之前设置 IPYTHON=1。当我调用它时，pyspark 会运行，但根据图像，我收到以下错误。

当我尝试调用某些 SparkContext 对象时，我得到名称“sc”未定义。

我已经安装了 python 2.7.8、Spyder IDE 并且处于公司网络环境中。

有谁知道这里会发生什么吗？我查了一些问题，例如为什么我收到 WindowsError：[Error 5] 访问被拒绝？但找不到线索。

Briefly:

我遇到了应该是同样的问题。对我来说，那就是*.cmd文件在$spark/bin目录未标记为可执行文件；请尝试通过以下方式确认：

右键单击pyspark2.cmd and:
属性/安全选项卡然后检查“读取和执行”

我在另一个网站上找到了解决方法，建议下载hadoop-winutils-2.6.0.zip（抱歉没有链接）。以下是要使用的 cmd 示例（移动到正确的目录后）：

t:\hadoop-winutils-2.6.0\bin\winutils.exe chmod 777 *

我确实需要运行chmod 777cmd 使/tmp/hive也可写。祝你好运！

（...这里是新的 - 对于格式不佳表示抱歉）
（更新：马特感谢修复格式问题！）

根本原因：我在 Windows 上使用的 tar 程序tar -zxf <file.tgz>没有申请提取文件的正确属性。在这种情况下是“可执行”文件没有正确设置。是的，也许我应该更新我的 cygwin 版本。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

即使以管理员身份运行，在 Windows 上运行 Spark 也会出现错误 5（访问被拒绝）的相关文章

如何在 IPython 笔记本中对齐小部件按钮

我有以下和平代码 from ipywidgets import widgets from IPython display import display import numpy as np class Test object def ini
了解 Spark 中的 DAG

问题是我有以下 DAG 我认为当需要洗牌时火花将工作划分为不同的阶段考虑阶段 0 和阶段 1 有些操作不需要洗牌那么为什么 Spark 将它们分成不同的阶段呢我认为跨分区的实际数据移动应该发生在第 2 阶段因为这里我们需要cogr
如果两个阶段使用相同的 DataFrame，spark 是否会读取同一文件两次？

以下代码读取相同的 csv 两次即使只调用一个操作端到端可运行示例 import pandas as pd import numpy as np df1 pd DataFrame np arange 1 000 reshape 1 1
将嵌套字典键值转换为 pyspark 数据帧

我有一个 Pyspark 数据框如下所示我想提取 dic 列中的那些嵌套字典并将它们转换为 PySpark 数据帧像这样请让我知道如何实现这一目标 Thanks from pyspark sql import functions a
HDFS：使用 Java / Scala API 移动多个文件

我需要使用 Java Scala 程序移动 HDFS 中对应于给定正则表达式的多个文件例如我必须移动所有名称为 xml从文件夹a到文件夹b 使用 shell 命令我可以使用以下命令 bin hdfs dfs mv a xml b 我可以
InvalidRequestException（为什么：empid 如果包含 Equal，则不能被多个关系限制）

这是关于我从 Apache Spark 查询 Cassandra 时遇到的问题 Spark 的正常查询工作正常没有任何问题但是当我使用关键条件进行查询时出现以下错误最初我尝试查询复合键列族它也给出了与下面相同的问题由以下原因引
数量重新分配逻辑 - 具有外部数据集的 MapGroups

我正在研究一种复杂的逻辑需要将数量从一个数据集重新分配到另一个数据集在例子中我们有Owner and Invoice 我们需要从数量中减去Invoice准确地Owner匹配在给定汽车的给定邮政编码处减去的数量需要重新分配回同一辆车出
Sqoop - 绑定到 YARN 队列

因此使用 MapReduce v2 您可以使用绑定到某些 YARN 队列来管理资源和优先级基本上通过使用 hadoop jar xyz jar D mapreduce job queuename QUEUE1 input output
Spark SQL sql("").first().getDouble(0) 给我不一致的结果

我有下面的查询它应该找到列值的平均值并返回一个数字的结果 val avgVal hiveContext sql select round avg amount 4 from users payment where dt between 2
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
Hive：如何分解嵌入 CSV 文件中的 JSON 列？

从 CSV 文件带有标题和管道分隔符中我得到了以下两个内容其中包含一个 JSON 列内部有一个集合如下所示第一种情况使用没有名称的 JSON 集合 ProductId IngestTime ProductOrders 918
如何将数据帧转换为 JSON 并使用密钥写入 kafka 主题

我正在尝试以 JSON 格式向 kafka 写入一个数据帧并在 Scala 中向该数据帧添加一个键我目前正在使用 kafka spark 中的这个示例 df selectExpr CAST key AS STRING CAST valu
缩放数据框的每一列

我正在尝试缩放数据框的每一列首先我将每一列转换为向量然后使用 ml MinMax Scaler 除了简单地重复它之外是否有更好更优雅的方法将相同的函数应用于每一列 import org apache spark ml linalg
DataFrame 分区到单个 Parquet 文件（每个分区）

我想重新分区合并我的数据以便将其保存到每个分区的一个 Parquet 文件中我还想使用 Spark SQL partitionBy API 所以我可以这样做 df coalesce 1 write partitionBy entity
如何删除spark输出中的compactbuffer

下面是我在spark shell中运行的程序但是当我将输出保存在HDFS中时我得到带有compactbuffer的输出如何删除spark输出中的compactbuffer Program val a sc textFile datag
pyspark.sql.functions.window 函数的“startTime”参数和 window.start 有何作用？

示例如下 df spark createDataFrame 1 2017 05 15 23 12 26 2 5 1 2017 05 09 15 26 58 3 5 1 2017 05 18 15 26 58 3 6 2 2017 05 15
从apache Spark中的文本文件查找rdd中存储的数据大小

我是 Apache Spark 版本 1 4 1 的新手我编写了一段小代码来读取文本文件并将其数据存储在 Rdd 中有没有一种方法可以获取 rdd 中数据的大小这是我的代码 import org apache spark SparkC
在 Jupyter 笔记本中使用 PySpark 读取 XML

我正在尝试读取 XML 文件 df spark read format com databricks spark xml load path to my xml 并收到以下错误 java lang ClassNotFoundExceptio
collect_list() 是否保持行的相对顺序？

想象一下我有以下 DataFrame df id featureName featureValue id1 a 3 id1 b 4 id2 a 2 id2 c 5 id3 d 9 想象一下我运行 df groupBy id agg coll
如何访问 Spark Streaming 应用程序的统计端点？

从 Spark 2 2 0 开始 API 中有新的端点用于获取有关流作业的信息我在 EMR 集群上运行 Spark 在集群模式下使用 Spark 2 2 0 当我到达流作业的端点时它给我的只是错误消息没有附加到的流侦听器我已经深入研

随机推荐

如何构建netty-transport-native-epoll-4.0.32.Final-linux-x86_64.jar？

我在 netty 中使用本机 epoll 传输并且能够从存储库下载 netty transport native epoll 4 0 32 jar 不过我还需要 netty transport native epoll 4 0 32 Fi
Xamarin 跨平台证书固定

我正在使用 Xamarin 设计一个应用程序我想通过使用证书固定来提高我们的安全性但我找不到办法做到这一点我可以使用 android 的本机方法来做到这一点但我想知道是否有跨平台的解决方案甚至是 Windows Phone 的解决
在 Web 应用程序中创建和下载巨大 ZIP（来自多个 BLOB）的最佳实践

我需要从我的 Web 应用程序执行大量文件下载显然这将是一个长期运行的操作它将被用于每年一次每个客户所以时间不是问题除非超时但我可以通过创建某种形式的 keepalive 心跳来处理我知道如何创建一个隐藏的iframe并与它
以编程方式将应用程序添加到 Windows 防火墙

我有一个通过 ClickOnce 安装和更新的应用程序该应用程序通过 FTP 下载文件因此需要添加为 Windows 防火墙的例外由于 ClickOnce 的工作方式 EXE 的路径会随着每次更新而变化因此异常也需要更改对防火墙进
bash-求行中数字的平均值

我正在尝试逐行读取文件并找到每行中数字的平均值我收到错误 expr non numeric argument 我已将问题范围缩小到 sum expr sum i 但我不确定为什么代码不起作用 while read a rows do fo
如何安排 C# Windows 服务每天运行一个方法？ [复制]

这个问题在这里已经有答案了可能的重复如何安排 C Windows 服务每天执行任务我正在创建一个 C Windows 服务但我没有找到让计时器每天在 App Config 文件中指定的特定时间触发方法的最佳方法例如每天早上 6
运行libsandbox

我目前正在开发一个在线 C C 汇编编译器我偶然发现了一个名为 libsandbox 的好软件这使我能够运行在线编写的代码对其进行编译并拦截系统调用如果有首先我对 Linux 环境还是个新手我已经下载了 tar gz 解压它
Facebook Login Graph API 返回错误的个人资料图片 URL

我通过调用使用 Facebook 图形 API它返回我期望的 json 响应像这样的东西 id 1234567890987654321 email xxxxxx u0040example com name xxxx xxxx first
C# 无符号字节加密到 Java 有符号字节解密

我有一个 C 加密应用程序我的部分文件因为它们是大文件使用 RijndaelManaged 因此我将文件转换为字节数组并仅加密其中的一部分然后我想使用Java解密该文件所以我必须解密仅文件的一部分指那些字节在 C 中加密问题
Google QUERY 公式包含下拉列表中的“全部”

我有 3 个单独的下拉菜单来在我的 Google 表格中生成以下 QUERY 函数 QUERY HISOP Training A2 D select A B C D where A contains M5 and C contains M6
将字符串变量传递给 MySQL，作为元组失败

使用新购买的 RaspberryPi 我对 Python MySQL 非常陌生所以请原谅我发布的天真问题我已经看过很多关于此问题的问答但我似乎无法理解为什么这会失败我收到错误必须是字符串或只读缓冲区而不是元组如果我用 TY
批处理命令删除文件夹中除一个文件之外的所有内容（子文件夹和文件）

首先过去已经回答过类似的问题但不完全是我的问题在其他一些解决方案中建议隐藏文件夹文件和更改属性但我不希望这样做除非没有更简单的方法可用另外我已经尝试了这里建议的解决方案以及其他几个 MS DOS命令删除除一个之外的所有文
使用 TEXT_DETECTION 来自 Cloud Vision API 的结果区域设置

我在用着npm node cloud vision api API 正确检测文档的语言但结果字符以与区域设置不对应的西方字符子集返回我假设它们应该以 UTF 8 字符返回但所有区域设置特定字符都映射到基本西方字符子集例如 Warto
如何查看 HttpWebRequest 类发送的原始 HTTP 请求？

我知道你们都会回答使用像 Fiddler 这样的调试代理服务器但事情没那么简单这是我的情况我有一些代码在服务器上运行位于 ASP NET 页面代码隐藏 aspx cs 中它除其他外建立了到another服务器抓取一些东西
创建注册表项时出现 UnauthorizedAccessException

我正在研究如何添加shortcut在我的应用程序的 Windows 上下文菜单中我碰到this文章我尝试了一下这是它用来在注册表中创建密钥的代码 private void btnAddMenu Click object sender
Git - 将存储库与签出分支同步的最简单方法

我的工作流程基本上是在我的台式电脑上创建一个存储库对其进行一些工作并提交更改克隆到我的笔记本电脑上致力于此提交更改现在我想将更改与我的桌面同步试git push desktop local my repo会失败因为maste
如何在具有命名空间前缀的 TXMLDocument 上使用 XPath？

我有一个从第三方 Web 服务器收到的 XML 数据包
IIS applicationHost“setEnvironment”属性
PHP 刷新所有级别的输出缓冲

我正在尝试实现一个简单的 Http Response 类该类实现 Http Streaming 或 Chunked Encoding 为了做到这一点我需要设置output buffering Off在 php ini 中并以一定的时间
即使以管理员身份运行，在 Windows 上运行 Spark 也会出现错误 5（访问被拒绝）

我从 Spark 开始所以不太确定我的问题出在哪里并在这里寻找有用的提示我正在尝试以管理员身份在 Windows 7 计算机上运行 Spark pyspark 但它似乎不起作用我仍然收到 WindowsError 5 见下图我已经

即使以管理员身份运行，在 Windows 上运行 Spark 也会出现错误 5（访问被拒绝）

即使以管理员身份运行，在 Windows 上运行 Spark 也会出现错误 5（访问被拒绝） 的相关文章

随机推荐

热门标签

即使以管理员身份运行，在 Windows 上运行 Spark 也会出现错误 5（访问被拒绝）的相关文章