在windows和pycharm中设置SPARK-HOME路径变量

2023-12-07

我是 SPARK 的新手,并尝试在 Windows 中使用它。我能够使用 hadoop 的预构建版本成功下载并安装 Spark 1.4.1。在以下目录中:

/my/spark/directory/bin

我可以运行 Spark-shell 和 pyspark.cmd,一切正常。我正在处理的唯一问题是我想在 Pycharm 中编码时导入 pyspark。现在我正在使用以下代码来使事情正常进行:

import sys
import os
from operator import add

os.environ['SPARK_HOME'] = "C:\spark-1.4.1-bin-hadoop2.6"
sys.path.append("C:\spark-1.4.1-bin-hadoop2.6/python")
sys.path.append("C:\spark-1.4.1-bin-hadoop2.6/python/build")

try:
    from pyspark import SparkContext
    from pyspark import SparkConf

except ImportError as e:
    print ("Error importing Spark Modules", e)
    sys.exit(1)

我想知道是否有更简单的方法可以做到这一点。我使用的是 Windows 8 - Python 3.4 和 Spark 1.4.1


这就是关于我发现的最简单的方法。我通常使用如下所示的函数来减少重复性。

def configure_spark(spark_home=None, pyspark_python=None):
    spark_home = spark_home or "/path/to/default/spark/home"
    os.environ['SPARK_HOME'] = spark_home

    # Add the PySpark directories to the Python path:
    sys.path.insert(1, os.path.join(spark_home, 'python'))
    sys.path.insert(1, os.path.join(spark_home, 'python', 'pyspark'))
    sys.path.insert(1, os.path.join(spark_home, 'python', 'build'))

    # If PySpark isn't specified, use currently running Python binary:
    pyspark_python = pyspark_python or sys.executable
    os.environ['PYSPARK_PYTHON'] = pyspark_python

然后,您可以在导入 pyspark 之前调用该函数:

configure_spark('/path/to/spark/home')
from pyspark import SparkContext
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在windows和pycharm中设置SPARK-HOME路径变量 的相关文章

随机推荐

  • 我如何“验证”轨道上的破坏

    在销毁静态资源时 我想在允许销毁操作继续之前保证一些事情 基本上 如果我注意到这样做会使数据库处于无效状态 我希望能够停止销毁操作 销毁操作没有验证回调 那么如何 验证 是否应该接受销毁操作呢 您可以引发一个异常 然后捕获该异常 Rails
  • 解决 Eclipse 的“在服务器上运行”部署问题

    我正在接管现有的基于 Struts 的 Web 应用程序 并尝试首次将其部署在我的本地计算机上 我的前任告诉我在 Tomcat 服务器上通过 Eclipse 运行它 我已经安装了最新的tomcat并且运行良好 我从他们的 CVS 服务器上获
  • Javascript:从cookie中读取会话ID

    对于 websocket 我必须从 cookie 中公开我的 sessionid 我搜索了一下 发现我应该能够通过以下方式访问 cookie console log document cookie 不幸的是 这不起作用 或者更好的是 doc
  • LINQ 忽略重音和大小写

    使用 LINQ 通过以下方式过滤元素的最简单方法是什么Where方法忽略重音和大小写 到目前为止 我已经能够通过调用属性上的方法来忽略大小写 我认为这不是一个好主意 因为它为每个元素调用相同的方法 对吗 这是我到目前为止得到的 var re
  • 需要有关简单 MySQL 数据库设计的技巧

    我正在尝试使用 MySQL 为游戏制作一个简单的项目数据库 这是我的 3 张桌子的样子 items itemId itemName 0001 chest piece 0002 sword 0003 helmet attributes att
  • 如何生成常规 Excel 公式作为查询结果?

    我有一个大型且复杂的 Excel 查询 它可以按预期工作 但是 我正在实现一些实时数据验证功能 即不需要数据刷新 并且我需要在查询结果的一列中包含常规 Excel 公式 该公式将使用工作簿中的其他工作表执行实时数据比较 有意独立于查询本身
  • 在 AngularJS 服务之间共享数据

    有没有办法在 AngularJS 的服务之间共享数据 用例 来自不同服务的数据聚合例如 我想要一个从 REST 服务加载一些数据的 service1 然后 另一个 service2 将来自另一个 REST API 的附加数据添加到 serv
  • 如何在 apache htaccess 中为 angularjs 应用程序重写 url

    我使用的htaccess如下 RewriteBase RewriteEngine on RewriteCond REQUEST FILENAME s OR RewriteCond REQUEST FILENAME l OR RewriteC
  • iOS 中是否支持本机 JSON?

    iOS SDK 中是否有一个类可以从服务器解析 JSON 类似于 XML 的 NSXML 和扩展的 RSS 从 iOS5 开始 原生支持 JSON 无需第三方框架 这是由NSJSONSerialization 类
  • 如何在uwp平台中将图像转换为字节数组

    我需要将图像转换为字节数组以将其存储在数据库中 我还需要将该数组转换回图像 我做了谷歌研究 但找不到解决方案 因为UWP平台有些api不可用 我从这些文章中找到了解决方案外乡人 says 要将图像转换为 byte 我将使用存储文件的 Ope
  • 使用Python抓取动态内容

    我想使用 Python 来抓取网页上 您在寻找这些作者吗 框的内容 如下所示 http academic research microsoft com Search query lander 不幸的是 盒子的内容是由 JavaScript
  • Chrome打包应用程序-从Webview下载文件

    我正在努力让现有的 Ajax 风格的 Web 应用程序作为 Chrome 打包应用程序运行 Ajax 应用程序在打包应用程序内的 Web 视图中运行 并且大部分运行良好 Ajax 应用程序允许用户使用标准 HTML 5 上传和拖 放来上传文
  • 在 PHP5 中创建 Singleton 设计模式

    如何使用 PHP5 类创建 Singleton 类 Singleton class final class UserFactory private static inst null Prevent cloning and de serial
  • 固定div的CSS水平居中?

    menu position fixed width 800px background rgb 255 255 255 The Fallback background rgba 255 255 255 0 8 margin top 30px
  • 安卓中的动画?

    我是 android 新手 我需要了解 Android 中视图和视图组的基本动画 任何人都可以提供一些指导线来学习它 提前致谢 您可以先阅读官方指南到动画
  • JAIN API 和 JAIN SLEE API 之间的区别

    我正在阅读有关 SIP 的内容 发现有一个 java API JAIN SIP 可以开发基于 SIP 的应用程序 然后我还发现有JAIN SLEE和SIP servlet 我相信 JSLEE 和 SIP Servlet 是分别部署基于 JA
  • SQL Server 一轮又一轮的划分

    在存储过程中我有一个像这样的表达式 select some val in percents total val 100 some val 如果我使用Round像这样的函数 select some val in percents Round
  • 新手:在函数调用上挂起浏览器

    我刚刚开始学习 JavaScript 想知道为什么当我单击 调用函数 按钮时这个简单的代码片段会挂起 我缺少什么
  • 从 MATLAB 运行多进程应用程序

    我用 VC 编写了一个多进程应用程序 并尝试使用命令行参数执行它system来自 MATLAB 的命令 它可以运行 但只能在一个核心上运行 有什么建议吗 Update 事实上 它甚至没有看到第二个核心 我使用了 OpenMP 并使用了omp
  • 在windows和pycharm中设置SPARK-HOME路径变量

    我是 SPARK 的新手 并尝试在 Windows 中使用它 我能够使用 hadoop 的预构建版本成功下载并安装 Spark 1 4 1 在以下目录中 my spark directory bin 我可以运行 Spark shell 和