windows搭建pyspark环境详细教程

2023-11-14

一.安装jdk及配置环境变量:
下载地址：
https://www.oracle.com/java/technologies/downloads/#java8-windows
安装步骤：
在这里插入图片描述
下载后点击安装，中途可以自定义安装路径，最后查看安装路径：

开始配置系统环境变量：

在系统变量中新建：
变量名： JAVA_HOME
变量值：D:\jdk 也就是jdk的安装路径
确认后，打开cmd,输入java version,出现如下界面：
在这里插入图片描述
说明java系统环境变量已配好。

二.安装spark及配置环境变量:
下载地址：
https://archive.apache.org/dist/spark/
点击想安装的版本（我安装的是spark-3.0.0）：
在这里插入图片描述
将压缩包放在喜欢的位置进行解压：

开始配置spark的系统环境变量：
在这里插入图片描述
在系统变量中新建：
变量名：SPARK_HOME
变量值：D:\spark-3.0.0-bin-hadoop2.7

三.安装hadoop及配置环境变量:
下载地址：
https://archive.apache.org/dist/hadoop/common/
选择与spark对应的版本：
在这里插入图片描述
点击之后进行下载：

解压到喜欢的位置：

此时bin目录（D:\hadoop-2.7.1\bin）下可能没有hadoop.dll及winutils.exe文件，
需要进行下载：
hadoop.dll：
https://github.com/steveloughran/winutils/blob/master/hadoop-2.7.1/bin/hadoop.dll
在这里插入图片描述
点击下载

winutils.exe：
https://github.com/steveloughran/winutils/blob/master/hadoop-2.7.1/bin/winutils.exe
下载方式同上

将hadoop.dll和winutils.exe均拷贝到D:\hadoop-2.7.1\bin下和C:\Windows\System32下（两个文件各拷贝一份）
在这里插入图片描述

开始配置hadoop的系统环境变量：
在这里插入图片描述
新建系统变量：
变量名：HADOOP_HOME
变量值：D:\hadoop-2.7.1
在cmd输入hadoop version,出现如下界面：

说明hadoop环境变量配置成功；
接着输入spark-shell,出现如下界面：

说明spark系统环境变量配置成功；
接下来安装py4j,在cmd中输入pip install py4j
安装成功后接着输入pip install pyspark,安装好后出现如下界面：
在这里插入图片描述
最后输入pyspark,出现如下界面：

再来pycharm看引用的pyspark代码，已经可以正常使用了：

至此，windows（win7）安装pyspark(3.0.0及以上版本)成功

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

windows搭建pyspark环境详细教程的相关文章

如何在 PowerShell 中比较本地文件与 FTP 服务器上的文件的年龄并下载远程复制是否较新

我正在编写一个 PowerShell 脚本以帮助我为工作设置新电脑希望这不仅仅是我一个人会使用所以我正在尝试考虑所有事情我在 FTP 服务器上保存了离线安装程序 java flash reader 等如果本地副本尚未保存在创建的
Windows 版 GitKraken 中的文件名太长

正如建议的Q22575737 https stackoverflow com a 22575737 6623589 我已经更新了我的注册表并设置了git config system core longpaths true在处理长路径时问题
如何使用 Python 与窗口的 GUI 交互？

假设您想打开myapp exe 打开第三个菜单然后选择第二个菜单项即像用户使用键盘或鼠标一样然后在对话框窗口中选择第二个按钮 pyahk https pyahk readthedocs io en latest and pyautog
Node.js + Socket.io + Windows 7 / 8？

我一直在到处寻找但似乎找不到解决方案是否可以在 Windows 7 上的 Node js 上安装 Socket io 如果没有是否有某种替代方案或者您知道未来有任何 Windows 支持吗通常使用 Node js 包管理器但是我
在 C# 中使用反射列出枚举中的值

我正在尝试使用反射来列出一个 Visual Studio 解决方案内的各个项目中的一些类的公共成员和方法我尝试访问的所有类都是 C 的并且它们都是从 C 类访问的我用来进行这些调用的代码如下 public void PopulateE
在 wampserver 2.2 上安装 php_imagick.dll PHP 扩展

我使用的是 32 位操作系统的 Windows 7 我安装了 ImageMagick 6 8 7 Q16Link https www imagemagick org script download php windows我能够从命令行转换
dia2dump：CoCreateInstance 失败 - HRESULT = 80040154

我正在尝试使用 Visual Studio 2017 及其在 Windows 7 x64 上转储 PDB 的签名dia2dump https msdn microsoft com en us library b5ke49f5 aspx 我加
Pip 无法在 Windows 上安装 Twisted

我正在尝试在 Windows 8 计算机上安装 Twisted 在 Twisted 官方网站上只有一个 Windows 版的 Wheel 文件 https twistedmatrix com trac wiki Downloads htt
PostgreSql“运行安装后步骤...数据库集群初始化失败”

我是一名 Windows 用户我花了几个小时不断地安装和卸载然后才使其正常工作前 10 次左右才看到标题中的错误消息我将其作为一个自我回答的问题放在这里以防止其他人在安装时可能遇到同样的问题并为像我这样第一次使用 Postgre
如何使用 python 在 Windows 中禁用/启用特定 USB 端口？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我想在图形窗口中创建一个切换开关可以使用 python 禁用启用 Windows 中的特定 USB 端口我可以使用哪个外部命令或
开发者可以在 Windows 应用程序中使用 iCloud 吗？

开发人员可以使用 Apple 的 iCloud API 在 Mac OS X 和 iOS 上的不同版本的应用程序之间同步应用程序数据如果开发人员拥有 Windows 版本的应用程序该版本是否也可以使用 iCloud 将应用程序数据与 M
批处理脚本 FOR 循环仅设置输出的第一个字母 wsl --list -q

我正在编写一个批处理脚本将文件从 Windows 目录复制到 WSL 发行版其中一部分是选择将文件复制到哪个发行版如果我使用命令wsl list q如果给我以下输出 Ubuntu 22 04 Ubuntu 18 04 我正在尝试使用此
VB - 以隐式方式链接 DLL

我正在开发 VB6 图形界面并且需要隐式链接到 DLL 这样做的动机来自于我上一个问题 https stackoverflow com questions 5194573 有问题的 DLL 使用静态 TLS declspec thread
如何设置任务在使用 vbs 登录时以当前用户身份运行而无需管理员权限？

从命令行我可以创建一个在登录时运行的计划任务无需管理员权限或用户输入密码来设置任务但是我必须使用 xml 文件来执行此操作下面是一个示例 xml 其中 Domain User 部分必须在运行时替换为当前用户的域和名称
导致崩溃转储的 Java 错误的解决方法

我开发的一个程序偶尔会由于这个错误而导致 JVM 崩溃 http bugs java com bugdatabase view bug do bug id 8029516 http bugs java com bugdatabase vie
如何在 Ubuntu VirtualBox 中运行 Meteor 应用程序并使用 Windows 主机上的编辑器进行编辑？

我希望在运行 Ubuntu 的 virtualbox 来宾中运行一个用于开发目的的流星服务器该项目将位于主机上的一个文件夹内该文件夹将共享给来宾该文件夹本身位于 Dropbox 文件夹内这样我可以在多个虚拟机和工作站之间共享开发但
Windows批处理文件：将结构转换为单行字符串

我需要将这个艰巨的任务作为批处理文件来完成这对于 C 来说不是最困难的但在 DOS 中是一个地狱至少对我来说我需要将结构转换为单个 var 字符串才能在我的程序中再次将它们转换为该结构别担心回归一切都已经完成了该结构的大小会
使用 sed 更新 xml 属性（Windows + cygwin 和 Linux）？

我需要使用 sed 命令对 xml 文件进行更新但我在这方面遇到了麻烦它需要在 Windows 使用 cygwin 和 Linux 上运行 XML 具有以下元素
Node.js 升级在 Windows 中仍然显示旧版本

我已使用 msi 安装程序下载并安装了新版本的 nodejs 4 1 2 之后我跑了node v 但它仍然显示旧版本 0 12 2 我尝试重新启动Windows 甚至卸载nodejs并重新安装它但仍然显示相同的内容为什么会发生这种情况
如何在 Windows 命令行中使用参数运行 Python 脚本

这是我的蟒蛇hello py script def hello a b print hello and that s your sum sum a b print sum import sys if name main hello sys

随机推荐

2022 PostgreSQL 数据库生态大会：拓数派资深工程师王淏舟将发表主题演讲

由中国开源软件推进联盟PostgreSQL分会中科院软件所 CSDN联合举办的中国PostgreSQL数据库生态大会将于2月17 19日召开本届大会以协同共进为主题邀请专家学者厂商和用户代表就PostgreSQL在行业和区
Vue3开发教程（一、学习Vue前需要了解的内容)

前言本文是笔者学习vue前端技术过程的总结其中包括vue开发需要了解的相关技术如 node ES6 TypeScript vite ElementUI 以vue作为主线来介绍相关技术最后通过一个典型的前端应用来体会vue的开发希望笔
最长子序列 JAVA 2019国赛试题F

试题 F 最长子序列时间限制 1 0s 内存限制 512 0MB 本题总分 15 分问题描述我们称一个字符串 S 包含字符串 T 是指 T 是 S 的一个子序列即可以从字符串 S 中抽出若干个字符它们按原来的顺序组合成一个新的字
[SQL]yyyymmdd类型与yyyy-mm-dd日期类型的相互转换

法1 from unixtime unix timestamp 20171205转成2017 12 05 select from unixtime unix timestamp 20171205 yyyymmdd yyyy mm dd fr
树结构，二叉树，hash树

目录 1 树的概念 2 二叉树基本操作 3 hash树 1 树的概念 1 树的特性 1 一棵树中的任意两个结点有且仅有唯一的一条路径连通 2 一棵树如果有n个结点则它一定有n 1条边 3 在一棵树中加一条边将会构成一个回路 2 二叉树 1
hibernate注解反向生成表结构

直接上源码 package com gxy pojo model import java util Date import javax persistence Column import javax persistence Entity i
EVE部署

EVE NG 镜像导入 IOL 镜像位置 opt unetlab addons iol bin qemu 镜像位置 opt unetlab addons qemu 设备图标位置 opt unetlab html images icons E
Mac :谷歌浏览器 NET::ERR_CERT_INVALID 此证书已被撤消。网络错误和攻击行为通常是暂时的，因此，此网页稍后可能会恢复正常

1 美图 2 背景今天突然访问一个https 1x 5x x xx 网站然后无法访问谷歌浏览器访问地址报错如下 XXX 通常会使用加密技术来保护您的信息 Google Chrome 此次尝试连接到 XXX 时此网站发回了异常的错误凭
安卓使用SQLite数据库

目录理论 SQLite构成 SQLite的整体结构图 SQLite数据类型创建安卓应用基于Empty Activity模板创建安卓应用CreateDeleteDB 将背景图片拷贝到drawable目录打开字符串资源文件 string
利用DSP实现ADC采集数据以及DAC输出

1 解决方案必要的公式文字等在课外实验中我们选择利用ADC对输入的信号进行采集然后利用串口控制DAC的输出实现通过串口控制DAC输出采集到的波形的功能在本实验中是通过判断串口发送的数据来实现对相应DAC的控制的为了方便我
有些运行符不能重载为友元函数，它们是：=,(),[]和-＞。

原因有人说是因为 C 规定赋值运算符只能重载为类的非静态成员函数而不可以重载为类的友元函数不能重载为类的静态成员应该比较容易理解因为静态成员函数是属于整个类的不是属于某个对象的它只能去操作类静态数据成员而赋值运算符是基于对
Calendar类获取月份时月份加一而星期数减一

Java中Calendar MONTH返回的数值其实是当前月距离第一个月有多少个月份的数值 JANUARY在Java中返回 0 所以我们需要 1 Java 中Calendar DAY OF WEEK中返回的是一周中的第几天所以他会受到第
Windows Cluster 投票权问题

在日常运维中如果你的 Windows Cluster 需要升级重启意外宕机网络中断等你知道该怎么操作才能保证集群的可用性吗按什么样的顺序怎样关闭或启动集群节点吗怎么快速恢复你的集群呢接下来我们就以实践操作来解决这几个疑问
StableDiffusion中LORA模型的使用

目录前言一 LoRA是什么二使用方法 1 存放LORA模型 2 使用LORA模型 3 查看结果总结前言 1 Sampler 采样方式在Stable Diffusion WebUI中的Sampling method中进行选择 2
如何成为一个优秀的JAVA程序员如何成为高级JAVA程序员细节决定一个程序员的成败

给一个刚出社会的程序员新生一个建议想成为一个优秀的程序员高级程序员不能眼高手低不能认为开发新项目技术研发才学到东西不能看不起维护系统不要以为自己懂的技术越多自认为自己很牛叉假如你忽略了一个问题那么你永远成为不了优秀的程序员
带编码器的直流减速电机——基于STM32F407

首先什么是编码器编码器是将信号或数据进行编制转换为可用以通讯传输和存储的信号形式的设备在这里编码器就是能够将电机的转动信息比如转速转动角度等转换为脉冲信号的设备按照原理可分为常见的光电编码器光学式和霍尔编码器磁
Java 表格文字垂直居中_Java 设置Excel单元格对齐方式、文本旋转、换行、缩进

本文介绍通过Java来设置Excel单元格对齐方式水平对齐垂直对齐文本旋转方式顺逆时针方向旋转文本换行和文本缩进等内容文中代码示例使用了工具Free Spire XLS for Java 免费版可从官网下载jar包并解压将
为什么打不开_花瓣网打不开怎么回事花瓣网是什么网站为什么打不开怎么处理...

海峡网今日 2月18日花瓣网打不开又上热搜了花瓣网是一个帮你收集发现网络上你喜欢的事物的网站花瓣网主要是为用户提供一个简单的采集工具帮助用户将自己喜欢图片重新组织和收藏但是在2019年1月16日的时候花瓣网宣布暂停网站访
python连接mongodb进行查询_MongoDB聚合查询及Python连接MongoDB操作

今日内容概要聚合查询 Python操作MongoDB 第三方可视化视图工具今日内容详细聚合查询 Python操作MongoDB 数据准备 from pymongo import MongoClient 载入pymongo模块 impo
windows搭建pyspark环境详细教程

一安装jdk及配置环境变量下载地址 https www oracle com java technologies downloads java8 windows 安装步骤下载后点击安装中途可以自定义安装路径最后查看安装路径开始配

windows搭建pyspark环境详细教程

windows搭建pyspark环境详细教程 的相关文章

随机推荐

热门标签

windows搭建pyspark环境详细教程的相关文章