解决A master URL must be set in your configuration

2023-10-27

win7 + idea + spark
对应pmo文件如下：

<properties>
        <spark.version>2.0.2</spark.version>
        <scala.version>2.11</scala.version>
    </properties>

    <dependencies>
        <!--<dependency>-->
            <!--<groupId>org.scala-lang</groupId>-->
            <!--<artifactId>scala-library</artifactId>-->
            <!--<version>2.11.8</version>-->
        <!--</dependency>-->
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-core_${scala.version}</artifactId>
            <version>${spark.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-streaming_${scala.version}</artifactId>
            <version>${spark.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-sql_${scala.version}</artifactId>
            <version>${spark.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-hive_${scala.version}</artifactId>
            <version>${spark.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-mllib_${scala.version}</artifactId>
            <version>${spark.version}</version>
        </dependency>
    </dependencies>

    <build>
        <plugins>
            <plugin>
                <groupId>org.scala-tools</groupId>
                <artifactId>maven-scala-plugin</artifactId>
                <version>2.15.2</version>
                <executions>
                    <execution>
                        <id>scala-compile-first</id>
                        <goals>
                            <goal>compile</goal>
                        </goals>
                        <configuration>
                            <includes>
                                <include>**/*.scala</include>
                            </includes>
                        </configuration>
                    </execution>
                    <execution>
                        <id>scala-test-compile</id>
                        <goals>
                            <goal>testCompile</goal>
                        </goals>
                    </execution>
                </executions>
            </plugin>
        </plugins>
    </build>

运行wordcount的例子时，报错：A master URL must be set in your configuration

object WordCount {
  def main(args: Array[String])
  {
    val conf = new SparkConf().setAppName("wordCount")
    val sc = new SparkContext(conf)
    val rdd = sc.textFile(args(0))
    val wordcount = rdd.flatMap(_.split(" ")).map(x => (x, 1)).reduceByKey(_ + _)
    val wordsort = wordcount.map(x => (x._2, x._1)).sortByKey(false).map(x => (x._2, x._1))
    wordsort.saveAsTextFile(args(1))
    sc.stop()
  }
}

解决办法：在VM OPTION里添加：“-Dspark.master=local”解决了：运行结果如下：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

spark

解决A master URL must be set in your configuration 的相关文章

分类算法之朴素贝叶斯

1 朴素贝叶斯分类算法朴素贝叶斯 Naive Bayes NB 算法是基于贝叶斯定理与特征条件独立假设的分类方法该算法是有监督的学习算法解决的是分类问题是将一个未知样本分到几个预先已知类别的过程朴素贝叶斯的思想就是根据某些个先验概
11.Linux下Spark的安装配置以及spark-shell的启动和 Spark集群环境搭建

本案例软件包链接 https pan baidu com s 1zABhjj2umontXe2CYBW DQ 提取码 1123 若链接失效在下面评论我会及时更新目录 1 安装Spark 1 先用xftp将安装包传到home hadoo
spark-shell 加载本地文件报错 java.io.FileNotFoundException

学习spark shell 时候发现一个问题从本地文件加载数据生成RDD 报错文件找不到原因 spark shell 如果启动了集群模式真正负责计算的executor会在该executor所在的 worker节点上读取文件并不是
Spark课程设计——电影推荐系统

题目所需数据集及相应信息描述数据集 1 用户评分数据集ratings dat 包含了大量用户的历史评分数据 2 样本评分数据集personalRatings dat 包含了少数几个用户的个性化评分数据这些数据反映了某个用户的个性化观影喜
Spark中的基本概念

Spark中的基本概念 1 基本概念 1 1 RDD 弹性分布式数据集 1 2 DAG 有向无环图 1 3 Partition 数据分区 1 4 NarrowDependency 窄依赖 1 5 ShuffleDependency 宽依赖
【Spark系列2】reduceByKey和groupByKey区别与用法

在spark中我们知道一切的操作都是基于RDD的在使用中 RDD有一种非常特殊也是非常实用的format pair RDD 即RDD的每一行是 key value 的格式这种格式很像Python的字典类型便于针对key进行一些处理
广电用户画像分析之根据用户行为数据进行筛选与标签添加

在数据处理和分析领域我们经常需要根据用户的行为数据进行筛选和标签添加以便更好地理解用户行为和偏好在本篇博客中我们将介绍两个示例展示如何根据用户的收视行为数据和订单信息进行数据处理和分析前情提要数据集分析广电用户画像分析之探索
浅谈Hadoop体系和MPP体系

浅谈Hadoop体系和MPP体系引言如题在大数据发展至今为了应对日益繁多的数据分析处理和解决客户各种奇思妙怪想需求形形色色的大数据处理的框架和对应的数据存储手段层出不穷有老当益壮的Hadoop体系依靠Hadoop巨大的社
基于Spark的电商用户行为实时分析可视化系统（Flask-SocketIO）

基于Spark的电商用户行为实时分析可视化系统 Flask SocketIO 项目简介该项目已上线蓝桥课程有需要的可凭邀请码 UB5mdLbl 学习哦有优惠课程地址 https www lanqiao cn courses 2629
记一次Spark打包错误：object java.lang.Object in compiler mirror

使用maven compile和package 一直报错scala reflect internal MissingRequirementError object scala runtime in compiler mirror not f
Spark大数据分析与实战笔记（第一章 Scala语言基础-3）

文章目录 1 3 Scala的数据结构 1 3 1 数组数组的遍历数组转换 1 3 2 元组创建元组获取元组中的值拉链操作 1 3 3 集合 List Set Map 1 3 Scala的数据结构对于每一门编程语言来说数组 A
spark-submit 报错 Initial job has not accepted any resources

spark submit 报这样的错误 WARN scheduler TaskSchedulerImpl Initial job has not accepted any resources check your cluster UI to
Spark 从入门到放弃（一）Spark基础概念

一 Spark基础概念 1 Application Spark应用程序 application 应用其实就是用spark submit提交的程序一个application通常包含三部分从数据源比方说HDFS 取数据形成RDD 通过R
学习笔记-Spark环境搭建与使用

一 20 04 Ubuntu安装清华源ISO源 https mirrors tuna tsinghua edu cn ubuntu releases 20 04 下载链接 https mirrors tuna tsinghua edu c
使用Flink1.16.0的SQLGateway迁移Hive SQL任务

使用Flink的SQL Gateway迁移Hive SQL任务前言我们有数万个离线任务主要还是默认的DataPhin调度CDP集群的Hive On Tez这种低成本任务当然也有PySpark 打Jar包的Spark和打Jar包的Fl
11.Linux下Spark的安装配置以及spark-shell的启动和 Spark集群环境搭建

本案例软件包链接 https pan baidu com s 1zABhjj2umontXe2CYBW DQ 提取码 1123 若链接失效在下面评论我会及时更新目录 1 安装Spark 1 先用xftp将安装包传到home hadoo
sparkstreamming 消费kafka(1)

pom
Spark常用参数解释

Spark的默认配置文件位于堡垒机上的这个位置 SPARK CONF DIR spark defaults conf 用户可以自行查看和理解需要注意的是默认值优先级最低用户如果提交任务时或者代码里明确指定配置则以用户配置为先用户再
Spark Sql之dropDuplicates去重

文章目录算子介绍示例问题解决 dropDuplicates和distinct 参考算子介绍 dropDuplicates去重原则按数据行的顺序保留每行数据出现的第一条 dropDuplicates 在Spark源码里面提供了以下
JAVA 安装与简单使用

JAVA简易安装下载安装环境变量进入变量界面设置变量验证JAVA环境运行Java程序个人站 ghzzz cn 还在备案很快就能访问了下载安装第一步当然是从官网下载安装java了网上有很多的教程这里简单的写一下在这里

随机推荐

【Git笔记】添加暂存区与提交本地库

本文以提交 hello txt 为例在开始之前普及一个快捷方式在 Linux 中文本复制为 esc gt yy 粘贴为 d 查看本地库状态 git status 当文本只停留在工作区时本地状态如下添加暂存区 git add hel
Naviact无法连接到MySQL数据库

无法连接到MySQL数据库省流版服务器没有开MySQL的端口之所以还要写一篇文章是因为开端口只需要一分钟而根据各种现象与线索推断出没有开端口则需要三个小时问题背景在服务器上安装了Linux虚拟机然后在虚拟机上安装MySQL
文本分类之模型初探

这里写自定义目录标题简说回归模型逻辑回归模型介绍逻辑回归模型应用简说回归模型回归模型是对统计关系进行定量描述的数学模型研究的是因变量和自变量之间的关系研究回归模型要用到回归方法常见的回归方法有线性回归逻辑回归多项式回归等
C语言编写一个简单的选择题答题系统

上个星期我们老师给我们布置了一道非常变态的作业题开始一看只有一道题欣喜若狂以为老师终于大发慈悲了一回结果点开一看长这样顿时就傻了眼对于一个刚接触C语言一两个月的小白来说不能说不会做只能说看不懂哭笑哭笑但是经过几天的
html，css初学

安装VSCODE 插件 live server html support html 然后为了更好地理解请逐步输入并及时查看效果 div class box h1 非顶级程序员 h1 h2 hhh h2 img src tes div
Git/Ctags/Vim/GDB基础笔记

gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt gt Git基础知识 gt gt gt gt gt gt gt gt gt gt g
linux rootfs.img的制作

cramfs是只读压缩的文件系统文件系统类型可以是ext2 ext3 什么的 cramfs和romfs只是一个文件系统类型 ramdisk相当于一块硬盘空间可以理解为在内存中虚拟出一块硬盘来所以它上面就可以有你linux支持的各种文件
Linux内核笔记005 - 越界访问内存，Linux内核处理过程

本文转自网络文章内容均为非盈利版权归原作者所有转载此文章仅为个人收藏分享知识如有侵权马上删除原文作者 jmpcall 专栏地址 https zhuanlan kanxue com user 815036 htm 1 几个重要的
期货开户市场有多种赚钱方法

你永远都不会成为市场专家但这没关系许多人认为为了在市场上赚钱需要成为市场专家但是市场太复杂了在任何给定时间点都有太多因素在起作用没有人可以跟踪所有信息并成功交易没有人可以成为市场专家就是为什么当你问任何长期从事该行业的经验
Csharp:asp.net CheckBoxList databind
python -- 图像识别练习

usr bin env python from PIL import Image import pytesseract url img denggao jpeg image Image open url image image conver
PHP实现生成小程序二维码带参数进入指定页面

1 需求场景 1 小程序一定要是发布的小程序 2 记得把业务域名加上场景需要在网页上生成小程序的二维码图片微信扫码之后带参数进入指定的小程序页面小程序在扫描二维码跳转的指定页面中在onload里面接收参数注意scene是后台返回
自动获取当前编号的下一个编号

public class NOHelper
按钮颜色

弹出颜色选择框 QColor color QColorDialog getColor Qt white this QPalette pal ui gt pushButton BackGroundColor gt palette pal se
eclipse project和high_tec文件夹下删除不掉文件夹或者文件的解决的方法

在项目列表的空白处右击 refresh 删除空文件夹解决不知道为什么他们要说在项目上右击卡了我一上午
深度解剖数据在队列的应用

gt 作者简介旧言目前大一现在学习Java c c Python等 gt 座右铭松树千年终是朽槿花一日自为荣 gt 望小伙伴们点赞收藏加关注哟前言前面我们已经学习了顺序表和链表他们无法控制数据的打印而队列只允许在一端进
关于QQ的相关代码收集整理

下面个我个人整理的一些实用的QQ聊天代码包括手机端和电脑端的希望不用每次都重新去找跳转到手机QQ并开始聊天安卓代码 String url mqqwpa im chat chat type wpa uin 458237282 star
如何写入 CSV文件

如何写入 CSV文件 import csv 1 打开文件 as 称它为变量xxx 若不存在该文件则创建 with open newcsv csv w encoding utf 8 as newfile 存储 csv 读取的文件writ
Python pandas的DataFrame获取行数、列数、索引、元素值，及添加和删除行列

一获取行数列数 gt gt gt df pd DataFrame np arange 12 reshape 3 4 index row1 row2 row3 columns col1 col2 col3 col4 gt gt gt gt
解决A master URL must be set in your configuration

win7 idea spark 对应pmo文件如下

解决A master URL must be set in your configuration

解决A master URL must be set in your configuration 的相关文章

随机推荐

热门标签