Spark 作业中的 Scala 成员字段可见性

2023-11-29

我有一个 Scala 类，我定义如下：

import org.apache.spark.{SparkConf, SparkContext}

object TestObject extends App{
  val FAMILY = "data".toUpperCase

  override def main(args: Array[String]) {
    val sc = new SparkContext(new SparkConf())

    sc.parallelize(1 to 10)
      .map(getData)
      .saveAsTextFile("my_output")
  }

  def getData(i: Int) = {
    ( i, FAMILY, "data".toUpperCase )
  }
}

我将其提交到 YARN 集群，如下所示：

HADOOP_CONF_DIR=/etc/hadoop/conf spark-submit \
    --conf spark.hadoop.validateOutputSpecs=false \
    --conf spark.yarn.jar=hdfs:/apps/local/spark-assembly-1.2.1-hadoop2.4.0.jar \
    --deploy-mode=cluster \
    --master=yarn \
    --class=TestObject \
    target/scala-2.11/myjar-assembly-1.1.jar

出乎意料的是，输出如下所示，表明getData方法看不到的值FAMILY:

(1,null,DATA)
(2,null,DATA)
(3,null,DATA)
(4,null,DATA)
(5,null,DATA)
(6,null,DATA)
(7,null,DATA)
(8,null,DATA)
(9,null,DATA)
(10,null,DATA)

我需要了解什么，关于字段、范围、可见性、spark 提交、对象和单例等等，才能理解为什么会发生这种情况？如果我基本上想要定义为对可见的“常量”的变量，我应该做什么呢？getData method?

我可能会遗漏一些东西，但我认为你不应该定义main方法。当你延长App, 你继承了一个main，并且您不应该覆盖它，因为这实际上是调用您的代码中的代码App.

例如，您答案中的简单类应该写成

object TestObject extends App {
  val FAMILY = "data"
  println(FAMILY, "data")
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scala

initialization

apachespark

visibility

Spark 作业中的 Scala 成员字段可见性的相关文章

确定视图是否在屏幕上 - Android

我对这个有点困惑首先也是最重要的是以下链接很有用但是我提出了一些可见性问题链接检查视图可见性 https stackoverflow com questions 4628800 android how to check if a
Akka-Http 2.4.9 抛出 java.lang.NoClassDefFoundError: akka/actor/ActorRefFactory 异常

我正在尝试使用 Akka http 构建一个简单的 Web 服务我遵循了这个指南 http doc akka io docs akka 2 4 9 scala http low level server side api html htt
Spark scala 模拟 Spark.implicits 用于单元测试

当尝试使用 Spark 和 Scala 简化单元测试时我使用 scala test 和mockito scala 以及mockito Sugar 这只是让你做这样的事情 val sparkSessionMock mock SparkSes
如何使用scala获取elasticsearch中_delete_by_query api的状态

我正在 scala 中向 elasticsearch 发送 HTTP post Http s http elkIp 5051 indexName delete by query postData s query terms zip id k
Scala 案例类忽略 Spark shell 中的导入

我希望这个问题有一个明显的答案我刚刚升级到 Spark v2 0 并且遇到了一个奇怪的问题火花外壳 Scala 2 11 版本如果我输入以下最小的 Scala import java sql Timestamp case class C
如何初始化一个最初大小未知的数组？

假设我有这个 int x int x State Determined By Program const char pArray const int x 在使用 pArray 之前如何初始化它因为Array的初始大小是由用户输入决定的 T
Scala：类型参数中的问号

我试图理解以下代码来自 Scalaz 库 def kleisliIdApplicative R Applicative Kleisli Id R 我假设一种形式T P0 是一个带有参数的类型构造函数但是我无法找到解释类型参数中问号用法的
如何关闭 Scala 中因方法重载而导致代码无法编译的特定隐式？

我正忙着尝试自己回答这个问题 Scala Play 2 4 x 通过 anorm MySQL 处理扩展字符到 Java Mail https stackoverflow com questions 31417718 scala play 2
pyspark 将 twitter json 流式传输到 DF

我正在从事集成工作spark streaming with twitter using pythonAPI 我看到的大多数示例或代码片段和博客是他们从Twitter JSON文件进行最终处理但根据我的用例我需要所有字段twitter J
如果两个阶段使用相同的 DataFrame，spark 是否会读取同一文件两次？

以下代码读取相同的 csv 两次即使只调用一个操作端到端可运行示例 import pandas as pd import numpy as np df1 pd DataFrame np arange 1 000 reshape 1 1
我可以在没有 Hadoop 的情况下使用 Spark 作为开发环境吗？

我对大数据和相关领域的概念非常陌生如果我犯了一些错误或拼写错误我很抱歉我想了解阿帕奇火花 http spark apache org 并使用它仅在我的电脑中在开发测试环境中由于Hadoop包含HDFS Hadoop分布式文件系统
HDFS：使用 Java / Scala API 移动多个文件

我需要使用 Java Scala 程序移动 HDFS 中对应于给定正则表达式的多个文件例如我必须移动所有名称为 xml从文件夹a到文件夹b 使用 shell 命令我可以使用以下命令 bin hdfs dfs mv a xml b 我可以
使用 apply 方法的泛型类型的 Scala 工厂？

假设我有以下特征它定义了一个接口并采用几个类型参数 trait Foo A B implementation details not important 我想使用伴随对象作为该特征的具体实现的工厂我还想强制用户使用Foo接口而不是子类所
InvalidRequestException（为什么：empid 如果包含 Equal，则不能被多个关系限制）

这是关于我从 Apache Spark 查询 Cassandra 时遇到的问题 Spark 的正常查询工作正常没有任何问题但是当我使用关键条件进行查询时出现以下错误最初我尝试查询复合键列族它也给出了与下面相同的问题由以下原因引
使用什么框架来引导我的第一个生产 scala 项目？

我正在第一次涉足 scala 的生产应用程序该应用程序当前打包为 war 文件我的计划是创建 scala 编译工件的 jar 文件并将其添加到 war 文件的 lib 文件夹中我的增强功能是通过 Jersey 公开的 mysql 支
在泛型方法中返回原始集合类型

假设我们想要创建一个像这样的函数minBy返回集合中同等极简主义的所有元素 def multiMinBy A B Ordering xs Traversable A f A gt B val minVal f xs minBy f xs f
Scala 为了在 JVM 上运行做出了哪些妥协？

Scala 是一种很棒的语言但我想知道如果它有自己的运行时如何改进 IE 由于 JVM 的选择做出了哪些设计选择我所知道的两个最重要的妥协是类型擦除 http java sun com docs books tutorial ja
Apache Spark 两个 RDD 之间的差异

假设我有这个示例作业在带有 Java API 的 Groovy 中 def set1 def set2 0 upto 10 set1 lt lt it 8 upto 20 set2 lt lt it def rdd1 context pa
Spark-1.6.1 上的 DMLC 的 XGBoost-4j

我正在尝试在 Spark 1 6 1 上使用 DMLC 的 XGBoost 实现我能够使用 XGBoost 训练我的数据但在预测方面面临困难我实际上想以在 Apache Spark mllib 库中完成的方式进行预测这有助于计算训练
Slick：将操作与 DBIOAction 的 Seq 组合起来

我有工作以下代码 val actions for lt slickUsers insertOrUpdate dbUser loginInfo lt loginInfoAction lt slickUserLoginInfos DBUse

随机推荐

std::unique_ptr 用于需要 free 的 C 函数

想想一个 C 函数它返回的东西必须是freed 例如 POSIX 的strdup 我想在 C 11 中使用该函数并避免任何泄漏的机会这是正确的方法吗 include
如何使用单个路由文件捕获所有网址

我想在 next js 中定义一条路由来捕获此网址 https mytestsite com mypath document this is to upload a document https mytestsite com mypath
有没有办法在不同的域上拥有圣所

我在域 A 上有 spa 在域 B 上有一个 Laravel 服务器我想使用 sainttum 但 cookie 只在同一个域中工作所以你建议有什么办法解决这个问题吗我不想在 sainttum 上使用基于令牌的 AUTH 是的您可以
Windows x64 的 44 位虚拟内存地址限制背后

http www alex ionescu com p 50 我读了上面的帖子作者以单链表为例解释了为什么Windows x64仅支持44位虚拟内存地址 struct 8 byte header ULONGLONG Depth 16 UL
使用两行标题进行表格排序

我的表结构如下这是我的 HTML table style width 700px thead tr th Location th th Full Name th th Amount th tr tr th Asset th th Patr
在 Woocommerce 中显示购物车运输总量值

我使用 woocommerce 为订购家具集装箱的批发客户提供服务通常是 40 英尺的集装箱体积为 68 立方米有没有办法可以在网站上的某个地方显示也许在标题区域有一个框显示篮子中产品的总立方米我需要在客户达到 68 立方米时向
swift 全局常量：不能使用另一个常量进行初始化

这是我正在尝试做的事情 class ViewController UIViewController let screenRect CGRect UIScreen mainScreen bounds let screenWidth scree
Android：无法启动 Activity ComponentInfo{/com.}：android.view.InflateException：二进制 XML 文件行错误膨胀类片段

我使用 Google Maps Android v1 API 创建了应用程序的第一个版本但现在当我发布第二个版本的应用程序时谷歌地图停止工作我认为这是因为它已被弃用所以现在我正在尝试创建示例 Android 应用程序以使用链接使用
是否可以在 Chrome 扩展中进行一些简单的网页抓取？

提前致谢如果这可能不是一个格式良好的问题我很抱歉我对 CS 和 stackoverflow 相对较新我希望制作一个简单的 chrome 扩展它覆盖新的标签页以显示从几个网站收集的一些简单数据我想知道是否可以在基本 JS 或 ch
C++原始字符串unicode文字

我可以简单地制作具有警报字符的原始字符串 a或统一码 u002f特点如果是那么转义是如何完成的如果不是那么原始字符串仅用于可打印字符吗我的理解对吗这是一个简单的问题但这个网站需要更多信息所以我只想说我读了大约 30 个关于
java中的classloader本身就是一个类，那么谁来加载classloader类呢？

Java中的ClassLoader是一个类用于在Java中加载类文件 java lang ClassLoader 是一个抽象类我的问题是这个 java lang ClassLoader 类与 JVM 的类加载器 1 引导类加载器 2 扩
为什么将类注释为@Service不创建bean？

我有这样的课程 Service userDetailsService public class MyUserDetailsService implements UserDetailsService 并尝试做
Passport.js 在 nginx 上表达 google oauth 502 错误网关

我正在尝试按照本指南使用 Passport js 为我的 Express js 应用程序实现一个简单的 Google OAuth 只需替换facebook with google https github com passport expr
如何在 Node.js 中创建自定义异步函数？

我不确定 Node js 如何能够实现哪些函数是异步的哪些不是以及如何创建自定义异步函数假设我想创建一个自定义异步函数如果仅仅因为我调用了异步函数回调或 cb 的最后一个参数它就会知道它是一个异步函数我会感到惊讶 functio
如何在 openshift 3 上使用 django 运行 celery

在我的 django pod 中启动 celerybeat 和工作进程的最简单方法是什么我正在将 Openshift v2 Django 应用程序迁移到 Openshift v3 我正在使用专业版订阅我真的是 Openshift v3
在android中更改活动会清除以前活动所需的内存吗？

我正在开发一个多级别游戏其中每个级别都是一个新活动我想知道如果我改变活动 Intent myIntent new Intent getBaseContext Level3 class startActivity myIntent 1级
Java Runtime.exec() 不从命令行发送电子邮件

我正在创建一个 java 应用程序我想添加的功能之一是将生成的电子邮件发送给用户我已经在 Macbook 上设置了邮件并且可以从命令行发送电子邮件当我调用runtime exec 时我在发送电子邮件时遇到问题任何人都知道为什么它
FB API PHP curl_setopt_array()：不推荐使用 @filename API 进行文件上传

FB PHP API 和 php 5 5 在将照片上传到服务器时遇到问题使用方法时 private function upload type path message aid try if in array type array phot
英特尔 MKL 多线程矩阵向量乘法 sgemv() 在小中断后变慢

我需要每 500 微秒运行一次多线程矩阵向量乘法矩阵是一样的向量每次都在变化我在 64 核 AMD CPU 上的 MKL 中使用 Intel sgemv 如果我在一个小测试程序中计算没有间隙的 for 循环中的乘法则每次调用 sge
Spark 作业中的 Scala 成员字段可见性

我有一个 Scala 类我定义如下 import org apache spark SparkConf SparkContext object TestObject extends App val FAMILY data toUpperC

Spark 作业中的 Scala 成员字段可见性

Spark 作业中的 Scala 成员字段可见性 的相关文章

随机推荐

热门标签

Spark 作业中的 Scala 成员字段可见性的相关文章