值reduceByKey不是org.apache.spark.rdd.RDD的成员

2023-11-21

很伤心。我的spark版本是2.1.1，Scala版本是2.11

import org.apache.spark.SparkContext._
import com.mufu.wcsa.component.dimension.{DimensionKey, KeyTrait}
import com.mufu.wcsa.log.LogRecord
import org.apache.spark.rdd.RDD

object PV {

//
  def stat[C <: LogRecord,K <:DimensionKey](statTrait: KeyTrait[C ,K],logRecords: RDD[C]): RDD[(K,Int)] = {
    val t = logRecords.map(record =>(statTrait.getKey(record),1)).reduceByKey((x,y) => x + y)

我收到这个错误

at 1502387780429
[ERROR] /Users/lemanli/work/project/newcma/wcsa/wcsa_my/wcsavistor/src/main/scala/com/mufu/wcsa/component/stat/PV.scala:25: error: value reduceByKey is not a member of org.apache.spark.rdd.RDD[(K, Int)]
[ERROR]     val t = logRecords.map(record =>(statTrait.getKey(record),1)).reduceByKey((x,y) => x + y)

定义了一个特质

trait KeyTrait[C <: LogRecord,K <: DimensionKey]{
  def getKey(c:C):K
}

已编译，谢谢。

 def stat[C <: LogRecord,K <:DimensionKey : ClassTag : Ordering](statTrait: KeyTrait[C ,K],logRecords: RDD[C]): RDD[(K,Int)] = {
    val t = logRecords.map(record =>(statTrait.getKey(record),1)).reduceByKey((x,y) => x + y)

键需要覆盖 Ordering[T]。

  object ClientStat extends KeyTrait[DetailLogRecord, ClientStat] {
      implicit val c

lientStatSorting = new Ordering[ClientStat] {
    override def compare(x: ClientStat, y: ClientStat): Int = x.key.compare(y.key)
  }

      def getKey(detailLogRecord: DetailLogRecord): ClientStat = new ClientStat(detailLogRecord)
    }

这来自于一般使用pair rdd 函数。这reduceByKey方法实际上是一个方法PairRDDFunctions类，它有一个隐式转换RDD:

implicit def rddToPairRDDFunctions[K, V](rdd: RDD[(K, V)])
    (implicit kt: ClassTag[K], vt: ClassTag[V], ord: Ordering[K] = null): PairRDDFunctions[K, V]

所以它需要几个隐式类型类。通常，当使用简单的具体类型时，这些类型已经在范围内了。但是您应该能够修改您的方法以也需要相同的隐式：

def stat[C <: LogRecord,K <:DimensionKey](statTrait: KeyTrait[C ,K],logRecords: RDD[C])(implicit kt: ClassTag[K], ord: Ordering[K])

或者使用更新的语法：

def stat[C <: LogRecord,K <:DimensionKey : ClassTag : Ordering](statTrait: KeyTrait[C ,K],logRecords: RDD[C])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scala

generics

apachespark

RDD

traits

值reduceByKey不是org.apache.spark.rdd.RDD的成员的相关文章

scala.concurrent.blocking - 它实际上做了什么？

我花了一段时间学习 Scala 执行上下文底层线程模型和并发性的主题你能解释一下通过什么方式吗scala concurrent blocking 调整运行时行为 and 可以提高性能或避免死锁如中所述scaladoc http www
Java泛型类型要么扩展要么是父类

我正在寻找一些如下所示的代码 public class Parent
Spark Workers 上缺少 SLF4J 记录器

我正在尝试通过以下方式运行工作spark submit 此作业导致的错误是 Exception in thread main java lang NoClassDefFoundError org slf4j Logger at java l
scala 中的模拟案例类：Mockito

在我的游戏应用程序中我打算模拟一个案例类我可以这样做但它创建了一个所有成员变量都为空的对象有没有办法创建案例类的模拟对象以便该对象可以初始化一些成员 case class User name String address Stri
在地图类型中创建 DataFrame 分组列

My 数据框具有以下结构 df spark createDataFrame B a 10 B b 20 C c 30 Brand Type Amount df show Brand Type Amount B a 10 B b 20 C c
获取不带波形符的泛型类名称[重复]

这个问题在这里已经有答案了我正在尝试获取类型名称T使用这个 typeof T Name 班级名称是ConfigSettings 而不是返回ConfigSettings它正在返回ConfigSettings 1 有什么具体原因吗我怎样才能
如何使用 `ProjectRef` 来引用 sbt 1.x 中的本地项目？

其他答案中有很多含糊不清的内容或者涉及到更旧版本的 sbt 即 0 12 x 但似乎没有人真正回答这个问题鉴于我有一个文件夹并且我已经运行 sbt new scala scala seed g8 name Scala Seed Pro
如何通过 Scala REPL 使用第三方库？

我已经下载了Algebird我想尝试一些事情Scala 解释器使用这个库我该如何实现这一目标当然您可以使用 scala cp 无论如何并手动管理您的依赖项但这变得非常乏味尤其是当您有多个依赖项时更灵活的方法是使用sbt http
Spark如何选择节点来运行执行器？（spark on YARN）

Spark如何选择节点来运行执行器 spark on YARN 我们使用 Spark on Yarn 模式集群有 120 个节点昨天一个 Spark 作业创建了 200 个执行程序而节点 1 上有 11 个执行程序 Node2上有1
将额外的参数传递给多态函数？

我有一个多态函数可以将列表转换为集合 import shapeless PolyDefns gt import shapeless val lists List 1 2 List A B List 1 1 2 2 HNil object
Java 中的 TreeSet 与 C#.net 的等效项

我有 Java 代码其中包含TreeSet 我想将代码转换为 C 我可以使用哪个等效集合如果没有请提出替代方案那将是系统集合通用 SortedSet
Spark-shell 使用不同版本的 Scala。使用 homebrew 安装 scala 和 apache-spark

我使用 homebrew 安装了 scala 和 apache spark 它安装了 scala 2 12 4 和 apache spark 2 2 0 但是如果您结帐spark shell version它使用不同的 scala 版本
使用泛型进行选择排序

我对整数进行了选择排序并且它正在工作当我尝试修改程序以使用泛型时编译器会抱怨我不知道如何修复它如果有人能提出一些建议和建设性意见我将不胜感激这是代码 public class SelelctionSort public stat
Scala Sparkcollect_list() 与 array()

有什么区别collect list and array 在 Spark 中使用 scala 我看到到处都有使用情况但我不清楚用例来确定差异尽管两者array https spark apache org docs latest api
使用无形类型不等式时如何自定义 Scala 模糊隐式错误

def typeSafeSum T lt Nat W lt Nat R lt Nat x T y W implicit sum Sum Aux T W R error R 7 x typeSafeSum 3 4 compilation er
如何在 akka actor 中测试公共方法？

我有一个 akka 演员 class MyActor extends Actor def recieve def getCount id String Int do a lot of stuff proccess id do more st
Spring MVC：通用 DAO 和服务类

我正在 Spring MVC 中编写网页我使用 Generic DAO 编写了所有 DAO 现在我想重写我的服务类我该如何写通用服务我的 DAO 如下 DAO package net example com dao import j
为什么通过方法向 List 添加元素（类型正确）会出现编译错误？ [复制]

这个问题在这里已经有答案了我对泛型通配符概念几乎没有疑问 1 假设我有一个方法 void write List
如果需要函数类型作为类型参数，如何输入 None？

假设我有一个需要回调的函数 fn foo
使用 PySpark 从 azure blob 存储读取 csv 文件

我正在尝试使用 Microsoft Azure 上的 PySpark HDInsight 集群来做一个机器学习项目要在我的集群上进行操作请使用 Jupyter 笔记本另外我的数据一个 csv 文件存储在 Azure Blob 存

随机推荐

通过 Promise 配置多种功能

这是对使用量角器设置 firefox 配置文件 topic 根据setFirefoxProfilehowto 可以使用特殊的方式设置 firefox 配置文件助手 js代码它使用firefox profile and q动态生成编码的 F
如何使用 PHP Composer 从 Laravel 中删除包？

使用 PHP Composer 从 Laravel 中删除包的正确方法是什么到目前为止我已经尝试过从文件中删除声明作曲家 json 在要求部分删除任何类别名从文件app php 从我的代码中删除对该包的任何引用 Run compo
如何在 C Makefile 中使用外部库和头文件？

我在directory1中有一个头文件myheader h和一个静态库libmylib a文件在directory2 中我正在编写一个使用它们的程序假设我在directory2中有main c 它使用myheader h和libmyl
JS 中“.innerHTML”和“.value”的区别

我很困惑之间有什么区别 innerHTML and value在 JavaScript 中这是我的代码 Input string
如何将 postgres json 转换为整数

我可以用to json 1 将 int 转换为 json 但如何将 json 转换为 int 这可能太慢了 to json 1 text int 另外 json 是从二进制块 bson 包装的还是简单的文本包装对我有用的使用 postg
$http 不在请求中发送 cookie

We are working on a RESTful Webservice with AngularJS and Java Servlets When the user logs in our backend sends a Set Co
Java 11：补丁 sun.misc.BASE64Encoder

这个问题不是重复的java lang NoClassDefFoundError sun misc BASE64Encoder 我正在尝试更新我的应用程序中的 Java 版本至 11 并且我的应用程序中的库之一使用sun misc BASE
WPF 主题可以用于包含可在运行时更改的应用程序的多个外观吗？

WPF 允许控件库为不同的系统主题提供不同的资源字典本质上允许应用程序匹配操作系统选择的视觉主题 Aero Luna 等我想知道是否可以在我的应用程序中包含多个主题资源字典并利用框架内的一些现有主题支持这应该适用于我自己的主题名称
在 matplotlib 中围绕散点图中的数据点绘制平滑的多边形

我有一堆带有两组数据的交叉图并且一直在寻找一种 matplotlib 方法来用平滑的多边形轮廓突出显示它们的绘制区域 At the moment i just use Adobe Illustrator and amend saved p
Postgresql GROUP_CONCAT 等效吗？

我有一张表我想为每个 id 提取一行并连接字段值例如在我的表中我有这个 TM67 4 32556 TM67 9 98200 TM67 72 22300 TM99 2 23009 TM99 3 11200 我想输出 TM67 4 9
如何在Java中使用wait和notify而不出现IllegalMonitorStateException？

我有 2 个矩阵我需要将它们相乘然后打印每个单元格的结果一旦一个单元格准备好我就需要打印它但例如我需要在单元格 2 0 之前打印 0 0 单元格即使 2 0 的结果先准备好所以我需要按订单打印所以我的想法是让打印机线程等到m
matplotlib：绘制闭合线

我画了一个图如下 plt plot lon lat ro plt show 但线路并未关闭如何使它们闭合为多边形谢谢 Use matplotlib pyplot fill lon lat fill False 代替plot See ht
如何在共享主机环境中安装phpMailer？

如何安装phpMailer在共享托管环境中我需要用它来验证电子邮件和更改用户的密码你可以在这里下载 https github com PHPMailer PHPMailer 将文件夹上传到您的服务器并包含以下行的主文件之后您将需要一
在ubuntu中安装octave包

任何人都可以帮助我解决这个错误吗 octave 4 gt pkg install signal 1 2 0 tar gz error the following dependencies where unsatisfied signal n
ifstream::read 不附加 '\0'

ifstream read只是读n字节放入缓冲区但不追加 0 在缓冲区的末尾对吧那么当我使用缓冲区时它如何知道缓冲区的结尾呢我应该手动附加一个 0 在缓冲区的末尾 The ifstream用于读取文件二进制文件或文本处理二进制
在 SimpleXML for PHP 中删除具有特定属性的子项

我有几个具有不同属性的相同元素我正在使用 SimpleXML 访问这些元素
运行时 Autofac 绑定

我目前使用 Autofac 进行简单的构造函数注入没有任何问题然而我想知道的是如何在运行时解决依赖关系下面的示例显示了导出文档的多种方式通过简单的构造函数注入 IExport 的具体实现在运行时得到解决但是需要做的是解析下拉列表
sklearn：如何加速矢量化器（例如Tfidfvectorizer）

在彻底分析我的程序之后我已经能够确定它被矢量化器减慢了我正在处理文本数据两行简单的 tfidf 一元向量化占用了代码执行总时间的 99 2 这是一个可运行的示例这会将 3mb 的训练文件下载到您的磁盘省略 urllib 部分以在您
将参数从jsp传递到Spring Controller方法

我正在使用 Hibernate 的 Spring MVC 应用程序中工作在 JSP 页面中我有一个函数列出数据库中存储的值当前是所有值我写了一个方法其中列表仅限于 JSP 文件中传递的 ID 我的 HQL 查询工作正常所以我知道
值reduceByKey不是org.apache.spark.rdd.RDD的成员

很伤心我的spark版本是2 1 1 Scala版本是2 11 import org apache spark SparkContext import com mufu wcsa component dimension Dimension

值reduceByKey不是org.apache.spark.rdd.RDD的成员

值reduceByKey不是org.apache.spark.rdd.RDD的成员 的相关文章

随机推荐

热门标签

值reduceByKey不是org.apache.spark.rdd.RDD的成员的相关文章