对 DStream 进行类型参数化

2024-02-28

Can a DStream have type parameters?

如果是，怎么办？

当我尝试时lazy val qwe = mStream.mapWithState(stateSpec) on myDStream: DStream[(A, B)]（类参数），我得到：

value mapWithState is not a member of org.apache.spark.streaming.dstream.DStream[(A, B)]
    lazy val qwe = mStream.mapWithState(stateSpec)

Spark API 的大量子集需要隐式ClassTags (see Scala：什么是 TypeTag 以及如何使用它？ https://stackoverflow.com/q/12218641/6910411) and PairDStreamFunctions.mapWithState没有什么不同。查看类定义 https://github.com/apache/spark/blob/f830bb9170f6b853565d9dd30ca7418b93a54fe3/streaming/src/main/scala/org/apache/spark/streaming/dstream/PairDStreamFunctions.scala#L37-L38:

class PairDStreamFunctions[K, V](self: DStream[(K, V)])
  (implicit kt: ClassTag[K], vt: ClassTag[V], ord: Ordering[K])

and https://github.com/apache/spark/blob/f830bb9170f6b853565d9dd30ca7418b93a54fe3/streaming/src/main/scala/org/apache/spark/streaming/dstream/PairDStreamFunctions.scala#L380-L381:

def mapWithState[StateType: ClassTag, MappedType: ClassTag](
    spec: StateSpec[K, V, StateType, MappedType]
  ): MapWithStateDStream[K, V, StateType, MappedType] = {
  ...
}

如果想创建一个对通用对流进行操作并使用的函数mapWithState你至少应该提供ClassTags for KeyType and ValueType types:

def foo[T : ClassTag, U : ClassTag](
  stream: DStream[(T, U)], f: StateSpec[T, U, Int, Int]) = stream.mapWithState(f)

If StateType and MappedType也被参数化了，你需要ClassTags对于这些也：

def bar[T : ClassTag, U : ClassTag, V : ClassTag,  W : ClassTag](
  stream: DStream[(T, U)], f: StateSpec[T, U, V, W]) = stream.mapWithState(f)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

对 DStream 进行类型参数化的相关文章

kafka消费端Offsets的一致性

我有复制因子为 3 的卡夫卡主题min insync replicas 2 一个向该主题发送 X 条消息的生产者acks all 一段时间后 1 分钟内在所有消息发送到主题后将使用 java kafka 客户端为此主题创建新的消费者使
';'预期但发现“导入” - Scala 和 Spark

我正在尝试使用 Spark 和 Scala 来编译一个独立的应用程序我不知道为什么会收到此错误 topicModel scala 2 expected but import found error import org apache sp
Spark：出现心跳错误后丢失数据

我有一个在 Spark 集群上运行的 Python 程序有四个工作线程它处理一个包含大约 1500 万条记录的巨大 Oracle 表检查结果后发现大约有600万条记录没有插入我的写入功能如下 df write format jdbc
使用 pyspark 计算所有可能的单词对

我有一个文本文档我需要找到整个文档中重复单词对的可能数量例如我有下面的word文档该文档有两行每行用分隔文档 My name is Sam My name is Sam My name is Sam My name is Sa
通过过滤对 Pyspark Dataframe 进行分组

我有一个数据框如下 cust id req req met 1 r1 1 1 r2 0 1 r2 1 2 r1 1 3 r1 1 3 r2 1 4 r1 0 5 r1 1 5 r2 0 5 r1 1 我必须观察客户看看他们有多少要求看看
如何以最佳方式传递元组参数？

如何以最佳方式传递元组参数 Example def foo Int Int def bar a Int b Int 现在我想传递的输出foo to bar 这可以通过以下方式实现 val fooResult foo bar fooResul
在 Akka/Scala 中使用带有 future 的 mapTo

我最近开始使用 Akka Scala 编码遇到了以下问题通过范围内的隐式转换例如 implicit def convertTypeAtoTypeX a TypeA TypeX TypeX just some kinda convers
在 Akka 中配置嵌套 Router

我有一些嵌套的路由器应创建它FromConfig 我想要的是这样的 test akka actor deployment worker router round robin nr of instances 5 slave router b
如何在 Apache Spark 中通过 DStream 使用特征提取

我有通过 DStream 从 Kafka 到达的数据我想进行特征提取以获得一些关键词我不想等待所有数据的到达因为它是可能永远不会结束的连续流所以我希望以块的形式执行提取如果准确性会受到一点影响对我来说并不重要到目前为止我整理
具有两个通用参数的上下文边界

在 Scala 中我可以使用上下文边界 def sort T Ordered t Seq T 与以下意思相同 def sort T t Seq T implicit def Ordered T 如果我有一个带有两个泛型参数的类怎么办 IE
HashPartitioner 是如何工作的？

我阅读了文档HashPartitioner http spark apache org docs 1 3 1 api java index html org apache spark HashPartitioner html 不幸的是除了
Spark问题中读取大文件 - python

我已经使用 python 在本地安装了 Spark 并在运行以下代码时 data sc textFile C Users xxxx Desktop train csv data first 我收到以下错误 Py4JJavaError Tra
可选择将项目添加到 Scala 映射

我正在寻找这个问题的惯用解决方案我正在构建一个valScala 不可变 Map 并希望有选择地添加一项或多项 val aMap Map key1 gt value1 key2 gt value2 if condition key3 gt
具有上限的联合类型

我正在遵循这个问题的公认答案中提出的技术如何定义类型析取联合类型 https stackoverflow com questions 3508077 does scala have type disjunction union type
Spark：如何使用crossJoin

我有两个数据框 df1有 100000 行并且df2有 10000 行我想创建一个df3这是两者的交叉连接 val df3 df1 crossJoin df2 这将产生 10 亿行尝试在本地运行它但似乎需要很长时间您认为本地可以实现
Play框架：单属性案例类的JSON读取

我正在尝试为包含单个属性的案例类创建隐式 JSON Reads 但收到错误 Reads Nothing 不符合预期类型这是代码 import play api libs functional syntax import play api
使用 Scala 获取 Spark 数据集中最新时间戳对应的行

我对 Spark 和 Scala 比较陌生我有一个具有以下格式的数据框 Col1 Col2 Col3 Col 4 Col 5 Col TS Col 7 1234 AAAA 1111 afsdf ewqre 1970 01 01 00 00
如何将 Pyspark Dataframe 标题设置到另一行？

我有一个如下所示的数据框 col1 col2 col3 id name val 1 a01 X 2 a02 Y 我需要从中创建一个新的数据框使用 row 1 作为新的列标题并忽略或删除 col1 col2 等行新表应如下所示 id na
scala中的反引号有什么用[重复]

这个问题在这里已经有答案了我在一本书上找到了以下代码 val list List 5 4 3 2 1 val result 0 list running total next element running total next elem
解决“Show”类型类实例的隐式问题

我正在努力使Gender实施Show类型类 scala gt trait Gender extends Show Gender defined trait Gender scala gt case object Male extends G

随机推荐

为r中的每个变量按组汇总表中的数据

我有一些数据我想用 R 中的一些汇总值正确格式化我已经玩过aggregate和其他事情例如summaryBy 但没有一个产生我想要的结果这是数据 data lt data frame id c 1 2 3 4 5 6 7 8 9 1
android 无法从服务器加载图像

在这里我尝试从服务器下载图像但它总是抛出异常任何人都可以告诉我为什么会发生这种情况以及正确的方法是什么 public static String getBitmap String url throws IOException Inpu
多个键名，相同的对值

我正在尝试在 JavaScript 脚本中设置一个对象文字该脚本具有具有多个名称的键引用相同的对象值即我已经尝试过的类似内容 var holidays thanksgiving day thanksgiving t day someV
包装对象返回值（例如 Integer）是否会导致 Java 中的自动装箱？

对于这个看似简单的问题我找不到明确的答案如果我写一个这样的方法 public Integer getAnInt int i 4 return i 0 返回值是否自动装箱为 Integer 还是取决于返回值后发生的情况例如分配给它的变
Python：UnboundLocalError：赋值之前引用的局部变量[关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions 我在Pyt
约束 wxPython MultiSplitterWindow 窗格

Edit 我将问题保留原样因为这仍然是一个好问题而且答案可能对其他人有用但是我会注意到我找到了一个实际的解决方案my通过使用完全不同的方法来解决问题AuiManager 看到answer https stackoverflow co
如何在 bazel 中生成 Python 覆盖率？

我正在尝试在 bazel 中生成 Python 覆盖范围我尝试运行此命令并生成了一个空文件 bazelisk coverage company libs foo test INFO Using default value for inst
如何防止自定义 DialogFragment 在显示时隐藏键盘

有 2 种方法可以通过以下方式创建自定义对话框DialogFragment 覆盖onCreateDialog并使用返回一个对话框AlertDialog Builder 覆盖onCreateView 我们注意到如果我们覆盖onCreateD
调试时暂停且“无法评估表达式”

使用 Visual Studio 在附加到进程并按暂停全部中断后您可以切换到所需的线程并使用快速监视窗口来检查一些数据例如 MySingletonClass Instance Data 有时我要么得到这个无法计算表达式因为
控制器中的 Url.Action 生成端口两次

我正在使用下面的代码来生成完全合格的url并将其传回为json用于重定向 returnUrl Url Action ActionName Controller new RouteValueDictionary new type return
将行插入仅包含主键字段的表

谷歌搜索告诉我尝试这个 insert into Plan default values 但我得到了 null value in column id violates not null constraint 或这个 insert into P
Node.childNodes 的 forEach 方法？

提供后一个不正确的答案 https stackoverflow com questions 36105267 js accessing event data via a string to dictate which input forms
在 ServiceModel 客户端配置部分中找不到名称为“xxxxx”且合同为“yyy”的端点元素

我通过这个命令生成了一个代理 svcutil exe 语言 cs out generatedProxy cs config app confighttps service100 emedny org 9047 MHService wsdl
Qt - 模块“QtQuick.Controls”未安装

我尝试部署一个在 PC 上运行良好的 QT 应用程序该应用程序部署在基于 ASEM 的 yocto 安装映像中版本为 morty 我收到错误消息 qml 加载组件时出错 qrc GUI InputDialog qml 3模块 QtQui
Doctrine - 如何打印出真正的sql，而不仅仅是准备好的语句？

我们正在使用 Doctrine 一个 PHP ORM 我正在创建这样的查询 q Doctrine Query create gt select id gt from MyTable 然后在函数中添加各种 where 子句和适当的内容如下所
最佳无限循环[重复]

这个问题在这里已经有答案了可能的重复而 1 Vs for 有速度差异吗 https stackoverflow com questions 885908 while 1 vs for is there a speed differenc
什么是 CharsetDecoder.decode(ByteBuffer, CharBuffer, endOfInput)

我有一个问题CharsetDecoder class 第一个代码示例有效 final CharsetDecoder dec Charset forName UTF 8 newDecoder final ByteBuffer b ByteB
Leptonica OpenCV Java 将 Mat 转换为 Pix，反之亦然

我用以下lept4j and OpenCVMaven 依赖项
Android Q 模拟器上的 Logcat 中出现“runtime_flags 中设置的未知位：0x8000”警告

我在 logcat 中的应用程序的第一行收到此警告但我不知道它指的是什么以及我应该如何修复它谷歌没有提供太多这方面的信息事实上根本没有请指教这可能是哪种旗帜有没有办法找出指定位可能引用的内容或者也许在旧版 Android
对 DStream 进行类型参数化

Can a DStream have type parameters 如果是怎么办当我尝试时lazy val qwe mStream mapWithState stateSpec on myDStream DStream A B 类参数

对 DStream 进行类型参数化

对 DStream 进行类型参数化 的相关文章

随机推荐

热门标签

对 DStream 进行类型参数化的相关文章