流式源的查询必须使用 writeStream.start() 执行；

2024-01-26

我正在尝试在 Spark 中读取来自 kafka（版本 10）的消息并尝试打印它。

     import spark.implicits._

         val spark = SparkSession
              .builder
              .appName("StructuredNetworkWordCount")
              .config("spark.master", "local")
              .getOrCreate()  

            val ds1 = spark.readStream.format("kafka")
              .option("kafka.bootstrap.servers", "localhost:9092")  
              .option("subscribe", "topicA")
              .load()

           ds1.collect.foreach(println)
           ds1.writeStream
           .format("console")
           .start()

           ds1.printSchema()

线程“main”中出现错误异常

org.apache.spark.sql.AnalysisException：使用流源的查询必须使用 writeStream.start();; 执行

您正在对查询计划进行分支：从您尝试执行的同一个 ds1 开始：

ds1.collect.foreach(...)
ds1.writeStream.format(...){...}

但你只是打电话.start()在第二个分支上，让另一个分支悬空而没有终止，这反过来会引发您返回的异常。

解决方案是启动两个分支并等待终止。

val ds1 = spark.readStream.format("kafka")
  .option("kafka.bootstrap.servers", "localhost:9092")  
  .option("subscribe", "topicA")  
  .load()
val query1 = ds1.collect.foreach(println)
  .writeStream
  .format("console")
  .start()
val query2 = ds1.writeStream
  .format("console")
  .start()

ds1.printSchema()
query1.awaitTermination()
query2.awaitTermination()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scala

apachesparksql

SparkStreaming

流式源的查询必须使用 writeStream.start() 执行；的相关文章

Scala 'null' 是否算作另一种类型的实例？

我有这个代码 class MyLinkedList T h T tail MyLinkedList T def prepend v T MyLinkedList T new MyLinkedList v this 我想知道我如何可以将第二个
Play框架：读取包含空值的Json

我正在尝试在 Play Scala 程序中读取 Json 数据 Json 的某些字段可能包含空值因此我定义 Reads 对象的方式如下 implicit val readObj Reads ApplyRequest JsPath a re
获取两个顶点之间的边属性值时出现 ClassCastException

我正在尝试获取两个顶点之间的边缘属性值并低于异常 java lang ClassCastException 无法将 java lang String 转换为 scala runtime Nothing 环境内存中的泰坦 Code val
akka http配置中的idle-timeout和request timeout有什么区别？

我查阅了文档并发现了这些空闲连接自动关闭的时间设置infinite完全禁用空闲连接超时空闲超时 10 秒 Defines the default time period within which the application has
Scala：将整个列表的 Either 与每个元素的 Either 组合

我有一个 Either 列表它代表错误 type ErrorType List String type FailFast A Either ErrorType A import cats syntax either val l List
Scala 警告、IntelliJ 和编译器标志

我目前正在试用 IntelliJ Scala 插件有件事让我有点烦恼编译时我收到 3 个警告 Warning scala Recompiling 4 files Warning scala Warning scala there wer
当我们在 Apache Spark 中使用时，无法找到 Set([TOPIC NAME,0])) 的领导者

我们使用 Apache Spark 1 5 1 和 kafka 2 10 0 8 2 1 以及 Kafka DirectStream API 通过 Spark 从 Kafka 获取数据我们使用以下设置在 Kafka 中创建了主题复制因子
理解 scala 的 _ 与 Any/Nothing

如果一个类具有协变类型参数例如Iterable A http www scala lang org archives downloads distrib files nightly docs 2 10 1 library index ht
如何从java程序的main方法调用Scala程序的main方法？

假设我在 Java 项目中有一个 Scala 类和一个 Java 类 scala 类如下所示 class Sam def main args Array String Unit println Hello 如何从同一项目中存在的 java
scala.math.BigDecimal ：1.2 和 1.20 相等

将 Double 或 String 转换为 scala math BigDecimal 时如何保持精度和尾随零用例在 JSON 消息中属性的类型为 String 值为 1 20 但是在 Scala 中读取这个属性并将其转换为 BigD
按元素聚合数组

Spark scala 相当新我想知道是否有一种简单的方法以按列方式聚合 Array Double 这是一个例子 c1 c2 c3 1 1 1 0 1 0 3 4 1 2 1 0 0 0 4 3 2 1 0 0 0 0 0 0 2 3 1
WSClient - 打开的文件太多

我正在 CentOS 6 上使用 Play Framework 2 4 我的应用程序抛出此异常 java net SocketException Too many open files 我在 Stack Overflow 上搜索了很多主题并
Akka中有轻量级的actor吗？

我的用例非常简单在两个对象之间交换少量现在我正在从 Scala Actors 迁移到 Akka 但是我再也找不到那些轻量级 Actors 使用Akka 我不仅需要为Actor创建创建ActorSystem Props 还需要照顾Acto
Spark 数据帧分组、排序和选择一组列的顶部行

我正在使用 Spark 1 5 0 我有一个包含以下列的 Spark 数据框 user id description fName weight 我想做的是为每个用户选择前 10 行和后 10 行基于列权重的值数据类型为 Double 如
需要澄清令人困惑的 Http4s 消息类型 `Response[F]` / `Request[F]`

我很难理解为什么Request and Response参数化为F 类似的东西是猫效应数据类型资源从文档中 https typelevel org cats effect docs std resource https typelevel
Scala 中用于阻止调用的 Future

The Akka文档说 you may be tempted to just wrap the blocking call inside a Future and work with that instead but this strate
创建涉及 ArrayType 的 Pyspark 架构

我正在尝试为我的新 DataFrame 创建一个架构并尝试了括号和关键字的各种组合但无法弄清楚如何完成这项工作我目前的尝试 from pyspark sql types import schema StructType StructF
Scala 隐式转换范围问题

采取这个代码 class Register var value Int 0 def getZeroFlag Boolean value 0x80 0 object Register implicit def reg2int r Regist
Spark scala：大量列上的简单 UDF 会导致性能下降

我有一个包含 1 亿行和约 10 000 列的数据框这些列有两种类型标准 C i 和动态 X i 这个dataframe是经过一些处理后得到的性能很快现在只剩下2步了 Goal 需要使用 C i 列的相同子集对每个 X i 执行特定
与文件名中的冒号“：”作斗争

我有以下代码用于加载大量 csv gz 并将它们转储到其他文件夹中并将源文件名作为一列 object DailyMerger extends App def allFiles path File List File val parts

随机推荐

如何在非 GUI 应用程序中使用 QWebPage

我想用QWebPage在非 GUI Qt 应用程序中我的意思是我根本不想与窗口服务器通信不过使用 QtGui 不是问题 QWebPage内部创建一些QWidget实例因此使用QCoreApplication不可能当创建一个QAp
包含多个 Chart.js 图表的 pdf 页面

我使用 Chart js 生成一个包含多个图表的报告页面我需要将此报告导出为 PDF 通过搜索可以找到许多解决方案但我找不到具有多个画布元素的解决方案唯一可用的解决方案似乎是循环遍历所有图像并使用图像重新创建报告然后将其下载为 p
onKey onKeyDown 不起作用

我正在尝试在我的 Android 应用程序中注册方向键电视遥控器方向键点击我目前正在使用 Android 模拟器进行测试并尝试在额外设置菜单下使用方向键输入进行单击但我不确定为什么这不起作用任何帮助将不胜感激 public cla
如何使用 Java 复制文件并将其粘贴到剪贴板？

如何使用 Java 复制文件并将其粘贴到剪贴板我的程序可以复制但不能粘贴它给线程 main 中的异常 java lang ClassCastException java util Arrays ArrayList 无法转换为 java
Plotly.js - gd.data 必须是一个数组

我正在使用 Plotly js 库来绘制 3D 图形我的计划是将 4 条迹线绘制到一张 3D 图中但是当我尝试这样做时我的网站遇到了一些奇怪的行为有时当我加载网站时我没有收到任何错误并且所有 4 条轨迹都完美加载到我的 3D
将 GWT 应用程序部署为单个 JavaScript 文件

GWT 应用程序的已编译 JavaScript 输出分为不同的文件例如缓存 html gwt rpc 托管 html nocache js 我知道这样做的目的是最小化必须由用户下载的 JavaScript 的大小例如 Firefox
更新表插入 VARBINARY 数据

当我运行 sql 查询时我得到如下信息不允许从数据类型 varchar 到数据类型的隐式转换 varbinary 使用 CONVERT 函数运行此查询严重程度 16 我想要插入的数据看起来像 000012000000000000100
如何使用 Windows 任务计划程序自动执行 PowerShell 脚本？

我有一个发送电子邮件的 PowerShell 脚本我想每 1 分钟自动执行一次该脚本我该如何使用任务计划程序来做到这一点目前我已经创建了一个任务并提供了脚本的路径但是该调度程序打开我的脚本而不是执行我使用的是 Windows 7
JDK8 是 JBoss 6 AS 支持的平台吗

我们正在将应用程序 java 平台升级到最新的稳定平台并且我们正在使用 Jboss 6 AS Is 甲骨文JDK8JBoss 6 AS 支持的平台不它不会起作用 JBoss AS 6和 7 不兼容Oracle JDK 1 8 您需要下
阻止 GSON 序列化 JSON 字符串

我是 gson 的新手并且有一个尚未找到答案的新手问题所以请耐心等待 StackOverflow 和 google 不是我的朋友我有一个 java 类 User 其属性之一 externalProfile 是一个包含已序列化 JSON
为什么 MFunctor 的“hoist”没有“Monad n”约束？

我有一个协程变压器 data Step y m a Done a Yield y CoT y m a data CoT y m a CoT m Step y m a with Monad实例 unCoT CoT y m a gt m Ste
Laravel - 针对不同用户使用唯一参数重复输入

使用 Laravel 5 2 我正在 Laravel 中开发一个电话簿项目您将联系信息存储在名为的表中Contacts 要在此表中创建新联系人您必须注册并且您的信息将记录在users table 我创建了一个视图来显示Contacts
Firemonkey T编辑高度

我正在使用 Delphi Seattle 我的应用程序适用于 Windows 桌面我正在尝试更改 TEdit 的字体大小因此高度也被修改在设计时一切正常但当我运行应用程序时 TEdit 会忽略高度修改并剪切文本我试图找到Fixed
NEWSEQUENTIALID 的可预测性如何？

根据微软的文档NEWSEQUENTIALID http msdn microsoft com en us library ms189786 aspx NEWSEQUENTIALID 的输出是可预测的但可预测性如何呢假设我有一个 GUID
sed 中的反向引用返回错误值

我正在尝试使用 sed 替换表达式正则表达式在 vim 中有效但在 sed 中无效我用斜杠替换数字前的最后一个破折号所以 www file name 1 应该返回 www file name 1 我正在使用以下命令但它一直输出 w
Apache Camel HTTP 显示请求和响应

我正在使用 Apache Camel 将数据从 CSV 文件加载到 Web 服务无论如何我可以显示请求和响应下面是路由配置我从数组中拆分并聚合 100 个项目以作为 POST 正文发送 from fileLocation unmar
SqlAlchemy TIMESTAMP“更新时”额外

我在 python3 4 3 上使用 SqlAlchemy 来管理 MySQL 数据库我正在创建一个表 from datetime import datetime from sqlalchemy import Column text cr
今日小部件扩展高度 - iOS10

今日小部件视图模式的高度无法设置为紧凑模式无论我设置什么值它将小部件的高度设置为默认值扩展模式工作完美并且值已正确设置并反映在小部件中我已经在 viewDidLoad 方法中添加了这一行 self extensionContext
生产中使用 Flask-oauthlib 或 authlib？

我刚刚在我正在构建的网站上使用了flask oauthlib 但是我注意到该项目的首页有一个警告要求改为使用 authlib 如果您在生产中使用flask oauthlib 您是否计划迁移到authlib 有谁知道一个完成此迁移的简单项
流式源的查询必须使用 writeStream.start() 执行；

我正在尝试在 Spark 中读取来自 kafka 版本 10 的消息并尝试打印它 import spark implicits val spark SparkSession builder appName StructuredNetwork

流式源的查询必须使用 writeStream.start() 执行；

流式源的查询必须使用 writeStream.start() 执行； 的相关文章

随机推荐

热门标签

流式源的查询必须使用 writeStream.start() 执行；的相关文章