如何从 Apache Beam KafkaIO 中的 kafka 主题推断 avro 架构

2024-02-11

我正在使用 Apache Beam 的 kafkaIO 来读取 Confluence 模式注册表中具有 avro 模式的主题。我能够反序列化消息并写入文件。但最终我想写信给 BigQuery。我的管道无法推断架构。如何提取/推断架构并将其附加到管道中的数据，以便我的下游进程（写入 BigQuery）可以推断架构？

下面是我使用架构注册表 url 来设置反序列化器以及从 Kafka 读取数据的代码：

    consumerConfig.put(
                        AbstractKafkaAvroSerDeConfig.SCHEMA_REGISTRY_URL_CONFIG, 
                        options.getSchemaRegistryUrl());

String schemaUrl = options.getSchemaRegistryUrl().get();
String subj = options.getSubject().get();

ConfluentSchemaRegistryDeserializerProvider<GenericRecord> valDeserializerProvider =
            ConfluentSchemaRegistryDeserializerProvider.of(schemaUrl, subj);

pipeline
        .apply("Read from Kafka",
                KafkaIO
                        .<byte[], GenericRecord>read()
                        .withBootstrapServers(options.getKafkaBrokers().get())
                        .withTopics(Utils.getListFromString(options.getKafkaTopics()))
                        .withConsumerConfigUpdates(consumerConfig)
                        .withValueDeserializer(valDeserializerProvider)
                        .withKeyDeserializer(ByteArrayDeserializer.class)

                        .commitOffsetsInFinalize()
                        .withoutMetadata()

        );

我最初认为这足以让 Beam 推断模式，但事实并非如此，因为 hasSchema() 返回 false。

任何帮助，将不胜感激。

有正在进行的工作 https://github.com/apache/beam/pull/10978支持 Avro 模式的推断，存储在 Confluence Schema 注册表中，位于KafkaIO。不过，现在也可以在用户管道代码中执行此操作。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何从 Apache Beam KafkaIO 中的 kafka 主题推断 avro 架构的相关文章

如何在Jenkins上更改工作空间并建立记录根目录？

我希望将 Jenkins 的数据写入驱动器 E 因为这是服务器上的大型驱动器 Jenkins 本身安装在 C 上我怎么做我看到的默认配置是工作区根目录 ITEM ROOTDIR 工作区构建记录根目录 ITEM ROOTDIR 构建
以 UTF8 而不是 UTF16 输出 DataTable XML

我有一个 DataTable 我正在使用 WriteXML 创建一个 XML 文件尽管我在以 UTF 16 编码导出它时遇到问题并且似乎没有明显的方法来更改它我了解 NET 在字符串内部使用 UTF 16 这是正确的吗然后我通过
错误：模块“html”不提供视图引擎（Express）

我正在尝试设置一个简单的路由应用程序但在渲染页面时不断遇到错误 Error Module html does not provide a view engine 奇怪的是我已经在 app js 文件中指定了视图引擎但仍然收到错误 app
Javascript/jQuery 外部高度()

Does idOfLememt outerHeight 对所有浏览器产生相同的结果 IE7 有什么不同吗只要去http api jquery com outerHeight http api jquery com outerHeight
服务器响应 PASV 命令返回的地址与建立 FTP 连接的地址不同

System Net WebException 服务器响应 PASV 命令返回的地址与建立 FTP 连接的地址不同在 System Net FtpWebRequest CheckError 在 System Net FtpWebReque
Maven 构建错误 TOOLS.JAR NOT FOUND IN JRE

我在构建 Maven 项目时遇到这个问题请帮我解决 ERROR Failed to execute goal org apache maven plugins maven compiler plugin 2 5 1 compile def
Android 的代码覆盖率[重复]

这个问题在这里已经有答案了可能的重复 Android测试代码覆盖率 Eclipse https stackoverflow com questions 3282702 android test code coverage eclipse
关闭扫描仪是否会影响性能

我正在解决一个竞争问题在问题中我正在使用扫描仪获取用户输入这是 2 个代码段一个关闭扫描器一个不关闭扫描器关闭扫描仪 import java util Scanner public class JImSelection publ
UWP 应用程序在与商店关联后崩溃

我正在为 Windows 创建一个 cordova 应用程序将应用程序与商店关联后应用程序起始页变为白色空白如果应用程序使用包标识名称 com something moretext 则该应用程序可以正常工作但我的商店包身份名称是 5
Maven2继承

如果我有一个父 pom 并且想将其继承到多个项目我通常通过添加到项目顶部来做到这一点
纯旧 PHP 对象 (POPO) 一词的确切含义是什么？

我想了解一下波波我搜索了 popo 发现它代表 Plain Old Php Object 但我不确定 Plain Old Php Object 的确切含义我想知道什么是 popo 以及在哪里使用它谢谢普通旧在此处插入语言对象是一
如何用LoaderManager自动重新查询

我有一个应用程序显示来自 SQLite DB 的数据并且数据不断变化所以显然我认为我应该使用 LoaderManager 来显示数据我读过一些关于将 LoaderManager 与 SQLite 结合使用的内容然后看到了亚历克斯
JavaScript 中“键”的类型是什么？

当我失去焦点并开始思考一个愚蠢的问题时我遇到了这样的时刻 var a b value b 的类型是什么我的意思不是值的类型而是标记为 b 的实际键背景当我必须创建一个字符串键时我开始想知道这一点 var a b value
RavenDB：为什么我会在此多重映射/归约索引中获得字段空值？

受到 Ayende 文章的启发https ayende com blog 89089 ravendb multi maps reduce indexes https ayende com blog 89089 ravendb multi m
如何在 Symfony 4 中为测试环境设置数据库

我对如何在 symfony 4 中为测试环境设置数据库感到困惑我曾经在配置测试 ymlsymfony 3 及以下版本中的文件最佳做法是什么我应该重新创建一个学说 yaml文件输入配置包测试该文档提到如何通过编辑 phpunit
尝试了解天蓝色云服务中的负载平衡

我正在维护一个天蓝色的云服务它有 1 个 Web 角色和几个辅助角色该网络角色有多个实例当我从资源中打开云服务时我可以看到服务端点和公共IP地址我想了解这个蔚蓝云服务中的流量负载是如何平衡的我搜索了负载均衡器但在订阅中找不到它
将 read.csv 与符号链接文件一起使用

我正在尝试做什么我的源文件非常大我想避免将其复制到其他文件夹中我决定创建一个指向大文件的符号链接并想使用read csv读取文件文件夹结构项目1 数据源文件 csv 项目2 数据别名到源文件 csv 什么地方出了错读取源文件
为什么 FMA _mm256_fmadd_pd() 内在函数有 3 个 asm 助记符：“vfmadd132pd”、“231”和“213”？

有人可以向我解释一下为什么融合乘法累加指令有 3 种变体 vfmadd132pd vfmadd231pd and vfmadd213pd 而只有一个 C 内在函数 mm256 fmadd pd 为了简单起见在 AT T 语法中有什么区别
如何使用 C# 以低分辨率形式提供高分辨率图像

尝试使用 300dpi tif 图像在网络上显示目前当用户上传图像时我正在动态创建缩略图如果创建的页面引用宽度为 500x500px 的高分辨率图像我可以使用相同的功能即时转换为 gif jpg 吗将创建的 jpg 的即将分辨率
GAE 无法部署到 App Engine

我正在尝试从 Eclipse 发布 Web 应用程序我在 GAE 上创建了四个项目可以通过登录我的帐户并查看控制台来查看它们我已经改变了appengine web xml到项目的应用程序 ID 如果我将其更改为 GAE 上第一个创建的

随机推荐

当我尝试垂直对齐字段时，它们的行为不符合我的预期？（Blackberry JDE4.5.0 eclipse）

我正在使用 Eclipse 和 JDE 4 5 0 插件如何垂直对齐字段我们可以对齐字段吗LEFT BOTTOM RIGHT BOTTOM LEFT VCENTER RIGHT VCENTER CENTER 垂直和水平 BOTTOM C
在 Java 运行时创建变量 [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案在我的代码中我有一个相当大的循环我需要在每次迭代结束时创建一个新变量整数这可能吗我读到了有关 ScriptEngineManage
Jquery 无法在 Angular 6 中工作错误：ENOENT：没有这样的文件或目录，打开 '...\node_modules\jquery\dist\jquery.min.js'

我正在将 Angular 5 项目迁移到 Angular 6 开始申请时 npm start 出现以下错误 Angular Live Development Server is listening on localhost 9000 ope
实体框架 4.1 DatabaseGenelatedOption.Identity 性能

我目前正在开发一个使用 Entity Framework 4 1 代码优先和 SQL Server CE 4 0 的应用程序我真正喜欢 SQL Server CE 4 0 的新功能之一是计算值但在将旧数据导入新数据存储系统大约 50
$ mongoDB findOneAndUpdate() 中的投影

我正在尝试使用 Express 和 Mongoose 构建一个简单的任务队列这个想法是获取单个客户端并返回活动 ID 和客户端 ID 这是活动的子文档每次有人获取客户端时其状态代码都会设置为 1 我提出了以下查询 router pos
在虚拟终端中使用 ncurses

我对 Linux 虚拟终端以及 Curses 都很陌生所以如果这个描述不太清楚请原谅我我正在尝试在 Fedora 12 上使用 Curses 将状态信息输出到虚拟终端您知道可以通过按 ctrl alt Fx 访问的终端之一当我在虚
编写一个接受任意两个数字（任意实数或任意整数）的函数

我有一个接受两个数字的函数我不在乎它们是整数实数 32 位还是 64 位对于下面的例子我只是将其写成一个简单的乘法在 Fortran 90 中您可以使用接口块来完成此操作但如果您想涵盖两个数字相乘的所有可能的交互则必须编写
枚举声明错误

我有一个非常简单的c代码 include
如何使用 HTTP POST/GET 请求连接/查询 AWS Neptune 实例

我尝试通过 Fiddler 使用 Neptune END Point 发送 HTTP Post 请求来连接到 Amazon Neptune 实例但最终出现超时错误可以使用 fiddler Postman 通过 HTTP 请求连接 Nep
如何正确使用 VBA 类模块集合？

我想创建一个机场集合机场有很多参数但为了简单起见我们假设机场类在机场类模块中定义如下 Class Airport Public name As String Stores name of the airport Public flig
如何使用preg_replace_callback？

我有以下 HTML 语句 otsection Wallpapers otsection WALLPAPERS GO HERE otsection Videos otsection VIDEOS GO HERE 我想做的是将 otsectio
是否可以使用 bazaar、mercurial 或 git 进行部分克隆/分支？

假设我有一个源代码管理项目其中有很多子目录其中许多子目录我目前不需要我想创建一个仅包含整个树的部分内容的工作副本该副本仍然保持进行更改提交并将其推回的能力这可能吗如果可以我该怎么做我仍在决定是选择 Bazaar 还是 Me
wxPython进度条

我不能使用wx ProgressDialog http www wxpython org docs api wx ProgressDialog class html因为我需要向对话框添加额外的内容暂停按钮和有关当前正在处理的内容的信息是
ManifestV3 服务工作者中的 IIFE/函数（不在全局范围内）内的监听器？

Manifest v3 Service Worker 要求在文件的全局范围内定义监听器 webpack 编译到匿名函数内部这两件事看起来基本上是不相容的有没有人有比放弃 webpack 更好的解决方案 Manifest v3 Servi
使用jquery计算选中的html复选框的数量

我如何计算用户使用jquery选中的复选框的数量我想要做的是将表单中检查复选框的数量限制为 10 个当用户超出此范围时显示警告消息有多种方法可以做到这一点方法一 alert checkbox class here checked s
OpenCV 与 Qt：程序意外完成

我正在尝试在 Windows 8 64 位上使用 Qt Creator 2 7 0 Qt 5 0 2 配置 OpenCV 执行我的程序时出现以下错误计划意外地结束了这是我的main cpp include mainwindow h i
Android VideoView - 检测视频中的时间点

我正在使用 VideoView 来显示视频我使用 setOnPreparedListener 和 setOnCompletionListener 在视频开始和结束之前和之后执行操作我想知道如何检测视频中的某个时间点例如假设我想在视频
Hop_Size 在 aubio 中的含义

我正在尝试使用aubio https aubio org https aubio org 用于音高检测的库我正在尝试使用 C 的 API 和new aubio pitch函数是hop size 什么是hop size意思是你如何选择一个
检查 Android 设备是否有内置扬声器

如何检查运行 Android 的设备是否有扬声器意思是它可以播放音频吗是否有任何配置限定符那么以编程方式呢编辑刚刚买了一块 Android Wear 手表它没有扬声器所以不知道如何检查这个从API级别21 大多数Androi
如何从 Apache Beam KafkaIO 中的 kafka 主题推断 avro 架构

我正在使用 Apache Beam 的 kafkaIO 来读取 Confluence 模式注册表中具有 avro 模式的主题我能够反序列化消息并写入文件但最终我想写信给 BigQuery 我的管道无法推断架构如何提取推断架构并将其附

如何从 Apache Beam KafkaIO 中的 kafka 主题推断 avro 架构

如何从 Apache Beam KafkaIO 中的 kafka 主题推断 avro 架构 的相关文章

随机推荐

热门标签

如何从 Apache Beam KafkaIO 中的 kafka 主题推断 avro 架构的相关文章