为什么将 Avro 与 Kafka 结合使用 - 如何处理 POJO

2024-01-29

我有一个 Spring 应用程序，它是我的 kafka 生产者，我想知道为什么 avro 是最好的选择。我读到了它以及它提供的所有内容，但为什么我不能序列化我用 jackson 自己创建的 POJO 并将其发送到 kafka？

我这样说是因为 avro 生成的 POJO 并不那么直接。最重要的是，它需要 maven 插件和 .avsc 文件。

例如，我在我的 kafka 生产者上创建了一个名为 User 的 POJO：

public class User {

    private long    userId;

    private String  name;

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public long getUserId() {
        return userId;
    }

    public void setUserId(long userId) {
        this.userId = userId;
    }

}

我将其序列化并将其发送到我在 kafka 中的用户主题。然后我有一个消费者，它本身有一个 POJO 用户并反序列化消息。是空间的问题吗？这样序列化和反序列化不是也更快吗？更不用说维护模式注册表的开销了。

你不需要AVSC，您可以使用 AVDL 文件 https://avro.apache.org/docs/1.8.1/idl.html，它基本上看起来与只有字段的 POJO 相同

@namespace("com.example.mycode.avro")
protocol ExampleProtocol {
   record User {
     long id;
     string name;
   }
}

其中，当使用idl-protocolMaven 插件的目标是为您创建这个 AVSC，而不是您自己编写。

{
  "type" : "record",
  "name" : "User",
  "namespace" : "com.example.mycode.avro",
  "fields" : [ {
    "name" : "id",
    "type" : "long"
  }, {
    "name" : "name",
    "type" : "string"
  } ]
}

它还会放置一个SpecificData POJO User.java在您的类路径中以便在代码中使用。

如果您已有 POJO，则无需使用 AVSC 或 AVDL 文件。有一些库可以转换 POJO。例如，你can use杰克逊 https://github.com/FasterXML/jackson-dataformats-binary/tree/master/avro#generating-avro-schema-from-pojo-definition，这不仅适用于 JSON，您可能只需要创建一个JacksonAvroSerializer例如，对于 Kafka，或者查找是否存在。

阿芙罗还有基于反射的内置库 https://blog.jeffli.me/blog/2014/04/05/avro-cookbook-part-ii/#parse-schema-from-existing-java-class/.

Confluence SchemaRegistry 序列化器有一个使用基于反射的模型的设置。

所以对于这个问题——为什么选择 Avro（卡夫卡）？

嗯，拥有一个模式就是好东西。想想 RDBMS 表，您可以解释该表，并且可以看到所有列。转向 NoSQL 文档数据库，它们几乎可以包含任何内容，这就是 Kafka 的 JSON 世界。

假设您的 Kafka 集群中有消费者，他们不知道主题中的内容，他们必须确切地知道主题中产生了谁/什么。他们可以尝试控制台消费者，如果它是像 JSON 这样的明文，那么他们必须找出一些他们感兴趣的字段，然后执行类似 HashMap 的片状操作.get("name")一次又一次的操作，只是在字段不存在时遇到NPE。有了 Avro，您明确定义默认值和可为空的字段。

你不是required使用模式注册表，但它提供了这种类型explain topicRDBMS 类比的语义。它还使您无需将架构与每条消息一起发送，以及 Kafka 主题上的额外带宽费用。不过，该注册表不仅对 Kafka 有用，它还可以用于 Spark、Flink、Hive 等，用于围绕流数据摄取的所有数据科学分析。

假设您确实想使用 JSON，那么尝试使用 MsgPack 代替 https://msgpack.org/您可能会看到 Kafka 吞吐量有所增加，并节省了代理上的磁盘空间

您还可以使用其他格式，例如 Protobuf 或 Thrift，正如 Uber 所比较的那样 https://eng.uber.com/trip-data-squeeze/

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么将 Avro 与 Kafka 结合使用 - 如何处理 POJO 的相关文章

SPNEGO 密码身份验证问题

我已将我的应用程序配置为通过 SPNEGO 与 Websphere 使用 Kerberos 身份验证这是详细信息 krb5 conf libdefaults default realm ABC MYCOMPANY COM default
用于解析和构建逻辑表达式的 Java 库

我正在寻找一个 Java 开源库来解析和构建类似 SQL 的表达式例如评估表达式的有效性例如 a x or y and b z 另外我想要一个用于构建或扩展表达式的 API 就像是 Expression exp new Expressi
如何在 IDEA Intellij 上使用 Spring-boot 自动重新加载

我写了一个基于Spring boot tomcat freemarker的项目我运行成功但是每当我修改一些模板和java类时我必须重新启动服务器或使用Intellij上的重新加载更改的类菜单才能使更改生效浪费很多时间然后我尝试
在 jTextfield 中禁用“粘贴”

我有一个用 Swing awt 编写的应用程序我想阻止用户将值粘贴到文本字段中有没有办法在不使用动作监听器的情况下做到这一点您可以使用 null 参数调用 setTransferHandler 如下所示 textComponent s
从 Spring MVC XML 文件转移到 javaconfig。我真的对我的数据库 XML 文件感到困惑

我从 Spring MVC XML 文件转移到 javaconfig 我真的对我的数据库 XML 文件感到困惑我不知道如何让 Hibernate4 工作以及我的 JBoss JNDI 数据源工作有人可以告诉我如何使 javaconfig
运行 java -jar 时出现 java.lang.ClassNotFoundException

我正在使用 ant 来构建我的build xml文件它编译正常但随后得到运行时java lang NoClassDefFoundError通过运行生成的 jar 时java jar my jar jar 似乎这个问题出现了很多但没有
记录共享和映射的诊断上下文

据我所知其他人做了什么来解决 Commons Logging 项目针对 NET 和 Java 不支持映射或嵌套诊断上下文这一事实执行摘要我们选择直接使用实现者日志框架在我们的例子中为 log4j 长答案您是否需要一个抽象日志框架
如何在 HandlerInterceptorAdapter 中添加 HttpServletRequest 标头？

我正在尝试将授权标头添加到我的请求中作为我们切换环境时的临时解决方法我试图在扩展 HandlerInterceptorAdapter 的拦截器中处理它我使用 MutableHttpServletRequest 类制作here http
无法在 Java 中输出正确的哈希值。怎么了？

在我的 Android 应用程序中我有一个 SHA256 哈希值我必须使用 RIPEMD160 消息摘要算法进一步对其进行哈希值我可以输出任何字符串的正确 sha256 和ripemd160 哈希值但是当我尝试使用ripemd160
插入时的 iBatis 判别器

我有一个抽象类Example以及与之相伴的具体子类我使用鉴别器来提取数据out数据库的像这样
C 与 C++ 中的 JNI 调用不同？

所以我有以下使用 Java 本机接口的 C 代码但是我想将其转换为 C 但不知道如何转换 include
HTTP 状态 405 - 此 URL java servlet 不支持 HTTP 方法 POST [重复]

这个问题在这里已经有答案了我无法使页面正常工作我有要发布的表单方法和我的 servlet 实现doPost 然而它不断地向我表明我并不支持POST方法我只是想做一个简单的网站并将值插入到我的 MySQL 数据库中 type Stat
如何减去两个 XmlGregorianCalendar 对象来创建一个 Duration 对象？

我想计算两个时间之间的差值XmlGregorianCalendar对象从而创建一个Duration object 但我还没有找到执行减法的干净方法你会怎么做那应该是 DatatypeFactory newDuration xgc2 t
删除 JFX 中选项卡后面的灰色背景

So is there any way to remove the gray area behind the tab s 我尝试过用 CSS 来做到这一点但没有找到方法要设置 tabpane 标题的背景颜色请在 CSS 文件中写入 t
Android：ANT 构建失败，并显示 google-play-services-lib：“解析为没有项目的 project.properties 文件的路径”

我正在尝试使用 ANT 构建我的应用程序但在包含 google play services lib 库项目后我惨遭失败 Step 1 我在 project properties 文件中设置了对库项目的引用 android library
如何制作一个makefile只用于编译一些java文件？

我有三个java文件名为A java B java C java A将创建对象B B将创建对象C 但我以前从未构建过makefile 有谁可以帮我构建一个 makefile 来编译这三个 java 文件吗我应该使用什么工具来制作 mak
java.lang.IllegalStateException - 提交响应后无法创建会话

我在我的项目中使用 JSF PrimeFaces 我为此准备了一个Maven项目当我编译项目并加载主页后我收到以下异常 java lang IllegalStateException Cannot create a session af
Axis2 错误：要输出的文本中的空白字符 (0x4) 无效

我创建了一个 Java 客户端使用 Axis2 1 7 6 作为代码生成器与 SOAP Web 服务进行交互问题在于客户端的某些输入抛出异常并显示以下消息 org apache axis2 AxisFault Invalid white
如何建立与 FileZilla Server 1.2.0 的 FTPS 数据连接

使用 Apache commons net 的 Java FTPSClient 进行会话恢复是一个已知问题会话恢复是 FTPS 服务器数据连接所需的一项安全功能 Apache FTPSClient 不支持会话恢复并且 JDK API 使
mybatis：使用带有 XML 配置的映射器接口作为全局参数

我喜欢使用 XML 表示法来指定全局参数例如连接字符串我也喜欢 Mapper 注释当我尝试将两者结合起来时我得到这个例外 https stackoverflow com questions 4263832 type interfac

随机推荐

如何强制 Swift 可选数组（很好）

使用斯威夫特 2 1 我正在寻找一种好方法将非可选类型数组分配给可选类型数组其中类型相同以下是我尝试过的一些方法 var foos Int let bars Int foos bars Error Cannot assign value
红宝石中的“$:”是什么？

通常可以在 gemspec 文件中看到例如 i18n gemspec https github com svenfuchs i18n blob master i18n gemspec lt lt File expand path lib
硒等待两个元素之一出现

很多时候我希望网络驱动程序等待两个元素之一的存在通常当我期望页面在某些情况下显示元素 1 或元素 2 时就会发生这种情况目前我正在使用两次等待顺序执行此操作但效率很低因为我需要等待 2 次有什么办法可以将两种等待合二为一吗
使用 LINQ 将数据插入到使用序列作为主键生成器的表中

我有一个表它根据序列生成主键从 0 开始计数 CREATE TABLE dbo testTable id int NOT NULL a int NOT NULL CONSTRAINT PK testTable PRIMARY KEY C
如何将 Z3 与 C++ 结合使用

我想将 Z3 与 C 一起使用并且我遵循了安装指南使用 Visual Studio 命令提示符在 Windows 上构建 Z3 https github com Z3Prover z3 building z3 on windows us
Webmatrix 布局——插入头部？

我使用 Asp Net 和 Razor 视图引擎创建了一个网站与使用 WebMatrix 相同到目前为止我一直在使用 SQL 直接查询数据库但现在我有一个页面需要查询返回 XML 的 WCF 服务让它返回 JSON 或 ODATA
在 SQLAlchemy 中使用 declarative_base 时，如何根据需要绑定引擎？

这是我的代码 from sqlalchemy import create engine Column Integer from sqlalchemy ext declarative import declarative base from
如何在 postgresql 中找到列中的最大值？

例如 name weight jon 100 jane 120 joe 130 如何只返回权重最大的人的名字 SELECT name FROM tbl ORDER BY weight DESC LIMIT 1 比其他答案性能更高并且仅产生
2013 年我应该使用 HTML5 编写我的网站吗？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
验证日期模式

我需要一个 javascript 方法来验证日期模式如下所示 2012 年 1 月 14 日到目前为止我不确定该模式使用哪个正则表达式因为它不是标准日期例如 14 01 2012 或 01 14 2012 或 01 04 2012
为什么 jqueryUI datepicker 会抛出错误？

我正在尝试 jqueryUI 但 firebug 在该脚本上捕获以下错误 function date datepicker 萤火虫错误如下 date datepicker is not a function 在我的 html 上日期 id
启发式和元启发式有什么区别？

经过对算法的一些研究后我发现了两个令我困惑的术语我读过至少 20 篇论文但都没有任何明确的定义我希望有人能帮助我区分启发式算法和元启发式算法之间的区别如果可能的话添加它的来源 ps 我已经知道这些词的含义但我不知道它们在计算机
如何将旋转器数据从一个活动传递到另一个活动？

此代码不会从微调器读取值它始终只读取第一个值 btnResult setOnClickListener new View OnClickListener final String USN spnConversions getSelecte
在 Visual Studio 中设置 FILE_ATTRIBUTE_DEVICE

我想知道是否可以在 Visual C 中调用 CreateFile 函数来创建属性为 FILE ATTRIBUTE DEVICE 0x00000040 十六进制 64 十进制的文件根据 MSDN API FILE ATTRIBUTE D
Laravel 4 - 使用 hasMany 关系时插入多条记录

仍在适应 Laravel 4 我有点不确定为什么这不起作用在 L3 中我能够将多条记录插入到表中如下所示 comments array array message gt A new comment array message gt A
依赖项规范必须是字符串或映射

pubspec yaml 第 32 行第 5 列出错依赖项规范必须是字符串或映射 32 assets 33 酒吧失败 65 问题是我的资产文件夹位于错误的位置它不应该处于依赖关系下另外 assets 前必须加2个空格如图
Swift 中的属性和变量有什么区别？

从一些最初的教程中我看到属性属于一个类本质上是 C 世界中使用的全局变量几年前编码我还认为变量更多的是仅在方法中使用存储信息的本地实体然后我看到了 Quora 的这个帖子 https www quora com Apple
Java win32 库/api

是否有合适的 Java win32 库例如显示当前进程查找进程占用的端口号等或者像 WMI 库之类的东西看一下JNA https github com twall jna 这是与本机代码通信的 100 纯 java 方式他们有一
如何抑制 Delphi DataSnap 错误消息对话框？

我们在 Windows 2003 Server 上运行 DataSnap Delphi 2009 应用程序 DataSnap 客户端和服务器位于同一台计算机上通过 Borland Socketserver 使用 DCOM 客户端运行后台批
为什么将 Avro 与 Kafka 结合使用 - 如何处理 POJO

我有一个 Spring 应用程序它是我的 kafka 生产者我想知道为什么 avro 是最好的选择我读到了它以及它提供的所有内容但为什么我不能序列化我用 jackson 自己创建的 POJO 并将其发送到 kafka 我这样说是因为

为什么将 Avro 与 Kafka 结合使用 - 如何处理 POJO

为什么将 Avro 与 Kafka 结合使用 - 如何处理 POJO 的相关文章

随机推荐

热门标签