如果字段顺序更改，Avro 架构不兼容

2024-01-06

设想 - 客户端使用 Avro Reflect Datum Writer 序列化 POJO 并将 GenericRecord 写入文件。通过反射获得的模式是这样的（注意顺序A、B、D、C）-

{
"namespace": "storage.management.example.schema",

"type": "record",
"doc": "Example schema for testing",
"name": "Event",
"fields": [
     ....
     ....
    { "name": "A", "type":  "string"  },
    { "name": "B", "type":  "string"  },
    { "name": "D", "type": "string" },
    { "name": "C", "type":  "string"  },
     ....
     ....
]
}

代理读取文件并使用默认模式（注意顺序 - A、B、C、D）来反序列化记录的子集（保证客户端拥有这些字段）

{
"namespace": "storage.management.example.schema",
"type": "record",
"doc": "Example schema for testing",
"name": "Event",
"fields": [
    { "name": "A", "type":  "string"  },
    { "name": "B", "type":  "string"  },
    { "name": "C", "type": "string" },
    { "name": "D", "type":  "string"  }
]
}

问题：使用上述子集模式的反序列化会导致以下异常 -

Caused by: java.io.IOException: Invalid int encoding
at org.apache.avro.io.BinaryDecoder.readInt(BinaryDecoder.java:145)
at org.apache.avro.io.BinaryDecoder.readString(BinaryDecoder.java:259)
at org.apache.avro.io.ResolvingDecoder.readString(ResolvingDecoder.java:201)
at org.apache.avro.generic.GenericDatumReader.readString(GenericDatumReader.java:430)
at org.apache.avro.generic.GenericDatumReader.readString(GenericDatumReader.java:422)
at org.apache.avro.generic.GenericDatumReader.readWithoutConversion(GenericDatumReader.java:180)
at org.apache.avro.generic.GenericDatumReader.read(GenericDatumReader.java:152)
at org.apache.avro.generic.GenericDatumReader.readField(GenericDatumReader.java:240)
at org.apache.avro.generic.GenericDatumReader.readRecord(GenericDatumReader.java:230)

但是，如果子集模式还按 A、B、D、C 的顺序指定字段，则反序列化会成功。（与客户端模式相同）

这种行为是预期的吗？我认为 Avro 仅依赖于字段名称来构建记录，而不依赖于排序。

有什么解决办法吗？不同的客户端可能有不同的顺序，我无法强制排序，因为模式是通过反射生成的。

这不一定是预期的行为。您可能会犯与我开始使用 Avro 时所犯的错误相同的错误。

Avro 能够拥有不同版本的模式（例如，用一个模式写入但读入另一个模式），但很容易错过的一件事（至少我自己）是您必须拥有尝试读取消息时写入消息的确切架构。

您阅读的有关 Avro 的文档和信息（至少在表面上）并没有非常清楚地说明这一点。通常他们关注它的“向后兼容”。公平地说，从某种意义上来说是这样，但通常当人们看到这个短语时，他们会认为它的含义有点不同。通常我们认为这意味着您可以使用新模式处理旧消息，而不是使用新模式处理旧消息和旧消息的架构。

作为示例，请参阅此伪代码

Schema myUnsortedSchema has C B A order
Schema myAlphabeticalSchema has A B C order

Writer writer uses myUnsortedSchema
Reader badReader uses myAlphabeticalSchema only

writer writes message
badReader reads message

错误！不确定错误消息到底会说什么，但问题是badReader不仅尝试阅读myAlphabeticalSchema还可以阅读该消息，就好像它是由myAlphabeticalSchema。解决方案是有一种方法可以为其提供两种模式，一种是写入消息的模式，另一种是要读取的模式（具体方式取决于语言）。

Reader goodReader reads messages written with myUnsortedSchema into myAlphabeticalSchema

goodReader reads message

没有错误！这是正确的用法。

如果您使用类似的方法goodReader那么这种行为是意外的，但是如果您使用类似的方法badReader那么该行为是预期的。

某些服务（例如架构注册表）可以通过将一些元数据附加到消息字节的前面来确定哪个架构写入了消息（当然，并在读取之前将其剥离）来帮助解决此问题。这超出了问题的范围，但可以帮助解决这样的问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如果字段顺序更改，Avro 架构不兼容的相关文章

SPNEGO 密码身份验证问题

我已将我的应用程序配置为通过 SPNEGO 与 Websphere 使用 Kerberos 身份验证这是详细信息 krb5 conf libdefaults default realm ABC MYCOMPANY COM default
从文本文件中读取阿拉伯字符

我完成了一个项目在该项目中我读取了用记事本编写的文本文件我的文本文件中的字符是阿拉伯语文件编码类型是UTF 8 当在 Netbeans 7 0 1 中启动我的项目时一切似乎都正常但是当我将项目构建为 jar 文件时字符以这种方式
将 MouseListener 添加到面板

我正在尝试将鼠标操作添加到我的面板中这就是程序应该做的事情编写一个程序允许用户通过按三下鼠标来指定一个三角形第一次按下鼠标后画一个小点第二次按下鼠标后绘制一条连接前两个点的线第三次按下鼠标后绘制整个三角形第四次按下鼠标会
从 Spring MVC XML 文件转移到 javaconfig。我真的对我的数据库 XML 文件感到困惑

我从 Spring MVC XML 文件转移到 javaconfig 我真的对我的数据库 XML 文件感到困惑我不知道如何让 Hibernate4 工作以及我的 JBoss JNDI 数据源工作有人可以告诉我如何使 javaconfig
Java 卡布局。多张卡中的一个组件

一个组件例如JLabel 在多张卡中使用CardLayout 目前看来该组件仅出现在它添加到的最后一张卡上如果有办法做到这一点我应该吗这是不好的做法吗或者有其他选择吗你是对的它只出现在添加到的最后一张卡中但这与CardL
Spring中的ProxyFactoryBean

有人可以解释一下吗代理工厂Bean http static springsource org spring docs current javadoc api org springframework aop framework ProxyFa
JavaFX使节点覆盖父节点边框颜色

我有一个如下所示的节点仅使用 css 我希望标签覆盖其父边框颜色因此标签下方的边框颜色部分变得不可见我用来制作这个边框的CSS代码 fx border color black fx border width 3 fx border r
可访问数据的 Java 约定。（公共访问器和 Getter/命名）

通过 Java API 您会看到大量冲突的命名和实践这让我感到非常困惑例如 The String http grepcode com file repository grepcode com java root jdk openjdk
生成 equals 和 hashcode 时忽略属性

假设我有一个类 Customer public class Customer private String firstName private String lastName private String doNotAddMeToEqual
用于层次结构树角色的 Spring Security / Java EE 解决方案

我知道 Spring Security 非常适合标准角色和基于权限的授权我不确定的是这种情况系统中管理着 10 000 名员工员工被组织成组织结构图跨部门的谁向谁报告的树其中一些员工是用户这些用户仅被允许访问其职责范围内的员工
正确签名的 JNLP 应用程序无法在 Java 7 中运行

我有一个 JNLP 应用程序由于证书过期需要更新我有一个经过 CA 验证的新证书我已将新证书导入到我的密钥库中我已导入完整的证书链我的构建文件对构建中的 jar 进行签名和时间戳
在带有 Protocol Buffers 的项目中使用 Proguard 有什么特点？

我有一个使用 Google Protocol Buffers 的项目一旦我尝试用 ProGuard 对其进行混淆似乎 protobuf 会导致问题我将所有自己的类打包成mybuildedclasses jar 谷歌代码被打包成prot
JUNIT 测试 void 方法

我有一个充满 void 方法的 java 类我想进行一些单元测试以获得最大的代码覆盖率例如我有这个方法 protected static void checkifValidElements int arg1 int arg2 metho
如何从intellij项目视图中隐藏不必要的文件？

给定一个示例 gradle 项目其项目结构如下所示正如你所看到的有很多东西你实际上不需要在想法中看到但你需要它们存在我知道下面被忽略的文件文件夹类型Editor File Types但这些正在影响库和项目 idea 会在各处忽略
删除 JFX 中选项卡后面的灰色背景

So is there any way to remove the gray area behind the tab s 我尝试过用 CSS 来做到这一点但没有找到方法要设置 tabpane 标题的背景颜色请在 CSS 文件中写入 t
如何使用Gson仅从Json反序列化某些特定字段？

我有以下 JSON 字符串 channel bvmt initValues data value instrumentIds TN0007250012 TN0007500010 instruments mnemonic ADWYA marc
使用 PC/SC 读卡器验证 Ultralight EV1

我在尝试使用 Java 中的 PC SC 读卡器特别是 ACR1222L 验证 Ultralight EV1 卡时遇到问题我能够使用 ISO 14443 3 标签的相应 APDU 在不受保护的标签上进行写入和读取但是我找不到运行 P
如何从 JavaFX 中的另一个控制器类访问 UI 元素？

我有一个使用 NetBeans 8 编写的 JavaFX Java 8 应用程序没有SceneBuilder 我的应用程序有一个主窗口该窗口有自己的 FXML 文件 primary fxml 和自己的控制器类 FXMLPrimaryCo
如何使用自定义 JDK 构建 Jenkins 项目？

我有一个常规的 Jenkins 实例运行一些多分支管道该实例在 JDK 11 上运行因为 Jenkins 并不真正支持更高版本没关系但不好的是我的所有管道似乎也都受到 Java 11 的限制 Jenkins 仅使用它自己也使用的
如何建立与 FileZilla Server 1.2.0 的 FTPS 数据连接

使用 Apache commons net 的 Java FTPSClient 进行会话恢复是一个已知问题会话恢复是 FTPS 服务器数据连接所需的一项安全功能 Apache FTPSClient 不支持会话恢复并且 JDK API 使

随机推荐

AngularJS - 如何禁用选项请求？

我注意到我的 Angular 也在每个 POST 请求之前创建 OPTIONS 请求我正在使用自定义 API 服务来处理 HTTP 请求 app service ApiService function http Process remot
Matplotlib：旋转补丁

我想在 matplotlib 中旋转一个矩形但是当我应用转换时矩形不再显示 rect mpl patches Rectangle 0 0120 0 0 1 1000 t mpl transforms Affine2D rotate de
帮我理解这段C代码 (*(void(*) ()) scode) ()

Source http milw0rm org papers 145 http milw0rm org papers 145 include
在android上以编程方式安装客户端证书而无需对话框？

我正在尝试使用以下代码以编程方式在 Android 上安装客户端证书 Intent clientCertInstall KeyChain createInstallIntent clientCertInstall putExtra KeyC
两个滚动条问题？

对此进行后续跟进post https stackoverflow com questions 7297211 jquery how can i reset the document scrollbar when i append a lay
使用 OAuth2.0 与 PHP 进行 C2DM（ClientLogin 已弃用！）

注意在您继续阅读之前请注意 C2DM 本身现已被弃用并被 GCM 取代 http developer android com guide google gcm c2dm html 原问题我们是否有用于实现 PHP 服务器端代码以使用
从整型常量表达式到空指针的转换

考虑以下代码 include
在uwp中获取我电脑中的所有进程

我在进行 UWP 开发时遇到问题在我的应用程序中我需要获取计算机中运行的所有应用程序详细信息包括其显示名称或可执行文件名称我的第一个解决方案是使用System Process类我这样做就像 private void Mybutto
如何在 clojure 中从子进程执行非阻塞读取 stdout？

我希望从 clojure 生成一个长期运行的子进程通过标准流与该进程进行通信使用conch https github com Raynes conch图书馆我可以生成并读取进程并从中读取数据out stream def my pr
您使用过“Stack”对象（.Net）在现实世界中的哪些用途

我们都读过或听说过堆栈类但我们中的许多人可能从未找到使用 LIFO 对象的理由我很想知道使用该对象的现实世界解决方案以及原因 http msdn microsoft com en us library system collection
为什么我在 Scala 中遇到 OutOfMemoryError 编译错误？

我正在开发一个 Lift 项目并尝试使用scala cc以及使用 jvm 参数的 scala 编译服务器 Xmx1024m Xss20m XX PermSize 64M XX MaxPermSize 512M XX CMSClassUnlo
Maven - 来自 java 项目的可执行文件

我需要使用 Maven 用于学校项目从单个 Maven 命令创建可执行文件我从未使用过 Maven 并在 stackoverlow 上尝试了许多解决方案该解决方案创建了一个 jar 文件但该文件从未打开这是我的项目结构 src c
在 Java 7 中如何可移植地获取文件存储的块大小？

我看过java nio file attribute Attributes and java nio file FileStore 但无法找到一种方法来发现磁盘文件的块大小这是一个article http lanai dietpizza
jQuery：有关于 jQuery Ribbon 插件的推荐吗？

我看到有几个 jQuery 插件试图重现 Microsoft 在 Word 2007 中引入的 Ribbon Fluent UI 我发现的包括 http code google com p jquery ui ribbon http cod
“[Index(['', ''], dtype='object')] 都不在 [列] 中”

我是 python 中的 panda 库出现错误 Index Dokuman Sinif dtype object 均不在列中 classes ekonomi spor teknoloji teknoloji saglik saglik
使用 SimpleXML 根据另一个属性值选择属性值[重复]

这个问题在这里已经有答案了我正在尝试使用 xml 文件和 SimpleXML 显示图像 XML 代码是
简单的 KVO 示例

我正在尝试做简单的 KVO 示例但遇到了问题这是我的 m 文件 import KVO ViewController h interface KVO ViewController property NSUInteger number en
BERT 文档嵌入

我正在尝试使用 BERT 进行文档嵌入我使用的代码是两个来源的组合我用 and BERT 词嵌入教程 https mccormickml com 2019 05 14 BERT word embeddings tutorial 下面是代
nhibernate 4.0 中的双向关系

我有一个在 NHibernate 3 1 上完美运行的代码但在 NHibernate 4 0 上却无法运行所以这就是阶级关系 public class Employee BaseEntity public Department Dep
如果字段顺序更改，Avro 架构不兼容

设想客户端使用 Avro Reflect Datum Writer 序列化 POJO 并将 GenericRecord 写入文件通过反射获得的模式是这样的注意顺序A B D C namespace storage management

如果字段顺序更改，Avro 架构不兼容

如果字段顺序更改，Avro 架构不兼容 的相关文章

随机推荐

热门标签

如果字段顺序更改，Avro 架构不兼容的相关文章