对 Kafka 的一次性语义感到困惑

2024-04-04

所以我一直在阅读关于卡夫卡的一次语义，我对它的工作原理有点困惑。

我了解生产者如何避免发送重复消息（以防来自代理的确认失败），但我不明白的是，在消费者处理消息但在提交偏移量之前崩溃的情况下，exactly-once 是如何工作的。在这种情况下kafka不会重试吗？

这就是我think你的意思是：

消费者 X 看到记录 Y，并对其进行“操作”，但不提交其偏移量
消费者 X 崩溃（仍然没有提交其偏移量）
消费者 X 启动备份，被重新分配相同的分区（不保证）并最终再次看到记录 Y

这是完全可能的。然而，对于 kafka 来说，只有一次“工作”，所有副作用（状态、输出）也必须进入同一个 kafka 集群。所以接下来会发生什么：

消费者X开始一笔交易
消费者 X 看到记录 Y，发出一些输出记录 Z（作为 1 中开始的事务的一部分）
消费者 X 崩溃。在充当事务协调器的代理“回滚”（简化）之后不久，事务从 1 开始，这意味着其他 kafka 消费者将不会看到记录 Z
消费者 X 启动备份，被分配与之前相同的分区，启动新事务
消费者 X 再次看到记录 Y，发出记录 Z2（作为 4 中开始的事务的一部分）
一段时间后，消费者 X 提交其偏移量（作为 4 中事务的一部分），然后提交该事务
记录 Z2 对下游消费者可见。

如果你在同一个 kafka 集群之外有副作用（比如你在 mysql 中插入一行而不是记录 Z），那么没有通用的方法可以让 kafka 一次性为你工作。您需要依靠老式的重复数据删除和幂等性。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ApacheKafka

对 Kafka 的一次性语义感到困惑的相关文章

尝试升级到 flink 1.3.1 时出现异常

我尝试将集群中的 flink 版本升级到 1 3 1 以及 1 3 2 但我的任务管理器中出现以下异常 2018 02 28 12 57 27 120 ERROR org apache flink streaming runtime tas
如何使用不同的kafka主题配置Kubernetes部署的微服务的每个pod/进程？

在我们的应用程序中有多个不同 kafka 主题的消费者例如 Cosumer C1 Cosumer C2 Cosumer C3 Cosumer C4 Cosumer C5 以及不同的 kafka 主题例如主题 1 主题 2 主题 3 主
带有 Kafka 消费者的 Spring Boot 作业调度程序

我正在开发一个 POC 我想使用来自 Kafka 主题用户的消息尝试实现消费者应该从 Kafka 主题读取消息一旦 spring boot 调度程序在预定时间或 cron 时间触发那么我们应该开始从 kafka 主题中一一消费现有
Kafka 中的“__consumer_offsets”主题是什么

当我运行此命令时我得到 2 个主题我知道我创建了测试主题但我看到了一个名为 consumer offsets 的附加主题从名称上看它与消费者抵消有关但它是如何使用的呢 bin kafka topics sh list zooke
无法对 @KafkaListener 带注释的方法进行单元测试

我正在尝试在 Spring 中对 kafka 消费者类进行单元测试我想知道如果 kafka 消息发送到它的主题则侦听器方法被正确调用我的消费者类注释如下 KafkaListener topics kafka topics myTopi
Kafka的消息键有什么特别的地方吗？

我没有看到任何提及消息键 org apache kafka clients producer ProducerRecord key 除了它们可以用于主题分区我可以自由地将我喜欢的任何数据放入密钥中还是有一些我应该遵守的特殊语义该密钥似
使用 Kafka Streams 在输出中设置时间戳无法进行转换

假设我们有一个变压器用 Scala 编写 new Transformer String V String V var context ProcessorContext override def init context Processor
Spark：将 bytearray 转换为 bigint

尝试使用 pyspark 和 Spark sql 将 kafka 键二进制字节数组转换为 long bigint 会导致数据类型不匹配无法将二进制转换为 bigint 环境详情 Python 3 6 8 Anaconda custo
带有 kafka-avro-console-consumer 的未知魔法字节

我一直在尝试将 Confluence 中的 kafka avro console consumer 连接到我们的旧版 Kafka 集群该集群是在没有 Confluence Schema Registry 的情况下部署的我使用以下属性显式
如何使用 haproxy 负载均衡器 Kafka Bootstrap？

我有一个 kafka 集群由 3 台在 AWS 上运行的机器组成卡夫卡1到卡夫卡3 我正在使用新型卡夫卡消费者 gt 0 8 我知道kafka客户端连接到其中一台kafka服务器获取服务器元数据然后直接连接到代理我想确保在代理发生
动态创建消费者spring kafka

我正在创建一个与另一个服务通信的服务以便识别要收听的 kafka 主题 kafka主题可能有不同的键和值类型因此我想为每个配置主题键类型值类型动态创建不同的 kafka 消费者其中配置仅在运行时已知然而在 spring k
在 WSL2 中通过 IDE 连接到 kafka 服务器时出错

我无法通过在 Windows 上运行的 intellij 或 vscode 连接到在 ubuntu 上运行的 kafka 服务器我在 WSL2 上尝试的第一个服务器我什至尝试使用虚拟机的IP 但没有成功据我了解我们应该能够根据此文档
安装 confluence-kafka 时“文件名或扩展名太长”？

我在使用 pip install confluence kafka 安装 confluence kafka 时遇到一些问题但我收到此错误文件名或扩展名太长详细信息如下 Collecting confluent kafka Using
无法初始化类 io.confluence.kafka.schemaregistry.client.rest.RestService

我正在尝试使用 KafkaAvroSerialzer 设置一个卡夫卡生产者以获得价值当 rit 尝试创建生产者时我遇到了这个错误我正在使用 confluence 5 2 1 中提供的所有罐子 java lang NoClassDefF
Kafka 0.8.2 中是否可以向现有主题添加分区

我有一个Kafka https kafka apache org 集群运行有 2 个分区我一直在寻找一种将分区计数增加到 3 的方法但是我不想丢失有关该主题的现有消息我尝试停下来Kafka https kafka apache or
即使在kafka机器重新启动后，如何保留kafka保留字节和kafka保留段[重复]

这个问题已经存在了 we set retention bytes价值 104857600对于主题 topic test root confluent01 kafka topics zookeeper localhost 2181 alter
Apache Kafka 与 Apache Storm

Apache Kafka 分布式消息系统Apache Storm 实时消息处理我们如何在实时数据管道中使用这两种技术来处理事件数据就实时数据管道而言在我看来两者的工作都是相同的我们如何在数据管道上使用这两种技术您可以使用 Apa
是否可以使用Kafka传输文件？

我每天都会生成数千个文件我想使用 Kafka 进行流式传输当我尝试读取该文件时每一行都被视为一条单独的消息我想知道如何将每个文件的内容作为 Kafka 主题中的单个消息以及消费者如何将 Kafka 主题中的每条消息写入单独的文件中
Kafka：隔离级别的影响

我有一个用例我需要 Kafka 分区中的 100 可靠性幂等性无重复消息以及顺序保留我正在尝试使用事务 API 来建立概念验证来实现这一目标有一个名为 isolation level 的设置我很难理解 In this arti
在spark-kafka中使用schema将ConsumerRecord值转换为Dataframe

我正在使用 Spark 2 0 2 和 Kafka 0 11 0 并且我正在尝试在火花流中使用来自卡夫卡的消息以下是代码 val topics notes val kafkaParams Map String Object bootst

随机推荐

如何从数据属性中获取数据键名称？

我想从我的 html 元素中获取键名示例代码 td 220 td 使用 jquery 数据方法我可以键值但我想提取键名称 var keyValue td data code 123 var keyName 您可以通过以下方式访问所有数据
将披露按钮添加到 MKPointAnnotation

为了在 Storyboard iOS 项目中创建地图注释我使用了 CLLocationCoordinate2D annotationCoord3 annotationCoord3 latitude 34 233129 annotation
将类保存到 qsettings [重复]

这个问题在这里已经有答案了我有一个 QObject 类它有一个 Unit 成员保存抱怨无法保存单位 26 04 12 53 21 W QVariant save unable to save type Unit type id 136
supabase.auth.getUser() 在 vue-router 路由防护上返回错误

我正在尝试构建一个使用 Supabase 身份验证的 Vue 应用程序在路由器文件中的一个路由防护中我实现了supabase auth getUser 为了检索阻止条件的用户登录状态next 在用户通过身份验证之前执行 Route gu
可以使用 ClientRowTemplate() Kendo UI 网格而不构建字符串吗？

The example http demos kendoui com web grid rowtemplate html在 Kendo UI 网格中使用 ClientRowTemplate 使用令人讨厌的 HTML 字符串 ClientRo
如何在 Visual Studio Code 上启动带有包声明的 Java 项目？

我正在 Visual Studio Code 上学习 Java 我已经在其中安装了 Microsoft Extension for Java 我的基本 Java 程序无需包声明即可正常运行但我想打包我的程序如何早些时候我使用 Inte
如何修复 WSL 上 Ruby Gems 安装程序的错误？

我尝试使用 RubyGems 安装软件包请注意我使用适用于 Linux 的 Windows 子系统我打算安装 Jekyll 包 I typed gem install jekyll 之后就出现了一个错误 Building native
定义一个调用另一个 emacs 命令的 emacs 命令（保留交互式内容）

如何定义一个 emacs 命令 X 执行某些操作然后调用另一个 emacs 命令 Y 并复制命令 Y 的交互界面我想定义查询替换的替代版本并临时切换大小写折叠搜索的值 defun alt query replace a b c d e
使用 awk 打印匹配键的列范围

这似乎有一个简单的解决方案但我被困住了我想在密钥文件中查找主文件的第二列对于任何匹配的密钥仅打印前两列但打印其余的整个记录我有一个工作脚本但它打印匹配键的整行你能帮忙吗 awk FNR NR key 1 next 2 in
通过在shouldInterceptRequest中向WebResourceRequest的标头添加标头来向WebView添加自定义标头不起作用

我需要向 WebView 中加载的页面添加自定义标头但它不起作用标头未设置 Override public WebResourceResponse shouldInterceptRequest WebView view WebResou
以编程方式扩展 iOS 词典应用词典

Apple App Store 中有一个应用程序可以下载自定义词典并以编程方式将它们添加到 iOS 的内置 Dictionary app 中无需用户干预它可以正常使用库存 ROM 即不需要越狱或任何此类操作我想知道这怎么可能因为苹果
如何将uiviewcontroller的视图作为内容视图添加到uitableviewcell？

我想添加一个视图控制器视图它有一个按钮和几个标签作为 uitableviewcell 的内容视图虽然我可以添加但按钮操作会导致崩溃 MyViewController controller MyViewController alloc
使用 DTE 激活 Visual Studio 的输出窗口

我创建了一个自定义输出窗口窗格 for my VSPackage 使用此代码 Creating Output Window for our package IVsOutputWindow output GetService typeof S
iOS xcode 5 crashlytics 错误 - Shell 脚本调用错误 - ./Crashlytics.framework/run：权限被拒绝

我已将 Crashlytics Framework 添加到我的项目中并带有一个脚本运行脚本外壳 bin sh 脚本 Crashlytics framework run KEY HERE 当我尝试运行该项目时出现以下错误 Shell
在 PHP 中合并两个数组作为键值对

我有两个相同大小的数组我想将两者合并以便其中一个的值是新数组的键索引而新数组的值是另一个的值现在我只是循环遍历数组并手动创建新数组但我感觉有一种更优雅的方法可以解决此问题我没有看到任何用于此目的的数组函数但也许我错过了一些东
在 WPF 中验证密码框

有没有办法在验证 PasswordBox 时在 AdornedElementPlaceholder 中显示错误消息我有这样的事情
关于在 UISlider 中显示连续滑块值

这就是我想用 UI Slider 做的事情我有一堆带有时间的文件我根据滑块值显示它们问题是我想在用户更改移动滑块时显示滑块值换句话说当用户移动滑块时而不是之后该值应该改变并显示在屏幕上谁能告诉我该怎么做吗 Thanks
Windows Mobile：通过 C# 使用手机摄像头

我想展示手机摄像头在 WinForm 中的控件的图像我的想法是我的应用程序就像相机的程序一样工作我想显示图像就像用户要拍照一样我怎样才能做到这一点我可以这样做吗如果您需要更多详细信息请询问我谢谢你不太确定您需要什么但您可
是否可以专门研究静态生命周期？

我想专攻 static str from a str use std borrow Cow struct MyString inner Cow lt static str gt impl From lt static str gt for
对 Kafka 的一次性语义感到困惑

所以我一直在阅读关于卡夫卡的一次语义我对它的工作原理有点困惑我了解生产者如何避免发送重复消息以防来自代理的确认失败但我不明白的是在消费者处理消息但在提交偏移量之前崩溃的情况下 exactly once 是如何工作的在这种情况下k

对 Kafka 的一次性语义感到困惑

对 Kafka 的一次性语义感到困惑 的相关文章

随机推荐

热门标签

对 Kafka 的一次性语义感到困惑的相关文章