重试来自 Kafka 死信队列的消息的最佳实践是什么

2024-03-27

我们使用 Kafka 作为微服务之间的消息传递系统。我们有一个 kafka 消费者监听一个特定的主题，然后将数据发布到另一个主题中，由 Kafka Connector 接收，Kafka Connector 负责将其发布到某些数据存储中。

我们使用 Apache Avro 作为序列化机制。

我们需要启用 DLQ 来为 Kafka Consumer 和 Kafka Connector 添加容错能力。

由于多种原因，任何消息都可能转移到 DLQ：

格式错误
Bad Data
对大量消息进行限制，因此某些消息可能会移至 DLQ
由于连接问题，发布到数据存储失败。

对于上述第 3 点和第 4 点，我们想再次从 DLQ 重试消息。

同样的最佳实践是什么。请指教。

仅推送导致不可重试错误的 DLQ 记录，即：示例中的点 1（格式错误）和点 2（数据错误）。对于 DLQ 记录的格式，一个好的方法是：

将与原始记录完全相同的 kafka 记录值和密钥推送到 DLQ，不要将其包装在任何类型的信封内。这使得在故障排除期间使用其他工具重新处理变得更加容易（例如使用新版本的解串器等）。
add a bunch of Kafka header to communicate meta-data about the error, a few typical examples would be:
- 该记录的原始主题名称、分区、偏移量和 Kafka 时间戳
- 异常或错误消息
- 未能处理该记录的应用程序的名称和版本
- 错误发生时间

通常，我为每个服务或应用程序使用一个 DLQ 主题（不是每个入站主题使用一个 DLQ 主题，也不是跨服务共享的主题）。这往往会使事情保持独立且易于管理。

哦，您可能想对 DLQ 主题的入站流量进行一些监控和警报；）

恕我直言，第 3 点（高容量）应该通过某种自动缩放来处理，而不是通过 DLQ 来处理。尝试始终高估（稍微）输入主题的分区数量，因为您可以启动服务的最大实例数量受此限制。过多的消息不会使您的服务超载，因为 Kafka 消费者在决定时会显式轮询更多消息，因此他们请求的消息永远不会超出应用程序可以处理的范围。如果出现消息高峰，会发生什么，它们会继续堆积在上游 kafka 主题中。

应直接从源主题重试第 4 点（连接），而不涉及任何 DLQ，因为错误是暂时的。将消息丢弃到 DLQ 并拾取下一条消息并不能解决任何问题，因为连接问题仍然存在，并且下一条消息也可能会被丢弃。读取或不读取来自 Kafka 的记录并不会使其消失，因此存储在那里的记录以后很容易再次读取。您可以对服务进行编程，使其仅在成功将结果记录写入出站主题时才前进到下一个入站记录（请参阅 Kafka 事务：读取主题实际上涉及到write操作，因为新的消费者偏移量需要被持久化，所以你可以告诉你的程序将新的偏移量和输出记录作为同一原子事务的一部分持久化）。

Kafka 更像是一个存储系统（只有 2 个操作：顺序读取和顺序写入），而不是消息队列，它擅长持久化、数据复制、吞吐量、规模……（……还有炒作；））。它往往非常适合将数据表示为事件序列，如“事件溯源”。如果此微服务设置的需求主要是异步点对点消息传递，并且如果大多数场景宁愿支持超低延迟并选择丢弃消息而不是重新处理旧消息（如列出的 4 点所示），也许像Redis队列这样的有损内存队列系统更合适吗？

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ApacheKafka

errorhandling

重试来自 Kafka 死信队列的消息的最佳实践是什么的相关文章

CakePHP：控制台命令中的自定义错误报告

我们当前使用 CakePHP 2 4 7 和自定义错误处理程序自定义错误处理程序适用于通过 HTTP 或 CronDispatcher 发出的每个请求不幸的是当向我们的控制台命令之一发出控制台请求时错误处理程序被忽略请参见以下示例
具有替代方案的重载方法值表

我有编译器抱怨的以下代码 val state KTable String String builder table BARY PATH Materialized as PATH STORE 错误信息 error home developer
从PHP7.4升级到PHP8，是否可以忽略某些错误

我们有一个巨大的代码库在访问未定义的变量或数组键时我们忽略了 php7 的通知例如 somethingThatMayNotExist REQUEST somethingThatMayNotExist PHP8 现在会抛出错误我知道我
（定义一个宏）方便OpenGL命令调试？

有时插入条件打印和检查需要很长时间glGetError 使用二分搜索的形式来缩小范围其中第一个函数调用是 OpenGL 首先报告错误我认为如果有一种方法可以构建一个宏我可以包装所有可能失败的 GL 调用并有条件地调用那就太酷了gl
动态创建消费者spring kafka

我正在创建一个与另一个服务通信的服务以便识别要收听的 kafka 主题 kafka主题可能有不同的键和值类型因此我想为每个配置主题键类型值类型动态创建不同的 kafka 消费者其中配置仅在运行时已知然而在 spring k
警告：implode() [function.implode]：传递的参数无效

我收到以下错误警告 implode function implode 在第 1335 行的 wp content themes mytheme functions php 中传递的参数无效 at function my get tags
在 WSL2 中通过 IDE 连接到 kafka 服务器时出错

我无法通过在 Windows 上运行的 intellij 或 vscode 连接到在 ubuntu 上运行的 kafka 服务器我在 WSL2 上尝试的第一个服务器我什至尝试使用虚拟机的IP 但没有成功据我了解我们应该能够根据此文档
如何在kafka消费组中动态添加消费者

我应该如何知道何时必须扩展消费者组中的消费者当存在快速生产者时消费者扩大规模的触发因素是什么一种直接的方法是获取消费者延迟这可以计算为提交的偏移量和开始偏移量之间的差值如果最后 n 次计算的延迟正在增加您可以扩大规模反之亦然
PHP 警告：模块“imagick”已在第 0 行未知加载

我有一个简单的测试文件其中唯一的 php 代码是 if isset REQUEST back back back REQUEST back filename images back jpg file file exists filenam
如何重定向到外部404页面Python Flask

我正在尝试将 404 重定向到外部 URL 如下所示 app route 404 def http error handler error return flask redirect http www exemple com 404 404
即使在kafka机器重新启动后，如何保留kafka保留字节和kafka保留段[重复]

这个问题已经存在了 we set retention bytes价值 104857600对于主题 topic test root confluent01 kafka topics zookeeper localhost 2181 alter
如何在node-mysql查询后获取警告

如何获取查询执行后识别的相应警告如下所示 connection query squery function err rows search for OkPacket in 2 dimension array var warningCoun
隐藏错误报告窗口

我有以下问题我的 ASP Net 应用程序接收简单控制台程序的 C 源代码使用 cl exe 命令行 VC 编译器对其进行编译并使用 System Diagnostics Process 运行它 ASP Net应用程序运行在PC上
web请求超时处理？

HttpWebRequest request HttpWebRequest WebRequest Create url request Timeout 20000 using WebResponse response request Get
PHP 构造函数返回 NULL

我有这个代码是否有可能User对象构造函数以某种方式失败以便 this gt LoggedUser被分配了一个NULL构造函数返回后值和对象被释放吗 this gt LoggedUser NULL if SESSION verbiste
将 PHP 错误处理程序限制为特定命名空间

PHP 有没有办法只为特定的命名空间设置错误处理程序我正在构建一个小型框架我希望能够通过设置自定义错误处理程序并抛出异常来尝试捕获其名称空间内的所有错误警告通知消息在此特定名称空间之外触发的错误应该以常规方式表现用PHP可以完成
Kafka 适合运行公共 API 吗？

我有一个想要发布的事件流它被划分为主题不断更新需要水平扩展并且没有 SPOF 很好并且可能需要在某些情况下重播旧事件所有的功能似乎都与 Kafka 的功能相匹配我想通过任何人都可以连接并获取事件的公共 API 将其发布到全世界
Kafka REST 代理 API 有哪些好处？

我不知道Kafka REST Proxy API的优点它是一个 REST API 所以我知道它对于管理来说很方便人们为什么使用 Kafka REST 代理 API 添加对生产者或消费者的 Maven 依赖是否很麻烦另外我知道kafk
如何处理 Primefaces 延迟加载中的错误？

我无法让用户知道发生的异常PrimeFaces http primefaces org LazyDataModel load方法我正在从数据库加载数据当引发异常时我不知道如何通知用户我尝试添加FacesMessage to Face
在 try 中使用零合并运算符？ for 抛出并返回可选值的函数

我想在以下两种情况下使用 nil coalescing 运算符设置默认值函数抛出错误函数返回 nil 请看一下下面的代码片段我有以下问题为什么 item1 为零 item1和item2的初始化有什么区别 enum VendingMa

随机推荐

检查 Windows C/C++ 中的文件夹/文件是否隐藏/系统

我正在使用 C STL Boost 编写一个跨平台应用程序我意识到它们没有提供一种方法来检查文件夹或文件是否隐藏或者是 Windows 中的系统文件在 Windows 的 C C 中执行此操作的最简单方法是什么理想情况下我有一个带有
从 python Fabric 执行远程 bash 命令时“转义”$

所以我尝试通过 python Fabric 脚本自动设置 arch linux 实例如下所示 from fabric api import run sudo def server setup communityrepo run echo
mingw 应用程序中的清单被忽略

我有一个老式的 Windows GDI 应用程序用 C 编写正在使用 Mingw 工具链进行编译我的一些用户一直在抱怨 Windows Vista 和 Windows 7 的虚拟存储其中写入应用程序不应访问的目录的文件会被抽走并存储
可以在 UIWebView 中使用 iframe 吗？

我想在我的应用程序中添加一个类似 facebook 的按钮在developer facebook com 中我对此无能为力是否可以在 UIWebView 中使用 facebook 创建的 iframe 之类的按钮它认为如果可能的话我可
Android Studio 模拟器不断冻结、崩溃并且根本没有响应

我是一名 Android 开发新手最近遇到了一些问题我不知道这是我的硬件问题还是 Android Studio 的问题但模拟器一直冻结或没有响应前 2 天 Android Studio 运行良好但是之后它无法运行我的应用程序我
使用python 3.7创建pipenv虚拟环境时出错

我的操作系统是 ubuntu 20 04 默认的 python 是 3 8 2 我正在尝试使用 Pipenv 和 python 3 7 创建一个虚拟环境当我运行时出现以下错误pipenv install python 3 7 Creati
C++ 将时间字符串转换为纪元的秒数

我有一个具有以下格式的字符串 2010 11 04T23 23 01Z Z 表示时间为 UTC 我宁愿将其存储为纪元时间以便于比较推荐的方法是什么目前经过快速搜索最简单的算法是 1
Google App Engine 中的 Spring Boot 应用程序无法连接到 Cloud SQL

我不确定我还缺少什么但我的应用程序一开始就失败了 Message The connection attempt failed at org flywaydb core internal jdbc JdbcUtils openConnect
可以使用reduceBykey来更改类型和组合值-Scala Spark吗？

在下面的代码中我尝试组合值 val rdd org apache spark rdd RDD String Double sc parallelize List a 1 0 a 3 0 a 2 0 val reduceByKey rdd
SQL：HAVING 子句

请看下面的SQL语句 SELECT datediff d MAX invoice date Now As Date Diff MAX invoice date AS max invoice date customer number AS c
用 C、C++ 检测 Windows 或 Linux [重复]

这个问题在这里已经有答案了我正在编写一个跨平台程序我希望这个程序能够在 Windows 和 Linux 下运行因此我为这两个平台准备了两个不同的代码段如果操作系统是Windows 我希望第一个代码段运行如果是Linux 那么我希望
Openlayers 3 将 EPSG:4326 矢量重新投影到 EPSG:3857

我需要将 GeoJSON 矢量数据从 EPSG 4326 转换为 EPSG 3857 我有一张地图 var olMapDiv document getElementById olmap control map new ol Map targ
ElasticSearch 在 Groovy 脚本中获得时间

我的应用程序使用此脚本来提升索引中最新的项目 5 3 16 pow 10 11 abs time doc date date getMillis 0 2 1 0 它是用 MVEL 编写的但从 1 3 开始 Groovy 已弃用 MVEL
Selenium：如何使用相同的类名选择第n个按钮

我正在尝试使用 css 类 btnProceed 选择第三个按钮
编写一个程序来交换整数中的奇数位和偶数位，所需的最少步骤是多少？

我正在尝试解决这个问题我的代码如下 include
函数访问全局变量

我正在开发一个基于文本的游戏以便更多地练习 Python 我将游戏的设置部分变成了一个函数这样我就可以最小化该函数并消除混乱因此如果我想更改某些设置变量我可以调用它但是当我将它们全部放入一个函数中时我意识到该函数无法更改全局
PostGIS多边形之间的递归交集

我正在尝试在空间表中的所有多边形之间执行递归交集并获取生成的多多边形以及有关每个多边形的每个交集的信息 An image not really in scale to explain it 假设有A B C表格中的正方形我想要A B
如何从 symfony2/php 中的字符串创建 DateTime 对象

在数据库表中我有几个字段datetime作为字段类型所以我只需要将数据保留为日期时间对象从表单中我得到日期时间作为字符串 2012 10 05 17 45 54 现在当我坚持我的实体时我会收到以下错误致命错误在非对象上调用成员
包 android.support.v4.app 不存在；在Android Studio 0.8中

我最近将 android studio IDE 更新至 0 8 以与新的 android L SDK 配合使用首先我导入了一个已完成的 android 项目该项目在旧版本的 android studio 中没有收到任何错误在版本 0
重试来自 Kafka 死信队列的消息的最佳实践是什么

我们使用 Kafka 作为微服务之间的消息传递系统我们有一个 kafka 消费者监听一个特定的主题然后将数据发布到另一个主题中由 Kafka Connector 接收 Kafka Connector 负责将其发布到某些数据存储中我们

重试来自 Kafka 死信队列的消息的最佳实践是什么

重试来自 Kafka 死信队列的消息的最佳实践是什么 的相关文章

随机推荐

热门标签

重试来自 Kafka 死信队列的消息的最佳实践是什么的相关文章