kafka-python 中的多处理

2024-02-09

我一直在使用 python-kaka 模块从 kafka 代理中消费。我想并行使用具有“x”个分区的同一主题。该文档有这样的内容：

# Use multiple consumers in parallel w/ 0.9 kafka brokers
# typically you would run each on a different server / process / CPU
 consumer1 = KafkaConsumer('my-topic',
                      group_id='my-group',
                      bootstrap_servers='my.server.com')
  consumer2 = KafkaConsumer('my-topic',
                      group_id='my-group',
                      bootstrap_servers='my.server.com')

这是否意味着我可以为我生成的每个进程创建一个单独的消费者？另外，consumer1 和consumer2 消费的消息是否会重叠？

Thanks

是的，您可以在多个线程/进程中创建多个使用者（甚至可以在不同的机器上并行运行它们）。只要所有消费者都使用相同的group.id，不会有重叠。 Kafka 将每个主题分区分配给消费者组中的单个消费者。请注意，使用多于可用主题分区的消费者将导致消费者空闲。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ApacheKafka

kafkaconsumerapi

kafkapython

kafka-python 中的多处理的相关文章

GCP Dataproc 作业未找到存储在存储桶中的 SSL pem 证书

我有一个 GCP Dataproc 集群我正在尝试部署一个 pyspark 作业该作业使用 SSL 生成一个主题 pem 文件存储在存储桶 gs dataproc kafka code code 中我正在使用下面所示的代码访问 pem
如何强制消费者读取kafka中的特定分区

我有一个应用程序用于从 1 个 Kafka 生产者生成的 URL 流中下载特定的 Web 内容我创建了一个有 5 个分区的主题有 5 个 kafka 消费者但网页下载的超时时间为 60 秒当下载其中一个 URL 时服务器会假设消
Kafka服务器未远程连接zookeeper服务器

我正在尝试将 kafka 服务器在 Windows 系统上连接到 Zookeeper 服务器我面临着 Opening socket connection to server 10 160 10 25 10 160 10 25 2181
带有 Kafka 消费者的 Spring Boot 作业调度程序

我正在开发一个 POC 我想使用来自 Kafka 主题用户的消息尝试实现消费者应该从 Kafka 主题读取消息一旦 spring boot 调度程序在预定时间或 cron 时间触发那么我们应该开始从 kafka 主题中一一消费现有
无法向 Kafka 发送大消息

我想从生产者向 Kafka 发送一条大消息因此我更改了以下属性代理服务器属性 replica fetch max bytes 317344026 message max bytes 317344026 max message byt
使用 Kafka Streams 在输出中设置时间戳无法进行转换

假设我们有一个变压器用 Scala 编写 new Transformer String V String V var context ProcessorContext override def init context Processor
KafkaStreams 同一应用程序中的多个流

我正在尝试根据 KafkaStreams 的惯例和合理性做出实用的设计决策假设我想将两个不同的事件放入其中KTables 我有一个制作人将这些消息发送给KStream那就是听那个话题据我所知我不能对消息使用条件转发KafkaStrea
如何使用 haproxy 负载均衡器 Kafka Bootstrap？

我有一个 kafka 集群由 3 台在 AWS 上运行的机器组成卡夫卡1到卡夫卡3 我正在使用新型卡夫卡消费者 gt 0 8 我知道kafka客户端连接到其中一台kafka服务器获取服务器元数据然后直接连接到代理我想确保在代理发生
动态创建消费者spring kafka

我正在创建一个与另一个服务通信的服务以便识别要收听的 kafka 主题 kafka主题可能有不同的键和值类型因此我想为每个配置主题键类型值类型动态创建不同的 kafka 消费者其中配置仅在运行时已知然而在 spring k
在SSL模式下使用apache kafka

我正在尝试在 SSL 1 way 模式下设置 kafka 我已经阅读了官方文档并成功生成了证书我将记下两种不同情况的行为此设置只有一名经纪人和一名动物园管理员案例 1 经纪人间通信明文我的相关条目server properties
安装 confluence-kafka 时“文件名或扩展名太长”？

我在使用 pip install confluence kafka 安装 confluence kafka 时遇到一些问题但我收到此错误文件名或扩展名太长详细信息如下 Collecting confluent kafka Using
如何在kafka消费组中动态添加消费者

我应该如何知道何时必须扩展消费者组中的消费者当存在快速生产者时消费者扩大规模的触发因素是什么一种直接的方法是获取消费者延迟这可以计算为提交的偏移量和开始偏移量之间的差值如果最后 n 次计算的延迟正在增加您可以扩大规模反之亦然
无法向 kafka 主题发送消息

我正在使用 Kafka Play 以及 Scala 这是我的代码我想在其中发送消息到kafka服务器主题名称是测试主题尽管我没有在主题中看到我发送的消息但我没有收到任何错误这里有什么问题吗 import kafka produc
我们如何读取给定时间范围内的Kafka主题？

我需要读取 Kafka 主题中给定时间范围内的消息我能想到的解决方案是首先找出时间范围开始的最大偏移量然后继续消费消息直到所有分区上的偏移量超过时间范围的末尾有没有更好的方法来解决这个问题谢谢好吧您肯定必须首先搜索适合时间范围
是否可以使用Kafka传输文件？

我每天都会生成数千个文件我想使用 Kafka 进行流式传输当我尝试读取该文件时每一行都被视为一条单独的消息我想知道如何将每个文件的内容作为 Kafka 主题中的单个消息以及消费者如何将 Kafka 主题中的每条消息写入单独的文件中
找不到 io.confluence:kafka-protobuf-serializer:6.0.0

直接的问题是为什么 Gradle 没有解决我添加的这个依赖关系 dependencies kafka protobuf serializer implementation io confluent kafka protobuf seria
命名 kafka 主题的最佳实践是什么？

我们是 kafka 的新手我们有几个团队正在开发一些相互发布订阅事件的应用程序由于kafka主题名称将在团队之间共享那么命名有什么最佳实践吗基本上我们不希望看到 A 团队命名主题companyname appname events
Kafka - 如何同时使用过滤器和过滤器？

我有一个 Kafka 流它从一个主题获取数据并且需要将该信息过滤到两个不同的主题 KStream
Kafka Streams - 跳跃窗口 - 去重键

我正在 4 小时窗口上进行跳跃窗口聚合每 5 分钟前进一次由于跳跃窗口重叠我得到了具有不同聚合值的重复键 TimeWindows of 240 60 1000L advanceBy 5 60 1000L 如何消除具有重复数据的重复键或
kafka 连接 s3 源无法与 Minio 一起使用

我已经验证了与 minio 的连接确保凭据工作正常并且可以访问 minio 另外如果我尝试任何其他值store url http minio 9000我无法保存配置所以我猜想在可见性方面不存在问题卡夫卡连接容器和minio容器我不确

随机推荐

需要了解 Git/Gerrit 命令（获取和推送）

我正在遵循我们 IT 部门的一个示例我想了解这个命令到底在做什么 git fetch origin refs changes refs remotes origin changes 为了提供一些参考框架这是持续集成 CI 工具的一部分
ASP 中的“~/”解析为什么：当前文件夹还是网站的根目录？

在文件路径中使用是否解析为当前文件夹或网站的根目录我有这样的文件结构 gt Folder gt Page1 Aspx gt App Themes gt Theme1 gt Images gt StyleSheet css gt Incl
根据同时在另一个字段中输入的内容自动填充字段

我试图弄清楚如何根据使用 javascript 在另一个输入字段中输入的内容自动填充输入值这是我的代码
是否有使用 Kohana 进行用户注册和登录身份验证的示例项目？

我想制作一个网络应用程序平台它可以做非常简单的事情用户可以注册获得帐户然后登录到平台我已经安装了 Kohana 如果有一个轻量级的演示项目可以利用这些东西来看看它是如何完成的那就太酷了有没有好的可用的 Gallery3 测试
使用带有注入承诺的 ngRoute 'resolve' 参数

我已经配置了resolve返回 Promise 的多个路由的参数以便延迟控制器的实例化直到 Promise 得到解决目前我使用函数符号而不是指定要注入的字符串例如 when article id templateUrl app a
从程序集中公开不同的类型名称（别名）

这个问题与一个相关我之前未回答的问题 https stackoverflow com q 22097706 409279 因为我仍在解决同样的问题但这是一种不同的方法我目前正在 C NET 项目中使用第三方 SOAP Web 服务不幸
使用 OR 运算符的 IIF 查询不起作用

我正在尝试在 MS Access 查询中运行以下内容作为条件基本上我想做的是如果 checkbox True 则显示所有记录包括那些空白或空字段的记录我的表单组合框 combo9 中的默认值为如果 checkbox False 则
使用knockoutjs虚拟元素动态创建html部分

我试图将虚拟元素与 html 绑定一起使用来动态创建 html 部分但失败并显示消息绑定 html 不能与虚拟元素一起使用这是jsfiddle http jsfiddle net d3Dpp http jsfiddle net d
设置为 0.1 的浮点数将 false 与 0.1 进行比较[重复]

这个问题在这里已经有答案了 int main float f 0 1 if f 0 1 printf True else printf False 我只是c的初学者我不明白上述程序的行为输出为假为什么 0 1 is a double文
整个应用程序中的一个 BillingClient 实例

我有一个有很多活动的应用程序其中一项活动是显示购买选项在计费库的示例应用程序中 https github com googlesamples android play billing https github com googlesam
计算流中的标准差

使用 Python 假设我正在运行已知数量的项目I 并能够计算处理每一项所需的时间t 以及处理所花费的总时间T以及迄今为止已处理的项目数量c 我目前正在即时计算平均值A T c但这可能会因为单个项目需要非常长的时间来处理几秒与几毫秒而产
使用 'document.body.scrollHeight;' 计算 UIWebView 内容动态高度在 iOS 10 中返回更大的值

我正在使用 Objective C 创建一个应用程序其中我使用的是UIWebView以 HTML 格式显示内容我正在使用下面的代码UIWebView委托方法webViewDidFinishLoad NSUInteger contentH
无法编译：节文本中无法识别重定位 0x2a

编译 make 时我收到一条错误消息 make g fopenmp o lang test main o I include Lheader I include L lib llmi lblas lboost regex lpthread
php获取接口方法

是否可以获取已实现接口的方法例如仅返回界面中的函数 bar interface iFoo public function bar class Foo implements iFoo public function bar public
在java中，是否可以将Serialized接口添加到运行时没有它的类中？

我想要序列化一个类并且它实现了 Serializable 但它包含的对象之一没有实现 Serializable 有没有办法在运行时修改类以使其实现 Serialized 接口以便我可以序列化它我无法在编译时更改它因为它是第三方库也
IEnumerable 作为 WCF 方法的返回类型

如果我定义一个具有字符串和日期时间属性的 Test 对象并使用它返回 WCF 中的 IEnumerable T 集合 OperationContract IEnumerable
如何在spyder中添加所有python库

如何在 Spyder IDE 中添加我已使用终端下载并存在于目录 home username local lib python3 6 site packages 中的所有 python 库我找到了答案只需转到工具 gt PYTHONP
聚合根引用其他聚合根

我目前正在大量使用 DDD 并且在从其他聚合根加载操作聚合根时遇到问题对于模型中的每个聚合根我还有一个存储库存储库负责处理根的持久性操作假设我有两个聚合根以及一些成员实体和值对象聚合根 1 和聚合根 2 AggregateR
在一个逗号分隔的单元格中显示所有匹配的值

我的 Excel 2010 电子表格中有两列数据 A 列中是一个类别 B 列中是一个值对于 A 列中的每个唯一类别 B 列中将有多个值我想在单独的工作表中实现的目标是在一个逗号或分号等分隔的单元格中显示每个唯一类别的所有值例如如
kafka-python 中的多处理

我一直在使用 python kaka 模块从 kafka 代理中消费我想并行使用具有 x 个分区的同一主题该文档有这样的内容 Use multiple consumers in parallel w 0 9 kafka brokers

kafka-python 中的多处理

kafka-python 中的多处理 的相关文章

随机推荐

热门标签

kafka-python 中的多处理的相关文章