如何使用相同的 APPLICATION_ID_CONFIG 运行两个或多个拓扑？

2024-06-19

我想在同一个实例上运行 2 个拓扑。 1个拓扑涉及状态存储，其他涉及全局存储。我如何成功地做到这一点？

我创建了 1 个具有 3 个分区的主题，然后在 1 个拓扑中添加了状态存储，在第二个拓扑中添加了全局存储。

拓扑1：

    public void createTopology() {
    Topology topology = new Topology();

    topology.addSource("source", new KeyDeserializer(), new ValueDeserializer(), "topic1");
    topology.addProcessor("processor1", new CustomProcessorSupplier1(), "source");

    final KeyValueStoreBuilder<Bytes, byte[]> rStoreBuilder = new KeyValueStoreBuilder<>(new RocksDbKeyValueBytesStoreSupplier("rstore"), Serdes.Bytes(), Serdes.ByteArray(), Time.SYSTEM);
    rStoreBuilder.withLoggingEnabled(new HashMap<>());

    topology.addStateStore(rStoreBuilder, "processor1");

    Properties p = new Properties();
    p.put(APPLICATION_ID_CONFIG, "stream1");
    p.put(BOOTSTRAP_SERVERS_CONFIG, KafkaUtil.getBootStrapServers());
    p.put(DEFAULT_KEY_SERDE_CLASS_CONFIG, KeySerde.class);
    p.put(DEFAULT_VALUE_SERDE_CLASS_CONFIG, ValueSerde.class);
    streams = new KafkaStreams(topology, p);
    streams.start();
}

拓扑2：

public void createTopology() {
    Topology topology = new Topology();

    final KeyValueStoreBuilder<Bytes, byte[]> rStoreBuilder = new KeyValueStoreBuilder<>(new RocksDbKeyValueBytesStoreSupplier("rstoreg"), Serdes.Bytes(), Serdes.ByteArray(), Time.SYSTEM);
    rStoreBuilder.withLoggingDisabled();

    topology.addGlobalStore(rStoreBuilder, "globalprocessname", Serdes.Bytes().deserializer(), Serdes.ByteArray().deserializer(), "topic1", "processor2", new CustomProcessorSupplier1());

    Properties p = new Properties();
    p.put(APPLICATION_ID_CONFIG, "stream1");
    p.put(BOOTSTRAP_SERVERS_CONFIG, KafkaUtil.getBootStrapServers());
    p.put(DEFAULT_KEY_SERDE_CLASS_CONFIG, KeySerde.class);
    p.put(DEFAULT_VALUE_SERDE_CLASS_CONFIG, ValueSerde.class);
    p.put(STATE_DIR_CONFIG, "/tmp/" + System.getProperty("server.port"));
    streams = new KafkaStreams(topology, p);
    streams.start();
}
}

运行单实例时：-

预期的： state-store 和 global-store 都必须包含所有键（来自 topic1 的所有输入分区的数据）

实际的：状态存储包含来自 2 个分区的数据全局存储包含来自 1 个分区的数据

当运行此代码的 2 个实例时：-

预期：两个全局存储都必须包含所有数据。 3 个分区分为 2 个状态存储并包含部分数据

实际：（S表示statestore，G表示全局存储，P表示输入数据的分区） S1 - P1 G1-P2 S2-P3 G2 - P1、P2、P3

问题在于StreamsConfig.APPLICATION_ID_CONFIG。您可以将相同的内容用于两种不同类型的应用程序。

的价值StreamsConfig.APPLICATION_ID_CONFIG用作group.id. group.id用于缩放应用程序。如果您有同一应用程序的两个实例（具有相同的group.id），他们开始处理来自分区子集的消息。

在您的情况下，您有两个不同的应用程序，但它们使用相同的StreamsConfig.APPLICATION_ID_CONFIG。为每个分区分配子集（App1：2 个分区，App2：1 个分区），并且它们仅处理整个消息的子集。它是消费者群体机制。

有关消费者组的更多信息，您可以找到：

https://www.confluence.io/blog/apache-kafka-data-access-semantics-consumers-and-membership https://www.confluent.io/blog/apache-kafka-data-access-semantics-consumers-and-membership

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

apachekafkastreams

如何使用相同的 APPLICATION_ID_CONFIG 运行两个或多个拓扑？的相关文章

Kafka Streams stateStores 容错一次？

我们正在尝试使用 Kafka Streams 实现重复数据删除服务总体而言它将使用它的rocksDB状态存储来在处理过程中检查现有的密钥如果我错了请纠正我但为了使这些 stateStore 也具有容错能力 Kafka Stream
为什么 Kafka Streams 强制对 GlobalKTable 状态存储禁用日志记录？

为什么全局表不能在 kafka 中启用日志记录 code if loggingEnabled throw new TopologyException StateStore storeName for global table must no
KafkaStreams serde异常

我正在使用 Kafka 和流技术我为 KStream 创建了一个自定义序列化器和反序列化器我将使用它来接收来自给定主题的消息现在的问题是我正在以这种方式创建一个 serde JsonSerializer
Spring Cloud Stream Kafka Streams Binder KafkaException：无法启动流：“监听器”不能为空

我是 Kafka Streams 和 Spring Cloud Stream 的新手但在将集成相关代码移至属性文件中方面阅读过有关它的好文章以便开发人员可以主要关注事物的业务逻辑方面这里我有我的简单应用程序类 package com
处理 Kafka 流中的异常

已经浏览了多个帖子但其中大多数与处理错误消息相关而不是处理它们时的异常处理我想知道如何处理流应用程序收到的消息并且处理消息时出现异常异常可能是由于多种原因造成的例如网络故障 RuntimeException 等有人可以建议什么是
Kafka Spring Cloud Stream 的多个 @EnableBinding

我正在尝试设置一个侦听 Kafka 的 Spring Boot 应用程序我正在使用 Kafka Streams Binder 用一个简单的 EnableBinding EnableBinding StreamExample StreamP
新建的 KTable 不返回任何内容

我正在尝试使用 KTable 来消费来自 Kafka 主题的事件但是它什么也没返回当我使用 KStream 时它返回并打印对象这实在是太奇怪了生产者和消费者可以在这里找到 https github com pavankjadda
了解 Kafka Streams 中处理器实现中的事务

在使用 Kafka Streams 的处理器 API 时我使用如下内容 context forward key value context commit 实际上我在这里所做的就是每分钟从状态存储发送一个状态到接收器在 init 方法中
了解 kafka 流分区分配器

我有两个主题一个有 3 个分区一个有 48 个分区最初我使用默认分配器但是当消费者 kubernetes 中的 pod 崩溃时我遇到了一些问题发生的情况是当 Pod 再次启动时它从具有 3 个分区的主题重新分配分区并从具有
从 JSON 到 Avro 的 Kafka 流

我尝试使用 Kafka Stream 将带有 String JSON 消息的主题转换为另一个主题作为 Avro 消息流主要方法 streamsConfiguration put StreamsConfig KEY SERDE CLASS
升级到 kafka-streams:5.5.0-css (Apache Kafka 2.5.0) 后获取 GlobalKTable 的存储崩溃 [已解决]

我有一个使用 GlobalKTable 的 Spring Boot 应用程序它工作正常直到从 5 3 2 css 更新到 kafka streams 5 5 0 css 与 Apache Kafka 2 5 0 兼容的 Confluen
Kafka Streams 拓扑卡在 num.stream.threads=50 和 100 个分区中

有一个拓扑 kStreamBuilder stream kafkaProperties getInboundTopicName consumed filterNot k v gt Objects isNull v transform gt
将 Kafka Streams 与依赖于标头中架构引用的 Serdes 结合使用

我正在尝试使用 Kafka Streams 对 CDC 数据执行 KTable KTable 外键联接我将读取的数据采用 Avro 格式但它的序列化方式与其他行业序列化器反序列化器例如 Confluence 架构注册表不兼容因为
我可以在 Kafka Broker 所在的同一台机器上运行 Kafka Streams 应用程序吗？

我有一个 Kafka Streams 应用程序它从几个主题获取数据并连接数据并将其放入另一个主题中卡夫卡配置 5 kafka brokers Kafka Topics 15 partitions and 3 replication fa
KTable 应该发出的事件

我正在尝试测试一个拓扑该拓扑作为最后一个节点具有 KTable 我的测试是使用成熟的 Kafka 集群通过 confluence 的 Docker 镜像所以我not使用TopologyTestDriver 我的拓扑有键值类型的输入S
KafkaStreams 同一应用程序中的多个流

我正在尝试根据 KafkaStreams 的惯例和合理性做出实用的设计决策假设我想将两个不同的事件放入其中KTables 我有一个制作人将这些消息发送给KStream那就是听那个话题据我所知我不能对消息使用条件转发KafkaStrea
Kafka Streams - 如何扩展 Kafka 存储生成的变更日志主题

我有多个冗余应用程序实例它们想要使用主题的所有事件并独立存储它们以进行磁盘查找通过rocksdb 为了便于论证我们假设这些冗余消费者正在服务无状态 http 请求因此负载不是使用 kafka 共享的而是使用 kafka 将数据从
为每个键使用主题中的最新值

我有一个 Kafka 生产者它正在以高速率生成消息消息键是用户名值是他在游戏中的当前分数 Kafka消费者处理消费消息的速度相对较慢在这里我的要求是显示最新的分数并避免显示陈旧的数据但代价是某些分数可能永远不会显示本质上对于
为什么我的 Kafka Streams 拓扑无法正确重放/重新处理？

我有一个如下所示的拓扑 KTable
从主题内的特定分区进行流式传输（Kafka Streams）

据我在阅读 Kafka Streams 文档后了解到不可能将其用于仅来自给定主题的一个分区的流数据人们总是必须阅读整个文档那是对的吗如果是这样将来是否有计划向 API 提供这样的选项不你不能这样做因为内部消费者订阅了加入通过

随机推荐

如何将两列 pandas Dataframe 移动并堆叠为一列？

我有一个下面提到的数据框 ETHNIC SEX USUBJID 0 HISPANIC OR LATINO F 16 1 HISPANIC OR LATINO M 8 2 HISPANIC OR LATINO Total 24 3 NOT H
QML MouseArea 将事件传播到按钮

我正在开发一个应用程序其菜单类似于 Android 版 Gmail 收件箱应用程序菜单基本上当您按下按钮打开菜单时它就会滑入视图用户可以将其滑开或按菜单上的按钮对于滑动我使用了代码SwipeArea from kovrov ht
为什么 Windows 命令 DIR 在搜索 *.tif 文件时也会输出 *.tiff 文件？

我想使用 Windows 命令DIR为了找到唯一TIF文件即具有扩展名的文件 tif 因此我使用以下小批处理文件 for f delims a IN dir b a d s C wolter testversion input tif d
HTML 和 JavaScript - 将滚动操作从一个元素传递到另一个元素

假设我有两个 div div div div A scrollable list div 我想让它当光标停在里面时 control并且鼠标滚轮滚动 view将会滚动无论如何要实现这一目标好的快速修复对我有用即使固定 div 不可滚动
JavaScript 访问密码字段值是否被视为存在安全风险？

如果安全正确地存储密码是良好的风格和安全性那么对于要求用户输入密码的网页来说不应该也是如此吗考虑这个例子
tf.print() vs Python print vs tensor.eval()

看来在Tensorflow中至少有三种方法可以打印出张量的值我一直在读here https www freecodecamp org news debugging tensorflow a starter e6668ce72617 an
(0, eval) () 的作用是什么？ [复制]

这个问题在这里已经有答案了以下内容来自这个问题 https stackoverflow com questions 14119988 return this 0 evalthis 14120023 14120023 function q
如何在 iOS 中通过 Twitter API 获取用户电子邮件地址？

我尝试了多个 SDK 但无法从任何资源获取电子邮件 ID 我努力了FHSTwitterEngine为此目的但我没有得到解决方案 FHSTwitterEngine twitterEngine FHSTwitterEngine sharedE
从 R 中的 HTTPS 连接逐行读取

当创建连接时open r 它允许逐行读取这对于批量处理大数据流非常有用例如这个脚本 https gist github com jeroenooms d33a24958d99bb969ac0通过一次读取 100 行来解析相当大的 gzi
实时战略战争游戏人工智能算法

我正在设计一款实时策略战争游戏其中 AI 将负责控制大型六边形地图上的大量单位可能超过 1000 个一个单位有许多行动点可以用于移动攻击敌方单位或各种特殊行动例如建造新单位例如一辆拥有 5 个行动点的坦克可以花费 3 个行动
Primefaces 进度条未更新？

我的进度条没有更新为什么控制器方法被按其应有的方式调用并且进程变量被正确递增 XHTML
条件必须具有 bool 静态类型

有什么方法可以在这种情况下使用未来的布尔值或者有更好的方法吗 Widget buildRow String pair final Future
Codeigniter URL：如何在 URL 中显示 id 和文章标题

请看下面的链接结构 http stackoverflow com questions 10672712 voting system like stackoverflow 在上面的链接中10672712我猜是问题 ID 因为如果您检查以下链接
Paypal IPN 发送“待处理”并以“多币种”为理由？

我正在使用 Paypal IPN 从我的网站收款该网站目前仅处于开发阶段因此我建立了一个沙盒网站进行测试并且我已经通过在英国注册的测试帐户非常成功地以英镑货币我的居住国货币进行付款但是我希望该网站能够检测访问者的原籍国并允许他
停止前台运行的服务的正确方法是什么

我正在尝试停止作为前台服务运行的服务当前的问题是当我打电话时stopService 通知仍然保留因此在我的解决方案中我添加了一个接收器我正在将其注册到onCreate 在的里面onReceive 我调用的方法stopforegr
DBpedia 数据集中的哪个 .nt 文件包含有关 DBpedia 类的三元组？

我正在处理 DBpedia 数据集并使用 Apache Jena 在本地 Jena TDB 数据集上执行 SPARQL 我只下载了部分文件数据库百科下载 http wiki dbpedia org Downloads38这样我就可以将数据
ReferenceError 和全局对象

在浏览器中的 JavaScript 中window是全局对象这意味着在全局范围内定义的每个变量都是window 那么为什么我会得到这个结果 console log window foo No error logs undefined co
UIStackView分布均匀填充

所以我有一个UIStackView其中包含四 4 UIViews 如果我删除其中一 1 个UIViews 其他三 3 个将填满UIStackView 我的问题如何添加最大高度UIView这样它就不会填满整个空间UIStackView即使
firebase createUser 无需登录[重复]

这个问题在这里已经有答案了我的管理员用户可以创建其他用户但每次创建用户时我的管理员用户都会注销新用户会自动登录有什么方法可以在不登录的情况下创建用户吗 None
如何使用相同的 APPLICATION_ID_CONFIG 运行两个或多个拓扑？

我想在同一个实例上运行 2 个拓扑 1个拓扑涉及状态存储其他涉及全局存储我如何成功地做到这一点我创建了 1 个具有 3 个分区的主题然后在 1 个拓扑中添加了状态存储在第二个拓扑中添加了全局存储拓扑1 public void c

如何使用相同的 APPLICATION_ID_CONFIG 运行两个或多个拓扑？

如何使用相同的 APPLICATION_ID_CONFIG 运行两个或多个拓扑？ 的相关文章

随机推荐

热门标签

如何使用相同的 APPLICATION_ID_CONFIG 运行两个或多个拓扑？的相关文章