Kafka——集群

2023-11-18

文章目录

集群

集群

对于kafka来说，一个单独的broker意味着kafka集群中只有一个节点。要想增加kafka集群中的节点数量，只需要多启动几个broker实例即可，为了有更好的理解，现在我们在一台机器上同时启动三个broker实例。

1. 搭建个集群

建立好2个broker的配置文件：

cp config/server.properties config/server-1.properties
cp config/server.properties config/server-2.properties

针对配置文件进行修改：
server-1.properties

#broker.id属性在kafka集群中必须要是唯一
broker.id=1
#kafka部署的机器ip和提供服务的端口号
listeners=PLAINTEXT://192.168.65.60:9093   
log.dir=/usr/local/data/kafka-logs-1
#kafka连接zookeeper的地址，要把多个kafka实例组成集群，对应连接的zookeeper必须相同
zookeeper.connect=192.168.65.60:2181

config/server-2.properties:

broker.id=2
listeners=PLAINTEXT://192.168.65.60:9094
log.dir=/usr/local/data/kafka-logs-2
zookeeper.connect=192.168.65.60:2181

确定这两个实例：

bin/kafka-server-start.sh -daemon config/server-1.properties
bin/kafka-server-start.sh -daemon config/server-2.properties

现在我们创建一个新的topic，副本数设置为3，分区数设置为2：

bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 3 --partitions 2 --topic my-replicated-topic

查看一下topic的情况：

bin/kafka-topics.sh --describe --zookeeper localhost:2181 --topic my-replicated-topic

在这里插入图片描述

leader节点负责给定partition 的所有读写请求，同一个topic不同分区的leader副本一般不一样（为了容灾）。比如图上一共有两个分区，分区1的leader在broker11，分区0的leader在broker0。
replicas 表示某个partition在哪几个broker上存在备份。不管这几个点是不是“leader”，甚至这个节点挂了，也会列出。
isr 是replicas的一个子集，它只列出当前还存活着的，并且已同步备份了该partition的节点。

2. 集群发送消息

现在我们向新建的 my-replicated-topic 中发生了一些message，kafka集群可以加上所有kafka节点：

./kafka-console-producer.sh --broker-list localhost:9092,localhost:9093,localhost:9094 --topic my-replicated-topic

现在我们向新建的 my-replicated-topic 中发送一些message，kafka集群可以加上所有kafka节点：

./kafka-console-consumer.sh --bootstrap-server localhost:9092,localhost:9093,localhost:9094 --from-beginning --topic my-replicated-topic

现在我们来测试我们容错性，因为broker1目前是my-replicated-topic的分区0的leader，所以我们要将其kill：

ps -ef | grep server.properties ## 找到broker进程。
kill 48028 ## 杀死掉

现在执行命令：

bin/kafka-topics.sh --describe --zookeeper localhost:9092 --topic my-replicated-topic

在这里插入图片描述
我们可以看到，分区0的leader节点已经变成了broker0.要注意的是，在isr中，已经没有1号节点，leader的选举也是从ISR（in-sync replica）中进行的。
此时，我们依然可以消费消息：

bin/kafka-console-consumer.sh --bootstrap-server localhost:9092,localhost:9093,localhost:9094 --from-beginning --topic my-replicated-topic
my test msg 1
my test msg 2

查看主题分区对应的leader信息：
在这里插入图片描述
kafka将很多集群关键信息记录在zookeeper里，保证自己的无状态，从而在水平扩容时非常方便。

3. 集群消费

log的partitions分布在kafka集群中不同的broker上，每个broker可以请求备份其他broker上partition上的数据。kafka集群支持配置一个partition备份的数量。
针对每个partition，都有一个broker起到“leader”作用，0个或多个其他的broker作为“follwers”的作用。leader处理所有的针对这个partition的读写请求，而followers被动复制leader的结果，不提供读写（主要是为了保证多副本数据与消费的一致性）。如果这个leader失效了，其中的一个follower将会自动的变成新的leader。

3.1 Procuder

生产者将消息发送到topic中去，通知负责选择message发送到topic的哪一个partition中。通过round-robin做简单的负载均衡。也可以根据消息中的某个关键字来进行区分。通常第二种方式使用的更多。

3.2 Consumer

传统的消息传递模式有2中：队列（queue）和（publish-subscribe）

queue模式：多个consumer从服务器中读取数据，消息只会到达一个consumer。
publish-subscribe模式：消息会被广播给所有的consumer。

kafka基于这2中模式提供了一种consumer的抽象概念：consumer-group

queue模式：所有的consumer都位于同一个consumer group 下
publish-subscribe模式：所有的consumer都有着自己唯一的consumer group

上图说明：由2个broker组成的kafka集群，某个主题总共有4个partition（P0-P3），分别位于不同的broker上。这个集群由2个consumer group消费，A有2个consumer instances，B有4个。
通常一个topic 会有几个consumer group。每个consumer group 都是一个逻辑上的订阅者（logical subscriber）。每个consumer group 有多个consumer instance组成，从而达到可扩展和容灾的功能。

4. 消费顺序

一个partition同一时刻在一个consumer group 中只能有一个consumer instance消费，从而保证消费顺序。
consumer group 中的consumer instance 的数量不能比一个Topic中的partition的数量多，否则，多出来的consumer消费不到消息。
Kafka只能在partition 的范围内保证消息消费的局部顺序性，不能在同一个topic中的多个partition中保证总的顺序性。
如果有在总体上保证消费顺序的需求，那么我们可以通过将topic的partition数量设置为1，将consumer group 中的consumer instance的数量也设置为1，但是这样会影响性能，所以kafka的顺序消费很少用。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

kafka

Kafka——集群的相关文章

RocketMQ经典高频面试题大全（附答案）

编程界的小学生 0 彩蛋 1 说说你们公司线上生产环境用的是什么消息中间件 2 多个mq如何选型 3 为什么要使用MQ 4 RocketMQ由哪些角色组成每个角色作用和特点是什么 5 RocketMQ中的Topic和JMS的queue有什
计算广告读书笔记

计算广告广告主媒体用户用户画像 ROI 进化合约广告多个合约在线分配问题 gt 竞价广告交易终端TD 广告网络ADN gt 实时竞价RTB 广告交易平台ADX 需求方平台DSP 品牌广告效果广告点击率CTR 点击价值到达
Zookeeper的常见面试题

1 Zookeeper 1 1 Zookeeper基本概念 Zookeeper作为一个优秀高效且可靠的分布式协调框架 ZooKeeper 在解决分布式数据一致性问题时并没有直接使用Paxos算法而是专门定制了一致性协议叫做 ZAB Zoo
Kafka传输数据到Spark Streaming通过编写程序java、scala程序实现操作

一案例说明现有一电商网站数据文件名为buyer favorite1 记录了用户对商品的收藏数据数据以 t 键分割数据内容及数据格式如下二前置准备工作项目环境说明 Linux Ubuntu 16 04 jdk 7u75 lin
《从Paxos到ZooKeeper》读书笔记之第一章（二）

从Paxos到ZooKeeper 读书笔记之第一章二 1 2从ACID到CAP BASE 这一节由三小节从大家数值的数据库事务的四个特性引出来分布式事务的概念通过对ACID模型的讨论提出如何构建一个兼顾可用性和一致性的分布式系统方
kafka知识 --kafka权威指南

我想既然Kafka是为了写数据而产生的那么用作家的名字来命名会显得更有意义我在大学时期上过很多文学课程很喜欢Franz Kafka 况且对于开源项目来说这个名字听起来很酷因此名字和应用本身基本没有太多联系 Jay Kreps
kafka处理快速的原因

生产者分析生产者 producer 是负责向Kafka提交数据的我们先分析这一部分 Kafka会把收到的消息都写入到硬盘中它绝对不会丢失数据为了优化写入速度Kafka采用了两个技术顺序写入和 MMFile 顺序写入因为硬盘是机
Kafka3.0.0版本——消费者（消费者组案例）

目录一消费者组案例 1 1 案例需求 1 2 案例代码 1 2 1 消费者1代码 1 2 2 消费者2代码 1 2 3 消费者3代码 1 2 4 生产者代码 1 3 测试一消费者组案例 1 1 案例需求测试同一个主题的分区数据只
Kafka消息阻塞

转自 http jis117 iteye com blog 2279519 hi all 大家都很关心kafka消息阻塞的情况感谢RoctetMQ给我们的教训 Kafka上线也有一段时间了确实有出现过消息阻塞的情况虽然不影响业务而且用
《消息队列高手课》缓存策略：如何使用缓存来减少磁盘IO？

现代的消息队列都使用磁盘文件来存储消息因为磁盘是一个持久化的存储即使服务器掉电也不会丢失数据绝大多数用于生产系统的服务器都会使用多块儿磁盘组成磁盘阵列这样不仅服务器掉电不会丢失数据即使其中的一块儿磁盘发生故障也可以把数据从其
kafka学习笔记（一）简介

这是对我找到的学习资料的整理非手打参考 https kafka apachecn org intro html https blog csdn net weixin 39468305 article details 106346280
Flink消费kafka出现空指针异常

文章目录出现场景表现问题解决 tombstone Kafka中提供了一个墓碑消息 tombstone 的概念如果一条消息的key不为null 但是其value为null 那么此消息就是墓碑消息出现场景双流join时采用的是l
Kafka生产者模式生成10亿条数据

生产者生产消息 public class MyProducer2 public static void main String args throws InterruptedException 生产者 Properties properti
kafka问题解决：org.apache.kafka.common.errors.TimeoutException

记录使用kafka遇到的问题 1 Caused by java nio channels UnresolvedAddressException null 2 org apache kafka common errors TimeoutExc
explain查看sql语句执行计划

explain sql 执行结果字段描述 id select唯一标识 select type select类型 table 表名称 type 连接类型 possible keys 可能的索引选择 key 实际用到的索引 key len 实际
Kafka 架构及原理分析

Kafka 架构及原理分析文章目录 Kafka 架构及原理分析简介使用场景架构 Broker Topic 副本机制存储消费分组消费编号数据多写支持基于 binlog 实现主从复制 Kafka 的进阶功能消息幂等性事务
Kafka——Mac搭建kafka环境

1 下载Kafka安装包下载地址将压缩包移动到 usr local mv kafka 2 12 3 1 0 tgz usr local 解压 tar zxvf kafka 2 12 3 1 0 tgz 2 启动启动zookeeper
一文弄懂事件Event与Kafka的区别

事件 Event 和 Apache Kafka 是两个概念层面上有所不同的东西它们在应用程序中的作用和使用场景也有很大的差异 1 概念和定义事件 Event 事件是系统内发生的特定事情或状态变化的表示在编程和软件设计中事件通常被
Kafka基础—3、Kafka 消费者API

一 Kafka消费者API 1 消息消费当我们谈论 Kafka 消费者 API 中的消息消费时我们指的是消费者如何从 Kafka 主题中拉取消息并对这些消息进行处理的过程消费者是 Kafka 中的消息接收端它从指定的主题中获取消息
消息队列选型：Kafka 如何实现高性能？

在分布式消息模块中我将对消息队列中应用最广泛的 Kafka 和 RocketMQ 进行梳理以便于你在应用中可以更好地进行消息队列选型另外这两款消息队列也是面试的高频考点所以本文我们就一起来看一下 Kafka 是如何实现高性能的

随机推荐

Object.entries()方法使用详解

一概述对象的数据处理方法我们熟知的有很多比如Object keys Object values for in等本文将其与其它常见使用方法进行对比详细解析其特性二对比 for in Object entries 方法的优势 1
Python计算过去周末的方法

在Python中我们可以使用datetime模块来计算过去的周末数量 datetime模块提供了各种日期和时间相关的函数和类使我们可以轻松地处理日期和时间首先我们需要导入datetime模块 import datetime 然后我
Vue自定义指令「干货」

在 Vue 除了核心功能默认内置的指令 v model 和 v show Vue 也允许注册自定义指令它的作用价值在于当开发人员在某些场景下需要对普通 DOM 元素进行操作 Vue 自定义指令有全局注册和局部注册两种方式先来看看注册全局
springboot修改端口号的两种方式

前言 springboot默认的端口号为8080 端口号的配置有两种方式一种是在配置文件application properties中另一种是在配置文件application yml中 1 第一种方式修改配置文件application
最短路径-Dijkstra算法与Floyd算法

最短路径 Dijkstra算法与Floyd算法原文 https www cnblogs com smile233 p 8303673 html 一最短路径在非网图中最短路径是指两顶点之间经历的边数最少的路径 AE 1 ADE 2 A
【ubuntu22.04 安装优麒麟wine封装版微信】

选择该版本原因目前使用体验来说优于deepin封装版 1 到优麒麟软件下载页面找到微信 wine 下载Wine环境包和微信 wine 包 2 终端输入 sudo apt get install f y ukylin wine 70 6
linux 环境下 openssl 生成ecdsa公、私钥

我的个人博客逐步前行STEP 1 生成ecdsa私钥 openssl ecparam name prime256v1 genkey noout out prime256v1 key pem 2 从ecdsa私钥提取公钥 openssl p
windows下anaconda3安装MySQLdb

本文转自Windows下python3 6 安装MySQLdb 首先需要下载windows版本的mysqlclient 原作者给出了其中一个版本的下载链接下载之后放到合适的文件目录中然后打开anaconda自带的Anaconda Pr
java使用switch语句完成输入1~12之间的整数，显示该月份的英语单词及这个月属第几季度。

1 程序代码如下 package java实训 import java util Scanner public class SJ4 public static void main String args Scanner input new
AI Cloud将百花齐放，青云科技已先走了一步

三年前国家超级计算济南中心济南超算悄悄干了一件大事投资数十亿元致力于打造一个融HPC超算传统云计算以CPU为主和智算以GPU为主为一体的多元算力中心这就需要一个统一的并且可以对外开放的运维和运营平台那时还在打磨阶段的青
python注释快捷键引号注释快捷键注释字体样式调整

python注释快捷键分为两种单行注释单行注释快捷键是CTRL list red green blue yellow white black print list 0 print list 1 print list 2 list red
VS E2996 错误过多，导致IntelliSense引擎无法正常工作。其中一些错误可能在编辑器中不可见。代码没有提示

一错误的问题描述二这个问题导致的后果后面程序中用到的很多都会显示找不到定义三说实话这个问题真的很坑由于我更换了我程序的工作电脑我在VS中属性管理器中重新配置了头文件和对应的库目录但是这里我犯了一个小错误就是我更换的时候
QT开发技巧之QTableWidget设置表头颜色字体

1 默认的表头和内容背景字体一样不好区别可以通过qss设置修改表头样式 2 修改后效果如下 qss代码表格头背景色 QHeaderView section background rgb 128 255 255 font family 宋
vue引入阿里图标 Module parse failed: Unexpected character '�' (1:0)

操作根据文章 https blog csdn net qq 32113629 article details 79740949 在自己跟着试了一下后报错 Module parse failed Unexpected character 1
c++享元模式

享元模式 1 享元模式简介享元模式在设计模式可复用面向对象软件的基础一书中是这样说的运用共享技术有效地支持大量细粒度的对象本质就是对大量细粒度的对象进行共享不是每个对象都要通过new的方式去创建而是通过区分对象的内部状态和外
波形图、频谱图和语谱图

波形图反映各质点在同一时刻不同位移的曲线叫做波的图像也叫做波形图波形图用于显示测量值为均匀采集的一条或多条曲线波形图仅绘制单值函数即在y f x 中各点沿x轴均匀分布例如一个随时间变化的波形波形图可显示包含任意个数据点的曲
消息通知之系统层事件发布相关流程

前言 Openharmony 3 1Release中存在消息通知的处理消息通知包括系统层事件发布消息订阅消息投递与处理为了开发者能够熟悉消息的处理流程本篇文章主要介绍系统层事件发布的相关流程整体流程代码流程发布消息 even
c++ queue用法入门必看超详细

1 queue的作用说到queue 大家一定会想到stack 同样是简单易用的数据结构之一 queue就是队列的意思像大家日常排队一样先排的人先用 stack则是相反的后来的先用这就有了queue先进先出 stack后进先出的说法
解决表情包乱码

问题描述在 Web 应用或移动App中我们经常需要显示表情符号但表情符号包含许多非ASCII字符不能直接在文本中传输所以通常会转换为HTML实体编码进行传输和存储如常见的微笑表情会编码为但是后续读取网络返回的文本内容时如果
Kafka——集群

文章目录集群 1 搭建个集群 2 集群发送消息 3 集群消费 3 1 Procuder 3 2 Consumer 4 消费顺序集群对于kafka来说一个单独的broker意味着kafka集群中只有一个节点要想增加kafka集群中的