kafka原理kafka Log存储解析以及索引机制

本文设置到的配置项有

名称	描述	类型	默认
num.partitions	topic的默认分区数	int	1
log.dirs	保存日志数据的目录。如果未设置，则使用log.dir中的值	string	/tmp/kafka-logs
offsets.topic.replication.factor	offset topic复制因子（ps：就是备份数，设置的越高来确保可用性）。为了确保offset topic有效的复制因子，第一次请求offset topic时，活的broker的数量必须最少最少是配置的复制因子数。如果不是，offset topic将创建失败或获取最小的复制因子（活着的broker，复制因子的配置）	short	3
log.index.interval.bytes	添加一个条目到offset的间隔	int	4096

首先启动kafka集群,集群中有三台Broker; 设置3个分区,3个副本;

发送topic消息

启动之后kafka-client发送一个topic为消息szz-test-topic的消息

    public static void main(String[] args) {
        Properties props = new Properties();
        props.put("bootstrap.servers", "xxx1:9092,xxx2:9092,xxx3:9092");
        props.put("acks", "all");
        props.put("retries", 0);
        props.put("batch.size", 16384);
        props.put("linger.ms", 1);
        props.put("buffer.memory", 33554432);
        props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
        props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
        Producer producer = new KafkaProducer<>(props);
        for(int i = 0; i < 5; i++){
            producer.send(new ProducerRecord("szz-test-topic", Integer.toString(i), Integer.toString(i)));
        }
        producer.close();
    }

发送了之后可以去log.dirs路径下看看

这里的3个文件夹分别代表的是3个分区; 那是因为我们配置了这个topic的分区数num.partitions=3; 和备份数offsets.topic.replication.factor=3; 这3个文件夹中的3个分区有Leader有Fllower; 那么我们怎么知道谁是谁的Leader呢？

查看topic的分区和副本

bin/kafka-topics.sh  --describe --topic szz-test-topic --zookeeper localhost:2181

可以看到查询出来显示分区Partition-0在broker.id=0中,其余的是副本Replicas 2,1 分区Partition-1在broker.id=1中,其余的是副本Replicas 0,2 ...

或者也可以通过zk来查看leader在哪个broker上

 get /brokers/topics/src-test-topic/partitions/0/state

[zk: localhost:2181(CONNECTED) 0] get /brokers/topics/szz-test-topic/partitions/0/state
{"controller_epoch":5,"leader":0,"version":1,"leader_epoch":0,"isr":[0,1,2]}
cZxid = 0x1001995bf

分区文件都有啥

进入文件夹看到如下文件:

名称	描述	类型	默认
log.segment.bytes	单个日志文件的最大大小	int	1073741824

我们试试多发送一些消息,看它会不会生成新的 segment

public static void main(String[] args) {
        Properties props = new Properties();
        props.put("bootstrap.servers", "xxx1:9092,xxx2:9092,xxx3:9092");
        props.put("acks", "all");
        props.put("retries", 0);
        props.put("batch.size", 163840);
        props.put("linger.ms", 10);
        props.put("buffer.memory", 33554432);
        props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
        props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

        Producer producer = new KafkaProducer<>(props);
        for(int i = 0; i < 1200; i++){
            //将一个消息设置大一点
            byte[] log = new byte[904800];
            String slog = new String(log);
            producer.send(new ProducerRecord("szz-test-topic",0, Integer.toString(i),  slog));
        }
        producer.close();
    }

从图中可以看到第一个segment文件00000000000000000000.log快要满log.segment.bytes 的时候就开始创建了00000000000000005084.log了; 并且.log和.index、.timeindex文件是一起出现的; 并且名称是以文件第一个offset命名的

.log存储消息文件
.index存储消息的索引
.timeIndex，时间索引文件，通过时间戳做索引

消息文件

上面的几个文件我们来使用kafka自带工具bin/kafka-run-class.sh 来读取一下都是些啥 bin/kafka-run-class.sh kafka.tools.DumpLogSegments --files 00000000000000000000.log

最后一行:

baseoffset:5083  position: 1072592768  CreateTime: 1603703296169

.index 消息索引

bin/kafka-run-class.sh kafka.tools.DumpLogSegments --files 00000000000000000000.index

最后一行:

offset:5083  position:1072592768

.timeindex 时间索引文件

bin/kafka-run-class.sh kafka.tools.DumpLogSegments --files 00000000000000000000.timeindex

最后一行:

timestamp: 1603703296169 offset: 5083

Kafka如何查找指定offset的Message的

找了个博主的图 @lizhitao

比如：要查找绝对offset为7的Message：

首先是用二分查找确定它是在哪个LogSegment中，自然是在第一个Segment中。
打开这个Segment的index文件，也是用二分查找找到offset小于或者等于指定offset的索引条目中最大的那个offset。自然offset为6的那个索引是我们要找的，通过索引文件我们知道offset为6的Message在数据文件中的位置为9807。
打开数据文件，从位置为9807的那个地方开始顺序扫描直到找到offset为7的那条Message。

Kafka 中的索引文件，以稀疏索引(sparse index)的方式构造消息的索引，它并不保证每个消息在索引文件中都有对应的索引项。每当写入一定量（由 broker 端参数 log.index.interval.bytes 指定，默认值为 4096，即 4KB）的消息时，偏移量索引文件和时间戳索引文件分别增加一个偏移量索引项和时间戳索引项，增大或减小 log.index.interval.bytes 的值，对应地可以缩小或增加索引项的密度。

稀疏索引通过 MappedByteBuffer 将索引文件映射到内存中，以加快索引的查询速度。

leader-epoch-checkpoint

leader-epoch-checkpoint 中保存了每一任leader开始写入消息时的offset; 会定时更新 follower被选为leader时会根据这个确定哪些消息可用

链接：https://juejin.cn/post/7215908160019480634

展开阅读全文

页面更新：2024-04-10

标签：索引稀疏条目副本因子分区原理机制名称消息文件时间

1 2 3 4 5

kafka原理kafka Log存储解析以及索引机制

发送topic消息

查看topic的分区和副本

分区文件都有啥

消息文件

.index 消息索引

.timeindex 时间索引文件

Kafka如何查找指定offset的Message的

leader-epoch-checkpoint

Stable Diffusion环境搭建和经验（云端篇）

支持美方遏制中国芯片？张忠谋“反水”，外媒：世间再无台积电？

开平电信助力开平城市智慧停车项目成功上线

微软圣何塞数据中心的净零排放之路

河南工业互联网进园区“百城千园行”启动

“万物到家”新业态：即时零售如何更好助力城市生活服务

年度报告出炉！去年广州237.56万名缴存职工提取公积金达847.92亿元

朱民回应“美元霸权不再”：沙特根本不缺钱，它为什么要人民币贷款？因为……

国际金价飙涨，山东黄金去年扭亏为盈，收购银泰黄金“积极推进中”

麻六记新增化妆品零售业务！麻六记对外投资5家企业、拥有9家企业实际控制权

山西安装背靠国资闯关IPO，资本负债比率高达241.8%

服务“大乙烯”项目腾飞路220千伏变电站扩建工程顺利送电

阿媒：中国进口阿根廷牛肉猛增

新希望大幅下修业绩预告：2022年预计净亏损13.5亿元~15.5亿元

蒙牛去年净利增5.5%，毛利率跌至5年低点：今年消费有望持续复苏

喝酒也有最佳饮用时间？其实都是有讲究的，看完让你轻松喝

卢：科温顿值得出场却没法给他时间，今天他打得特好

NBA最新消息：杜兰特和哈登复出，卢指导脑子开窍，威少梦回

好消息！YouTube开始测试AV1格式视频直播，AV1格式将加速

政策解读-济宁公积金调整缴存时间系数及余额倍数

这3个时间点都不适合洗澡，会对健康产生影响，大家要牢记

微信公众平台推迟模板消息内容规范措施生效日期

合众社：儿童太长时间盯屏幕有危险会导致情绪障碍抑郁

南京旅游攻略：在南京度过3天的时间，这份攻略请收好

蜂蜜水错过这个时间喝，你可能白喝了，立刻了解正确喝法！