笔者在看了朱忠华作者写的《深入理解Kafka核心设计与实践原理》书籍后,对Kafka消息中间件充满兴趣,同时笔者想记录Kafka消息中间件博大精深的知识,顿时生感想写篇博客来开启我的IT博客之旅。本博客Kafka消息中间件系列基于《深入理解Kafka核心设计与实践原理》书籍的知识理论,依据Kafka 2.0.0版本编写。
Kafka起初是由LinkedIn公司采用Scala语言开发的一个多分区、多副本且基于ZooKeeper协调的分布式消息系统,现已被捐赠给Apache基金会。目前Kafka已经定位为一个分布式流式处理平台,它以高吞吐、可持久化、可水平拓展、支持流式数据处理等多种特性而被广泛使用。 Kafka之所以受到越来越多的青眯,与它所扮演的三大角色是分不开的:
消息系统:Kafka和传统的消息系统(也称消息中间件)都具备系统解耦、冗余存储、流量消峰、缓冲、异步通信、扩展性、可恢复性等功能。与此同时,Kafka还提供了大多数消息系统难以实现的消息顺序性保障以及回溯消费的功能。存储系统:Kafka把消息持久化到磁盘,相比较其它基于内存存储的系统而言,有效降低数据丢失的风险。也正是得益于Kafka消息持久化功能和多副本机制,我们可以把Kafka作为长期得数据存储系统来使用,只需把对应得数据保留策略设置为“永久”或启用主题的日志压缩功能即可。流式处理平台:Kafka不仅为每个流行的流式处理框架提供了可靠的数据来源,还提供了一个完整的流式处理类库,比如窗口、连接、变换和聚合等各类操作。一个典型的Kafka体系架构包括若干Producer(生产者)、Broker(服务器节点)集群、若干Consumer(消费者)以及ZooKeeper(分布式系统协调)集群,如图1-1所示。
图1-1 Kafka体系结构 整个Kafka体系结构中引入以下七个术语: Producer:生产者,就是发送消息的一方。生产者负责创建消息,然后将其投递到Kafka中。Consumer:消费者,就是接收消息的一方。消费者连接到Kafka并接收消息,进而进行相应的业务逻辑处理。Broker:服务代理节点。对于Kafka而言,Broker可以简单地看作一个独立的Kafka服务节点或Kafka服务实例。Topic:主题。Kafka中的消息以主题为单位进行归类,生产者负责将消息发送到Kafka上时,必需指定一个主题,而消费者负责订阅主题并进行消费。Partition:分区。上面说到的主题是一个逻辑上的概念,它还可以细分为多个分区,也称主题分区。同一个主题下的不同分区,所包含的消息是不同的。分区在存储层面可以看作一个可追加的日志文件,上面说Kafka把消息持久化到磁盘,实际上就是把消息保存在分区的日志文件(.log)里。Offset:偏移量。消息在被追加到分区日志文件时,都会分配一个特定的offset,offset是消息在分区中唯一标识(就好比如数据库里的ID),Kafka通过它来保证消息在分区内的顺序性,但offset并不能跨越分区,在不同的分区中offset所指定的消息是不一样的,也就是说,在一个主题里有多个分区的情况下,Kafka不能保证Consumer在订阅主题进行消息消费时消息的顺序性,但能保证一个主题的分区里消息有序。如图1-2所示。 图1-2 消息追加写入 主题有4个分区,消息被顺序追加到每个分区日志文件的尾部。Kafka中的分区可以分布在不同的服务器(broker)上。每条消息被发送到broker之前,会根据分区规则选择存储到哪个具体的分区。如果分区规则设定得合理,所有得消息都可以均匀地分配到不同分区中。如果一个主题只对应一个文件,那么这个文件所在得机器I/O将会成为这个主题的性能瓶颈,而分区解决这个问题。Replica:副本。Kafka为分区引入了多个副本机制,通过添加副本数量可以提升容灾能力。同一个分区的不同副本保存的是相同消息(严格说,在同一时刻,副本之间并非完全一样),副本的关系是一主多从,其中leader副本负责处理读写请求,follower副本只负责与leader副本的消息同步。副本处于不同broker中,当leader副本出现故障时,从follower副本中重新选举新的leader副本对外提供服务。Kafka通过多副本机制实现了故障的自动转移,当Kafka集群中某个broker失效时仍然能保证服务可用。如图1-3所示 图1-3 多副本架构 Kafka集群中有4个broker,某个主题中有3个分区,且副本因子(副本个数)也为3,如此每个分区便有1个leader副本和2个follower副本。生产者和消费者只与leader副本进行交互,而follower副本只负责消息同步,很多时候follower副本中的消息相对与leader副本而言会有一定的滞后。 分区中的所有副本统称为AR(Assigned Replicas),所有与leader副本保持一定程度同步的副本组成ISR(In-Sync Replicas),ISR集合是AR集合中的一个子集。消息会先发送到leader副本,然后follower副本才能从leader副本中拉取消息进行同步,同步期间内follower副本相对于leader副本而言会有一定程度的滞后。前面所说的“一定程度滞后”是指可忍受的滞后范围,这个范围可以通过参数进行配置。与leader副本同步滞后过多的副本组成OSR(Out-of-Sync Replicas),由此可见,AR=ISR+OSR。正常情况下,所有的follower副本都应该与leader副本保持一定程度的同步,即AR=ISR,OSR集合为空。 ISR与HW(High Watermark)、LEO(Log End Offset)有紧密关系。HW俗称高水位,它标识了一个特定的消息偏移量(offset),消费者只能拉取到这个offset之前的消息。LEO标识当前日志文件中下一条待写入消息的offset。如图1-4所示。 图1-4 分区中的偏移量 图1-4,代表一个日志文件这个日志文件中有9条消息,第一条消息的offset(Log Start Offset)为0,最后一条消息的offset为8,offset为9的消息用虚线框表示,代表下一条待写入的消息。日志文件的HW为6,表示消费者只能拉取到offset在0~5之间的消息,而offset为6之后的消息对与消费者而言是不可见的。分区ISR集合中的每个副本都会维护自身的LEO,而ISR集合中最小的LEO即为分区的HW,对消费者而言只能消费HW之前的消息。下面通过一个简单的示例进行说明。 图1-5 写入消息(情形1) 如图1-5所示,假设某个分区的ISR集合中有3个副本,即1个leader副本和2个follower副本,此时分区的LEO和HW都为3。消息3和消息4从生产者发出之后会被先存入leader副本,如图1-6所示。 图1-6 写入消息(情形2) 在消息写入leader副本之后,follower副本会拉取消息3和消息4进行消息同步。在同步过程中,不同的follower副本的同步效率也不尽相同。 图1-7 写入消息(情形3) 如图1-7所示,在某一时刻follower1完全跟上了leader副本,而follower2副本只同步了消息3,如此leader副本的LEO为5,follower1的LEO为5,follower2的副本为4,那么当前分区的HW最小值为4,此时消费者可以消费到offset为0~3之间的消息。 图1-8 写入消息(情形3) 如图1-8所示,所有的副本都成功写入了消息3和消息4,整个分区的HW和LEO都为5,因此消费者可以消费到offset为4的消息了。 由此可见,Kafka的复制机制既不是完全的同步复制,也不是单纯的异步复制。事实上,同步复制要求所有能工作的follower副本都复制完,这条消息才会被确认已成功提交,这种复制方式极大地影响性能。而在异步复制方式下,follower副本异步地从leader副本复制数据,数据只要被leader副本写入就被认为已经成功提交。在这种情况下,如果follower副本都还没有复制完而落后与leader副本,突然leader副本宕机,则会造成数据丢失。Kafka使用的这种ISR方式则有效地权衡了数据可靠性和性能之间的关系。