Kafka订阅者最佳实践 - 云消息队列 Kafka 版

本文主要介绍云消息队列 Kafka 版订阅者的最佳实践，帮助您减少消费消息出错的可能性。

消费消息基本流程

云消息队列 Kafka 版订阅者在订阅消息时的基本流程为：Poll数据→执行消费逻辑→再次Poll数据，详情参见下图。

负载均衡

每个 Group 可以包含多个消费实例，即可以启动多个云消息队列 Kafka 版 Consumer，并把参数 group.id 设置成相同的值。属于同一个 Group 的消费实例会负载消费订阅的Topic。

例如 Group A订阅了Topic A，并开启三个消费实例C1、C2、C3，则发送到Topic A的每条消息最终只会传给C1、C2、C3的某一个。云消息队列 Kafka 版默认会均匀地把消息传给各个消息实例，以做到消费负载均衡。

云消息队列 Kafka 版负载均衡消费的内部原理是，把订阅的Topic的分区，平均分配给各个消费实例。因此，消费实例的个数不要大于分区的数量，否则会有消费实例分配不到任何分区而处于空跑状态。这个负载均衡发生的时间，除了第一次启动上线之外，后续消费实例发生重启、增加、减少等变更时，都会触发一次负载均衡。

消费客户端（Consumer）频繁出现Rebalance

心跳超时会引发Rebalance，可以通过参数调整、提高消费速度等方法解决。更多信息，请参见为什么消费客户端频繁出现Rebalance？。

分区个数

分区个数主要影响的是消费者的并发数量。

对于同一个Group内的消费者来说，一个分区最多只能被一个消费者消费。因此，消费实例的个数不要大于分区的数量，否则会有消费实例分配不到任何分区而处于空跑状态。

控制台的默认分区个数是12，可以满足绝大部分场景的需求。您可以根据业务使用量进行增加。不建议分区数小于12，否则可能影响消费发送性能；也不建议超过100个，否则易引发消费端Rebalance。

```
String topicStr = kafkaProperties.getProperty("topic");
String[] topics = topicStr.split(",");
for (String topic: topics) {
subscribedTopics.add(topic.trim());
consumer.subscribe(subscribedTopics);
```

消费消息基本流程

负载均衡

消费客户端（Consumer）频繁出现Rebalance

分区个数

多个订阅

一个Group对应一个应用

消费位点

消费位点提交

消费位点重置

拉取大消息

消息重复和消费幂等

消费失败

消费延迟

消费阻塞以及堆积

提高消费速度

消息过滤

消息广播

订阅关系