Kafka 与 RabbitMQ 原理大纲

这份你要建立的不是“两个 MQ 的名词差异”，而是：

消息系统为什么存在 -> Kafka 适合什么 -> RabbitMQ 适合什么 -> 如何做可靠、幂等、可治理

一、总纲

消息队列原理层最核心的 6 条主线：

为什么要有消息队列
Kafka 的吞吐逻辑
RabbitMQ 的路由逻辑
顺序、重复、积压问题
消费可靠性与幂等
怎么结合你的项目分层讲

二、为什么需要消息队列

1. 本质问题

消息队列不是为了“技术更高级”，而是为了解决：

解耦
削峰
异步化
可重试
系统边界清晰

2. 为什么同步链路不够

因为很多业务动作不适合全部同步串起来：

链路太长
下游太多
高峰期容易被放大
某个下游抖动会拖死上游

3. 结合你的项目

推广 ROI 线里的点击处理、归因、回传、报表更新如果都放同步链路，主流程会很脆，所以才要拆事件流。

三、Kafka 原理链

1. Kafka 最核心的定位

Kafka 更像高吞吐事件流平台，而不是传统业务消息队列。

2. 为什么吞吐高

顺序写磁盘
批量发送 / 批量拉取
分区并行
零拷贝

3. partition 在解决什么问题

partition 是 Kafka 扩展和并发的基本单位。它让：

生产可以并行
消费可以并行
单 topic 可以分散负载

4. 为什么 Kafka 只能保证单 partition 有序

因为不同 partition 本来就是并行的，没有全局统一顺序。

5. consumer group 在解决什么问题

让多个消费者共同消费一批 partition，实现横向扩展。

6. 为什么 Kafka 适合你的推广 ROI 项目

因为你那条线是：

原始事件流
高吞吐
实时消费
长链路处理

这正是 Kafka 最适合的场景。

四、RabbitMQ 原理链

1. RabbitMQ 最核心的定位

RabbitMQ 更像灵活的业务消息路由系统。

2. 它的核心结构

producer
exchange
binding
queue
consumer

3. exchange 在解决什么问题

把“消息发送”和“消息去哪”分开。

4. 为什么 RabbitMQ 适合复杂路由

因为它可以通过：

direct
fanout
topic
headers

做不同类型的路由策略。

5. RabbitMQ 适合什么

业务通知
任务分发
路由灵活的消息
中低吞吐但逻辑复杂的消息场景

五、Kafka 和 RabbitMQ 的本质区别

Kafka 更偏

事件流
高吞吐
分区消费
日志型流式处理

RabbitMQ 更偏

消息路由
业务任务
队列语义
灵活投递模型

面试上你最稳的说法

Kafka 更适合我推广 ROI 这类事件链路；RabbitMQ 我理解它更适合业务通知和任务分发。不是谁替代谁，而是设计目标不同。

六、为什么会重复消费

核心原因

“业务处理成功”和“消费位点提交成功”不是同一件事。

只要这两步之间出异常，就可能重拉消息。

这意味着什么

消息系统里，重复消费是默认风险，不是边缘异常。

七、为什么会积压

核心逻辑

生产速度大于消费速度。

真正要看什么

单条处理是否太重
下游依赖是否慢
并发度是否不够
分区是否足够
是否有坏消息卡住

这比“加机器”更本质。

八、消息幂等原理

本质问题

既然重复消费不可避免，消费逻辑就必须具备幂等性。

常见手段

唯一业务键
Redis 标记
数据库唯一约束
状态机判断

你项目里怎么讲

推广回传、支付回调、注册行为回传都很适合用这个思路讲。

九、可靠性原理

消息系统里要关注什么

发送是否成功
broker 是否持久化
消费是否确认
失败如何重试
死信如何处理

工程上怎么理解

真正重要的不是“理论上不会丢”，而是出了问题后链路是否可追踪、可补偿、可重放。

十、结合你的项目怎么讲

推广 ROI 增长平台

Kafka 适合原始事件和行为回传
Go 消费者适合高吞吐处理
后续报表和分析继续拆层

核心业务通知场景

如果被追问 RabbitMQ，你可以从订单通知、异步任务、低吞吐路由型场景切进去，不需要硬说你 RabbitMQ 比 Kafka 还深。

十一、最适合你的结尾表达

我对消息队列的理解，不是停留在“会发消息”，而是知道 Kafka 和 RabbitMQ 各自适合什么场景，也知道消息系统里最本质的问题是解耦、削峰、顺序、重复、积压和幂等治理。推广 ROI 这条线就是我把这些问题真正做过的一条主线。