MQ消息传输可靠性/消息丢失
解决方案
1、生产者将消息传输给mq时丢失
A:可以使用 RabbitMQ 提供的事务功能;
生产者
发送数据之前开启 RabbitMQ 事务
channel.txSelect
,再发送消息,如果消息没有成功被 RabbitMQ 接收到,那么生产者会收到异常报错,此时就可以回滚事务
channel.txRollback
,然后重试发送消息;如果收到了消息,那么可以提交事务
channel.txCommit
。
// 开启事务channel.txSelect
try {
// 这里发送消息
} catch (Exception e) {
channel.txRollback
// 这里再次重发这条消息
}
// 提交事务
channel.txCommit
这样会降低吞吐量,降低性能。
B:开启 confirm
模式;
生产者开启 confirm
模式之后,每次写的消息都会分配一个唯一的 id,如果写入了 RabbitMQ 中,RabbitMQ 会回传一个 ack
消息,表示这个消息 ok 了。如果 RabbitMQ 没能处理这个消息,会回调生产者nack
接口表示消息接收失败,生产者可以重试。而且生产者可以结合这个机制自己在内存里维护每个消息 id 的状态,如果超过一定时间还没接收到这个消息的回调,那么可以重发。
事务机制和 cnofirm
机制最大的不同在于,事务机制是同步的,生产者提交一个事务之后会阻塞在那儿,但是 confirm
机制是异步的,发送个消息之后就可以发送下一个消息,RabbitMQ 接收了之后会异步回调生产者的接口通知该消息接收到了。
所以一般在生产者这块避免数据丢失,都是用 confirm
机制的。
2、RabbitMQ弄丢了数据
解决方案:开启 RabbitMQ 的持久化;消息写入之后会持久化到磁盘,如果RabbitMQ 挂了,恢复之后会自动读取之前存储的数据。
如何开启持久化?< 两个缺一不可>
- 创建 queue 的时候将其设置为持久化 ——可以保证 RabbitMQ 持久化 queue 的元数据,但是不会持久化 queue 里的数据
- 发送消息的时候将消息的
deliveryMode
设置为 2 ——将消息设置为持久化的,此时 RabbitMQ 就会将消息持久化到磁盘上去。
注意:如果RabbitMQ 还没持久化就挂了,可能导致少量数据丢失,但是这个概率较小。所以,持久化可以跟生产者那边的 confirm
机制配合起来,只有消息被持久化到磁盘之后,才会通知生产者 ack
了,所以哪怕是在持久化到磁盘之前,RabbitMQ 挂了,数据丢了,生产者收不到 ack
,生产者也是可以自己重发的。
3、消费者刚接收到消息,还没来得及处理进程挂掉了。
可以使用 RabbitMQ 提供的
ack
机制;关闭 RabbitMQ 的自动
ack
,可以通过一个 api 来调用,消费者处理完消息之后,再在程序里
ack
一次。如果消费者接收消息但是没有处理完成, RabbitMQ 会把这个消费分配给别的 consumer 去处理,消息是不会丢的。
Kafka
1、消费者接受了消息,自动提交了 offset, Kafka 以为消费者已经处理了消息,但其实消费者才开始处理。如果进程挂了会导致消息丢失。
关闭自动提交 offset,在处理完之后消费者手动提交 offset,此时需保证幂等性避免提交失败重复消费。
2、Kafka 某个 broker 宕机,选举leader时导致数据未完全同步,丢失数据。
- 给 topic 设置
replication.factor
参数:这个值必须大于 1,要求每个 partition 必须有至少 2 个副本。 - 在 Kafka 服务端设置
min.insync.replicas
参数:这个值必须大于 1,这个是要求一个 leader 至少感知到有至少一个 follower 还跟自己保持联系,没掉队,这样才能确保 leader 挂了还有一个 follower 吧。 - 在 producer 端设置
acks=all
:这个是要求每条数据,必须是写入所有 replica 之后,才能认为是写成功了。 - 在 producer 端设置
retries=MAX
(很大很大很大的一个值,无限次重试的意思):这个是要求一旦写入失败,就无限重试,卡在这里了。
3、生产者丢失数据
在2中设置了 acks=all
那就不回丢失数据。
以上是 MQ消息传输可靠性/消息丢失 的全部内容, 来源链接: utcz.com/z/513315.html