分布式系统中先操作数据库还是先操作缓存

描述

前言

在分布式系统中,缓存和数据库同时存在时,如果有写操作,先操作数据库还是先操作缓存呢?本文将分5种方案展开阐述对比,谢谢阅读~github地址,衷心感谢每一颗star

❝https://github.com/whx123/JavaHome❞

缓存维护方案一

如果是一读(线程B)一写(线程A)操作,「先操作缓存,再操作数据库」。流程图如下所示:

1.线程A发起一个写操作,第一步del cache

2.线程A第二步写入新数据到DB

3.线程B发起一个读操作,cache miss缓存失效了。

4.线程B从DB获取最新数据

5.线程B执行set cache,把从DB读到的数据,更新到缓存。

「这样看,没啥问题」。

1.线程A发起一个写操作,第一步del cache

2.此时线程B发起一个读操作,cache miss

3.线程B继续读DB,读出来一个老数据

4.然后老数据设置入cache

5.线程A写入DB最新的数据

OK,酱紫,就有问题了吧,老数据入到缓存了,「每次读都是老数据啦,缓存与数据与数据库数据不一致了」。

缓存维护方案二

上个方案是一读一写,如果是双写操作,「先操作缓存,在操作数据库」,会怎么样呢?

1.线程A发起一个写操作,第一步set cache

2.线程A第二步写入新数据到DB

3.线程B发起一个写操作,set cache

4.线程B第二步写入新数据到DB

「这样看,也没啥问题。」

1.线程A发起一个写操作,第一步set cache

2.线程B发起一个写操作,第一步set cache

3.线程B写入数据库到DB

4.线程A写入数据库到DB

执行完后,缓存保存的是B操作后的数据,数据库是A操作后的数据,「缓存和数据库数据不一致了」。

缓存维护方案三

一写(线程A)一读(线程B)操作,「先操作数据库,再操作缓存」。

1.线程A发起一个写操作,第一步write DB

2.线程A第二步del cache

3.线程B发起一个读操作,cache miss

4.线程B从DB获取最新数据

5.线程B同时set cache

有些朋友可能认为,在第2步删除缓存之前,线程B读过来呢?这时候,读到的是缓存老数据,这个可以认为是正常业务逻辑呀,下次再读取就是正确数据了。这种方案「没有明显的并发问题」,但是呢,「步骤二删除缓存失败」,还是个问题。不过概率比较小,「优于方案一和方案二」,平时工作中也是使用方案三。综上对比,我们一般采用方案三,但是有没有完美全解决方案三的弊端的方法呢?

缓存维护方案四

这个是方案三的改进方案,都是先操作数据库再操作缓存

通过数据库的「binlog」来「异步淘汰key」,以mysql为例 可以「使用阿里的canal将binlog日志采集发送到MQ队列」里面,然后「通过ACK机制 确认处理」这条更新消息,删除缓存,保证数据缓存一致性。但是呢还有个问题,「如果是主从数据库呢」?

缓存维护方案五

主从DB问题:因为主从DB同步存在延时时间。如果删除缓存之后,数据同步到备库之前已经有请求过来时,「会从备库中读到脏数据」,如何解决呢?

缓存维护总结

综上所述,在分布式系统中,缓存和数据库同时存在时,如果有写操作的时候,「先操作数据库,再操作缓存」。如下:

1.读取缓存中是否有相关数据

2.如果缓存中有相关数据value,则返回

3.如果缓存中没有相关数据,则从数据库读取相关数据放入缓存中key-》value,再返回

4.如果有更新写数据,则先操作数据库,再操作缓存

5.为了保证第四步更新缓存成功,使用binlog异步通知操作

6.如果是主从数据库,binglog取自于从库

7.如果是一主多从,每个从库都要采集binlog,然后消费端收到最后一台binlog数据才删除缓存

责任编辑:haq

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分