redis与Mysql的数据一致性

2023年9月25日 264次阅读来源: 刀刃丿

为了减少db的读压力，加快读速度，系统使用cache做缓存，会引起cache一致性问题。因为db会有事务性导致回滚，而cache无法回滚，会导致脏数据。

一般情况下，我们会在保存数据时，先穿透保存到DB中，再同步数据到redis中。

为了保证存储层对外层透明，我们会把DB与redis操作封装，对上层调用来说完全透明，不关心数据具体如何存储。

例如在我们的实际业务中有如下场景：A表插入一条数据，同步到redis中，B表插入一条数据，同步到redis中。如果B表插入数据失败，事务回滚，A表中数据可以回滚，但是redis无法回滚。会导致redis中有脏数据。

facebook的一篇论文给出如下设计：

查询：先查询cache，miss时查询db，写入cache

写：写db成功后，失效cache

重点说下写：如果写db成功后，写cache，会有事务性和并发性两方面问题。

1.事务性问题：一个事务包含多个db操作，操作一些db成功，写cache成功，操作二写db失败，事务回滚，db数据回滚，cache无法回滚，导致脏数据。

2.并发性问题：两个更新操作并发，如更新名字，并且cache中key以名字为关键字，更新一写db成功，写缓存XXXX_name1成功。更新二写db成功，写缓存XXXX_name2成功。导致cache脏数据。

这里再说一下一般更新操作顺序是失效cache，写db，写cache。会有并发问题。

两个并发操作，更新和读，左边写线程，右边为读线程

①更新操作删除cache

②读操作读cache，miss

③读db，此时是旧数据

④写db，写cache

⑤写cache 导致cache中脏数据。

虽然写db成功后，失效cache也会有并发问题：更新和读并发

①查询cache

②写db，失效cache

③写chache

导致cache中脏数据，但是概率极低，并且一般db中写时间长于读时间，并且写会锁表，读需要在写前进入，并且要晚于写操作更新缓存，所以发生概率极低。

解决方法是 2PC或是Paxos协议，代价较大。

所以我们采用的方式是：

写数据只写db

更新数据先更新db，再失效cache

读数据，先读cache，未命中读db，写入cache

    原文作者：刀刃丿
    原文地址: https://www.jianshu.com/p/23abe7620096
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。