Redis 缓存穿透和雪崩的概念
缓存穿透
缓存穿透的概念其实很简单,我们经常使用 Redis 作为缓存数据库,如果用户相插叙一个数据,但是发现 Redis 没用这条数据,也就是没有命中 Redis 数据库中的数据,于是就到数据库中查询。
上述看起来很正常,没有什么问题,但是如果很多的用户出现额时候,缓存都没有命中(比如淘宝秒杀),于是都请求数据库,这给数据库造成很大压力,这也就是缓存穿透。
解决方案
场景的有
- 布隆过滤器
布隆过滤器是一种数据结构,对所有可能查询的参数以hash形式存储,在控制层先进行校验,不符合则丢弃,从而避免了对底层存储系统的查询压力。
- 缓存空对象
当 MySQL 不命中后,返回个空对象,并且也将其缓存起来,同时会设置一个过期时间,之后再访问都得到这个数。
但是空值能够被缓存起来,意味着需要更多的空间存储更多的键,这当中可能会有很多的空值的键。即便空值设置了过期时间,还是会存在 Redis 和 MySQL 的数据会有一段时间窗口的不一致,这对于需要保持一致性的业务会有影响。
缓存击穿
与缓存穿透不同的是,缓存击穿,是指一个 key 非常常用,很多人都对这个 key 不停的查询,比如双十一在抢某个东西,某个点大量人都知道消息并且搜索,大并发集中对这一个点进行访问,如果这个 key 突然到了失效的瞬间,持续的大并发就穿破缓存,直接请求数据库。
就像在墙上上凿开了一个洞。当某个key在过期的瞬间,有大量的请求并发访问,这类数据一般是热点数据,由于缓存过期,会同时访问数据库来查询最新数据,并且回写缓存,会导使数据库瞬间压力过大。
解决方案
- 热点数据永不过期
既然是热点数据,没有设置过期时间,所以不会出现热点 key 过期后产生的问题。
- 加互斥锁
使用分布式锁,保证对于每个key同时只有一个线程去查询后端服务,其他线程没有获得分布式锁的权限,因此只需要等待即可。这种方式将高并发的压力转移到了分布式锁,因此对分布式锁的考验很大。
缓存雪崩
缓存雪崩,是指在某一个时间段,缓存集中过期失效。Redis 宕机!
比如在双十一的时候,马上就要到双十二零点,很快就会迎来一波抢购,这波商品时间比较集中数据的放入了缓存,假设缓存一个小时。那么到了凌晨一点钟的时候,这批商品的缓存就都过期了。而对这批商品的访问查询,都落到了数据库上,对于数据库而言,就会产生周期性的压力波峰。于是所有的请求都会达到数据库,数据库的调用量会暴增,导致挂掉的情况。
比较致命的缓存雪崩,是导致缓存服务器某个节点宕机或断网。因为自然形成的缓存雪崩,一定是在某个时间段集中创建缓存,这个时候,数据库也是可以顶住压力的。无非就是对数据库产生周期性的压力而已。而缓存服务节点的宕机,对数据库服务器造成的压力是不可预知的,很有可能瞬间就把数据库压垮。
解决方案
- Redis 集群
这个思想的含义是,既然 Redis 有可能挂掉,那我多增设几台 Redis,这样一台挂掉之后其他的还可以继续,也就是集群
- 限流降级
这个解决方案的思想是,在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。比如对某个key只允许一个线程查询数据和写缓存,其他线程等待。
- 数据预热
数据加热的含义就是在正式部署之前,我先把可能的数据先预先访问一遍,这样部分可能大量访问的数据就会加载到缓存中。在即将发生大并发访问前手动触发加载缓存不同的key,设置不同的过期时间,让缓存失效的时间点尽量均匀。