本地缓存和分布式缓存,该怎么选?

2023-05-16

缓存,消息队列,分库分表是高并发解决方案三剑客。

缓存之所以能够让系统“更快”,本质上做到了如下两点:

  • 减小 CPU 消耗

    将原来需要实时计算的内容提前算好、把一些公用的数据进行复用,这可以减少 CPU 消耗,从而提升响应性能。

  • 减小 I/O 消耗

    将原来对网络、磁盘等较慢介质的读写访问变为对内存等较快介质的访问,从而提升响应性能。

对于应用系统来讲,我们经常将缓存划分为本地缓存分布式缓存

本地缓存 :应用中的缓存组件,缓存组件和应用在同一进程中,缓存的读写非常快,没有网络开销。但各应用或集群的各节点都需要维护自己的单独缓存,无法共享缓存。

分布式缓存:和应用分离的缓存组件或服务,与本地应用隔离,多个应用可直接共享缓存。

这篇文章,聊聊本地缓存和分布式缓存,希望大家读完之后,在面对不同的业务场景时,能够做出合理的缓存选型。

1 本地缓存 JDK Map

JDK Map 经常用于缓存实现:

  • HashMap

    HashMap 是一种基于哈希表的集合类,它提供了快速的插入、查找和删除操作。可以将键值对作为缓存项的存储方式,将键作为缓存项的唯一标识符,值作为缓存项的内容。

  • ConcurrentHashMap

    ConcurrentHashMap 是线程安全的 HashMap,它在多线程环境下可以保证高效的并发读写操作。

  • LinkedHashMap

    LinkedHashMap 是一种有序的 HashMap ,它保留了元素插入的顺序,可以按照插入顺序或者访问顺序进行遍历。

  • TreeMap

    TreeMap 是一种基于红黑树的有序 Map,它可以按照键的顺序进行遍历。

笔者曾经负责艺龙红包系统,红包活动就是存储在 ConcurrentHashMap 中 ,通过定时任务刷新缓存

b322e1ab3347658854c7c11a4feca3ef.png

核心流程:

1、红包系统启动后,初始化一个 ConcurrentHashMap 作为红包活动缓存 ;

2、数据库查询所有的红包活动 , 并将活动信息存储在 Map 中 ;

3、定时任务每隔 30 秒 ,执行缓存加载方法,刷新缓存。

为什么红包系统会将红包活动信息存储在本地内存 ConcurrentHashMap 呢 ?

  • 红包系统是高并发应用,快速将请求结果响应给前端,大大提升用户体验;

  • 红包活动数量并不多,就算全部放入到 Map 里也不会产生内存溢出的问题;

  • 定时任务刷新缓存并不会影响红包系统的业务。

笔者见过很多单体应用都使用这种方案,该方案的特点是简洁易用,工程实现也容易 。

2 本地缓存框架

虽然使用 JDK Map 能快捷构建缓存,但缓存的功能还是比较孱弱的。

因为现实场景里,我们可能需要给缓存添加缓存统计过期失效淘汰策略等功能。

于是,本地缓存框架应运而生。

流行的 Java 缓存框架包括:Ehcache , Google Guava ,  Caffeine Cache 。

d472317ca9d563562bfba72bdaf8cb63.png

下图展示了 Caffeine 框架的使用示例。

8a0c7a8eefd7afef844cce80466b3387.png

虽然本地缓存框架的功能很强大,但是本地缓存的缺陷依然明显。

1、高并发的场景,应用重启之后,本地缓存就失效了,系统的负载就比较大,需要花较长的时间才能恢复;

2、每个应用节点都会维护自己的单独缓存,缓存同步比较头疼

3 分布式缓存

分布式缓存是指将缓存数据分布在多台机器上,以提高缓存容量和并发读写能力的缓存系统。分布式缓存通常由多台机器组成一个集群,每台机器上都运行着相同的缓存服务进程,缓存数据被均匀地分布在集群中的各个节点上。

Redis 是分布式缓存的首选,甚至我们一提到缓存,很多后端工程师首先想到的就它。

下图是神州专车订单的 Redis 集群架构 。将 Redis 集群拆分成四个分片,每个分片包含一主一从,主从可以切换。应用 A 根据不同的缓存 key 访问不同的分片。

c3ef98807b7a2437ea791d62aa87fd64.png

与本地缓存相比,分布式缓存具有以下优点:

1、容量和性能可扩展

通过增加集群中的机器数量,可以扩展缓存的容量和并发读写能力。同时,缓存数据对于应用来讲都是共享的。

2、高可用性

由于数据被分布在多台机器上,即使其中一台机器故障,缓存服务也能继续提供服务。

但是分布式缓存的缺点同样不容忽视。

1、网络延迟

分布式缓存通常需要通过网络通信来进行数据读写,可能会出现网络延迟等问题,相对于本地缓存而言,响应时间更长。

2、复杂性

分布式缓存需要考虑序列化、数据分片、缓存大小等问题,相对于本地缓存而言更加复杂。


举一个真实的案例,这次案例让笔者对于分布式缓存的认知提上了另一个台阶。

2014年,同事开发了比分直播的系统,所有的请求都是从分布式缓存 Memcached 中获取后直接响应。常规情况下,从缓存中查询数据非常快,但在线用户稍微多一点,整个系统就会特别卡。

通过 jstat 命令发现 GC 频率极高,几次请求就将新生代占满了,而且 CPU 的消耗都在 GC 线程上。初步判断是缓存值过大导致的,果不其然,缓存大小在 300k 到 500k 左右。

解决过程还比较波折,分为两个步骤:

  1. 修改新生代大小,从原来的 2G 修改成 4G,并精简缓存数据大小 (从平均 300k 左右降为 80k 左右);

  2. 缓存拆成两个部分,第一部分是全量数据,第二部分是增量数据(数据量很小)。页面第一次请求拉取全量数据,当比分有变化的时候,通过 websocket 推送增量数据。

经过这次优化,笔者理解到:缓存虽然可以提升整体速度,但是在高并发场景下,缓存对象大小依然是需要关注的点,稍不留神就会产生事故。另外我们也需要合理地控制读取策略,最大程度减少 GC 的频率 , 从而提升整体性能。

4 多级缓存

开源中国网站最开始完全是用本地缓存框架 Ehcache 。后来随着访问量的激增,出现了一个可怕的问题:“因为 Java 程序更新很频繁,每次更新的时候都要重启。一旦重启后,整个 Ehcache 缓存里的数据都被清掉。重启后若大量访问进来的话,开源中国的数据库基本上很快就会崩掉”。

于是,开源中国开发了多级缓存框架  J2Cache,使用了多级缓存 Ehcache + Redis

多级缓存有如下优势:

  1. 离用户越近,速度越快;

  2. 减少分布式缓存查询频率,降低序列化和反序列化的 CPU 消耗;

  3. 大幅度减少网络 IO 以及带宽消耗。

本地缓存做为一级缓存,分布式缓存做为二级缓存,首先从一级缓存中查询,若能查询到数据则直接返回,否则从二级缓存中查询,若二级缓存中可以查询到数据,则回填到一级缓存中,并返回数据。若二级缓存也查询不到,则从数据源中查询,将结果分别回填到一级缓存,二级缓存中。

ee0f429a0e69aa7b1c8b78beaebeb54d.png

2018年,笔者服务的一家电商公司需要进行 app 首页接口的性能优化。笔者花了大概两天的时间完成了整个方案,采取的是两级缓存模式,同时利用了 Guava 的惰性加载机制,整体架构如下图所示:

e41df6cd4f39932a5f41e3632846c4fb.png

缓存读取流程如下:

1、业务网关刚启动时,本地缓存没有数据,读取 Redis 缓存,如果 Redis 缓存也没数据,则通过 RPC 调用导购服务读取数据,然后再将数据写入本地缓存和 Redis 中;若 Redis 缓存不为空,则将缓存数据写入本地缓存中。

2、由于步骤1已经对本地缓存预热,后续请求直接读取本地缓存,返回给用户端。

3、Guava 配置了 refresh 机制,每隔一段时间会调用自定义 LoadingCache 线程池(5个最大线程,5个核心线程)去导购服务同步数据到本地缓存和 Redis 中。

优化后,性能表现很好,平均耗时在 5ms 左右。最开始我以为出现问题的几率很小,可是有一天晚上,突然发现 app 端首页显示的数据时而相同,时而不同。

也就是说:虽然 LoadingCache 线程一直在调用接口更新缓存信息,但是各个 服务器本地缓存中的数据并非完成一致。说明了两个很重要的点:

1、惰性加载仍然可能造成多台机器的数据不一致

2、LoadingCache 线程池数量配置的不太合理,  导致了线程堆积

最终,我们的解决方案是:

1、惰性加载结合消息机制来更新缓存数据,也就是:当导购服务的配置发生变化时,通知业务网关重新拉取数据,更新缓存。

2、适当调大 LoadigCache 的线程池参数,并在线程池埋点,监控线程池的使用情况,当线程繁忙时能发出告警,然后动态修改线程池参数。

5 总结

Fred Brooks 在 1987 年所发表的一篇关于软件工程的经典论文《没有银弹:软件工程的本质性与附属性工作》。

论文强调真正的银弹并不存在,而所谓的银弹则是指没有任何一项技术或方法可以能让软件工程的生产力在十年内提高十倍。

通俗来讲:在技术领域中没有一种通用的解决方案可以解决所有问题。技术本质上是为了解决问题而存在的,每个问题都有其独特的环境和限制条件,没有一种通用的技术或工具可以完美地解决所有问题。

缓存是把双刃剑,一方面我们享受缓存带来的系统性能提升,另一方面引入缓存会提高系统复杂度,因为你要考虑缓存的失效、更新、一致性等问题。

在面临缓存选型时,一定要结合业务场景,研发效率,运维成本,人力模型,技术储备等因素,做出合理的选择。

推荐

Java面试题宝典

技术内卷群,一起来学习!!

a3b01ec470b474c967cdba2f5db46873.jpeg

PS:因为公众号平台更改了推送规则,如果不想错过内容,记得读完点一下“在看”,加个“星标”,这样每次新文章推送才会第一时间出现在你的订阅列表里。点“在看”支持我们吧!

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

本地缓存和分布式缓存,该怎么选? 的相关文章

随机推荐

  • 告别混乱代码,这份 SpringBoot 后端接口规范太及时了!

    文章目录 一 前言二 环境说明三 参数校验 1 介绍2 Validator 43 自动抛出异常 xff08 使用 xff09 3 分组校验和递归校验4 自定义校验四 全局异常处理 1 基本使用2 自定义异常五 数据统一响应六 全局处理响应数
  • 一行代码搞定 HTTP 请求,强得离谱~

    OKHttpUtil 在Java的世界中 xff0c Http客户端之前一直是Apache家的HttpClient占据主导 xff0c 但是由于此包较为庞大 xff0c API又比较难用 xff0c 因此并不使用很多场景 而新兴的OkHtt
  • SpringBoot 集成 Dubbo 启用 gRPC 协议

    本文记录下SpringBoot集成Dubbo启用gRPC协议 xff0c 以及与原生 gRPC 在代码编写过程中的区别 前言 Dubbo 在 2 7 5 版本开始支持原生 gRPC 协议 xff0c 对于计划使用 HTTP 2 通信或者期望
  • 吊打面试官,最常见的 SpringCloud 微服务面试题(VIP典藏版)

    Spring Cloud微服务面试题 Spring Cloud Netflix和Spring Cloud Alibaba包括哪些组件Nacos是CP还是AP Nacos作为注册中心应该选择是CP还是AP xff1f Nacos如何实现就近访
  • 3 个腾讯开源的 GitHub 项目,足够惊艳!

    01系统清理工具 去年腾讯开源了一个系统清理工具 xff1a 腾讯柠檬清理 xff0c 该软件可以系统性解决 macOS 设备空间问题 重点聚焦清理功能 xff0c 对上百款软件提供定制化的清理方案 xff0c 提供专业的清理建议 xff0
  • 废物利用,拿自己的旧电脑搭建个服务器吧!

    最近总是想搭建自己的网站 xff0c 奈何皮夹里空空如也 xff0c 服务器也租不起 xff0c 更别说域名了 于是我就寻思能否自己搭建个服务器 xff0c 还不要钱呢 xff1f 还真行 xff01 xff01 xff01 经过几天的冲浪
  • android studio 的gradle配置

    android studio的gradle 设置如下 project level settings 选择gradle是采用默认的即网上下载的还是选择本地即离线安装包 这里我们一般选择本地离线安装包 Global gradle setting
  • 在同事面前炫一把,用 Docker 搭建更酷的本地开发环境

    以前要在本地跑一些有意思的工程和实验 xff0c 都需要通过在本地装上一大堆软件来实现 最近发现有一种更酷的方式 xff1a Docker 用Docker在本地搭建开发环境有一系列显而易见的优势 xff1a 不用依赖公司的资源 xff0c
  • OAuth三方授权登录

    一 OAuth简介 1 OAuth2 0介绍 1 1 介绍 OAuth协议 xff1a https www rfc editor org rfc rfc6749 OAuth xff08 Open Authorization xff09 是一
  • 今年这面试难度,我给跪了……

    铜三铁四结束了 xff0c 总是有很多Java程序员跳槽 xff0c 但是大部分人 xff0c 只是从一个坑中 xff0c 跳入另一个坑中 在我看来 xff0c 真正有意义的跳槽 xff0c 是薪资能实现爆炸式增长的 这件事不容易 xff0
  • 刚过5.1,一波金三银四面试总结……

    在面试跳槽前 xff0c 给大家整理了一份大厂加强版面试 43 技术资料供大家修炼 我是按技术栈种类汇总整理的 xff1a 主要有Java 集合 JVM 多线程 设计模式 算法调优 Spring全家桶 MyBatis ZooKeeper D
  • 当 ChatGPT 续写《红楼梦》,能替代原著吗?我惊了!

    近段时间 xff0c 人工智能聊天机器人ChatGPT火爆网络 xff0c AI写作是否会让文字工作者被替代 xff1f 成为人们关注并持续讨论的话题 闲聊 问答 解题 写代码 写诗 创作小说 xff0c 连续回答 xff0c 不断纠错 x
  • 【保姆级教程】自定义注解实现 @Autowired 同款功能

    前置的啰啰嗦嗦 本文提供一个超级简单 超级简单 超级简单的约等于无脑创建自定义注解实现 64 Autowired同款功能的方法 xff0c 想立马实现可直接跳到第二部分 我们既然想自己搞一个跟 64 Autowired功能一样的注解 xff
  • 既然有了HTTP,为什么还需要RPC?一半以上的面试者回答不上来....

    今天我们就来聊一聊为什么在我们的分布式和微服务系统中 xff0c 有HTTP还要有RCP呢 xff1f 这两者又有什么区别呢 xff1f 这或许在面试的过程中也会被经常问到 xff0c 而且会结合者项目来问 问你你们项目用的是哪种通信技术方
  • Sublime Text 如果开源,拼得过 VS Code 吗?

    一名开发者在使用编辑器 Sublime Text 后 xff0c 发现它被 VS Code 超越主要是因为后者具有开源和免费的性质 因此他觉得 Sublime Text 也应该选择开源 xff0c 以和 VS Code 进行更好的竞争 图片
  • 网页版的 Redis 可视化工具来了,已开源!

    介绍 轻量级Redis缓存图形化管理工具 xff0c 包含redis的5种数据类型的CRUD操作 软件架构 后端 springboot 2 2 2 RELEASEJDK 1 8jedis 3 2 0commons lang3 3 5huto
  • 太顶了!简单几行代码,优雅的实现 SpringBoot 项目鉴权

    1 技术选型 今天最近在做登录 授权的功能 xff0c 一开始考虑到的是spring boot 43 spring security xff0c 但spring security太重 xff0c 而我们是轻量级的项目 xff0c 所以 xf
  • Qt 给已经开发好的程序快速封装成动态库

    https blog csdn net Cappuccino jay article details 126137458 QT 自定义工程封装成DLL并如何调用 xff08 带ui界面的 xff09 Cappuccino jay的博客 CS
  • 都在偷偷更新!Java 8 腰斩,Java 17 用户暴涨 430%

    New Relic 最新发布了一份 2023 年 Java 生态系统状况报告 xff0c 旨在提供有关当今 Java 生态系统状态的背景和见解 该报告基于从数百万个提供性能数据的应用程序中收集的数据 xff0c 对生产中使用最多的版本 最受
  • 本地缓存和分布式缓存,该怎么选?

    缓存 xff0c 消息队列 xff0c 分库分表是高并发解决方案三剑客 缓存之所以能够让系统 更快 xff0c 本质上做到了如下两点 xff1a 减小 CPU 消耗将原来需要实时计算的内容提前算好 把一些公用的数据进行复用 xff0c 这可