Redis最佳实践:系统性能提升了10倍,真香!
👉 这是一个或许对你有用的社群
🐱 一对一交流/面试小册/简历优化/求职解惑,欢迎加入「芋道快速开发平台」知识星球。下面是星球提供的部分资料:
《项目实战(视频)》:从书中学,往事上“练” 《互联网高频面试题》:面朝简历学习,春暖花开 《架构 x 系统设计》:摧枯拉朽,掌控面试高频场景题 《精进 Java 学习指南》:系统学习,互联网主流技术栈 《必读 Java 源码专栏》:知其然,知其所以然
👉这是一个或许对你有用的开源项目
国产 Star 破 10w+ 的开源项目,前端包括管理后台 + 微信小程序,后端支持单体和微服务架构。
功能涵盖 RBAC 权限、SaaS 多租户、数据权限、商城、支付、工作流、大屏报表、微信公众号、CRM 等等功能:
Boot 仓库:https://gitee.com/zhijiantianya/ruoyi-vue-pro Cloud 仓库:https://gitee.com/zhijiantianya/yudao-cloud 视频教程:https://doc.iocoder.cn 【国内首批】支持 JDK 21 + SpringBoot 3.2.2、JDK 8 + Spring Boot 2.7.18 双版本
前言
在当今互联网项目中,几乎80%的的项目都有使用redis。但在其应用过程中,总是或多或少遇到过一些问题。比如:
redis内存为什么会增长这么快? redis为什么读取操作越来越慢? 怎么样降低redis故障的频率? redis的运维需要注意些什么? redis部署时,如何做好资源使用的规划? 对redis的监控应该要注意哪些指标?
特别是当你的应用对redis非常依赖的前提下,那么这些问题就显得尤为突出。
那么这个时候,这时候需要对redis的使用有一份最佳实践文档来助你轻松管理redis。下面就将以7个维度,全面解析redis的最佳使用及优化:
【内存、性能、高可靠、日常运维、资源控制、redis监控及安全】
基于 Spring Boot + MyBatis Plus + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能
项目地址:https://github.com/YunaiV/ruoyi-vue-pro 视频教程:https://doc.iocoder.cn/video/
最佳实战
redis怎么使用内存更优
我们大家都知道,redis性能如此强大的原因为基于内存的单线程操作,所以对于数据的读写都是非常之快的。但从资源层面来说,服务器的内存资源代价还是比磁盘要大得多的。一个项目中比较少使用redis的时候,你也可能不太会注意它的内存状态。但随着业务量的增大,redis里存储的数据可能就会成倍的增长。如果没有提前规划好redis的内存使用,想必肯定会出现不可预测的问题。那么我们如何来优化redis的内存使用呢?
01 key的长度必须
前面说了redis是基于内存的数据存储系统,因此key和其数据都会占用内存空间。当redis key比较多且长度较长时,会占用更多的内存空间,当内存增加时,还可能触发内存淘汰策略或导致redis内存的耗尽,影响系统的稳定性及性能。因此,在使用redis的过程中,应尽量控制key的长度。可在代码的redis key常量中注明key的业务。但在redis时可以以简写的方式进行保存。如:user_info_properties
可以简写为:u_i_prop
等等。
02 注意bigkey的存储
在控制了key的长度后,redis value的大小也同样要注意使用。单个key不要存储太多的数据,否则也会导致redis内存极速的增大。并且在程序中读取bigkey时,还会产生性能问题,读取频繁的情况下,甚至会导致整个系统的崩溃。因此,为了避免产生bigkey,在使用redis的过程中String类型value值尽量控制在10kb以内,其它几个集合类型value值,尽量控制在5000以下。
03 根据业务选择合适redis数据类型存储
redis数据存储相对于mongo,memcache等其它nosql数据库来说,提供了丰富的数据存储类型,主要有:String、List、Set、Hash、Sorted Set五大数据类型。这几大数据类型主要可以存储的数据有:
String类型: 以key-value的形式存储,是二进制安全的,可以存储包括数字、字符、图片和序列化后的对象等数据。 Hash类型: 其值本身是键值对的形式,以key-field-value的形式存储,可以理解为一个小的key-value存储,方便进行数据的存储和读取。 List类型: Redis采用的是双端链表实现的,可以用来存储多个值,实现队列和栈的数据结构。 Set类型: 可以用来实现去重等功能,Set类型中的元素是无序的,且不重复。 Sorted Set类型: 具有类似Set类型的去重功能,但是可以根据分值进行排序。
04 不要把redis当数据库使用
redis的数据是存储在内存中的,这就意味着,在使用redis时资源是有限制的。你不能把它当作是数据使用,什么数据都往里面塞。这样redis坑定是扛不住的。
一般建议是只需要把经常使用的【热数据】且量小的数据热加载到缓存中,然后其它数据按需进行加载,避免一次性全部加载到redis。并且在使用redis存储数据时,你还必须得为key设置必要的过期时间。否则没用的数据也一直留在redis中,只会占着茅坑不拉屎,白白的浪费了资源(redis过期时间设置也是需要有针对性的设置,否则可能会造成缓存雪崩及击穿问题)。
如何最大的发挥redis的性能优势
每个系统使用redis的目的,无一例外就是看中redis的快(也就是高性能),有数据表面,一个单机版的redis,就可以达到10万的QPS,性能如此之高,我想如果不是因为高可用问题,我想一个单机版的redis就可以满足绝大部分项目使用了吧!那么如何发挥出redis真正的高性能状态避免出现操作延迟的情况下发生呢?
01 千说万说还是bigkey
bigkey的出现除了前面说的占用内存的问题外,其对性能的影响也是一大问题。众所周知,redis的请求是以单线程模式请求,当你写入或者读取或者删除一个bigkey时,会在redis的内存分配上消耗巨大的时间。
如此,你单次操作redis的耗时就回升高,从而堵塞redis的所有请求,导致redis的性能下降。如果该bigkey同时又是个热key的话,那不好意思,你的整个系统可能因此就会崩溃从而宕机。如此,就会出现后果不可预料的生产事故!所以,系统里应该不要出现bigkey的情况,如果数据实在太多,可以根据业务,对key进行拆分保存。
02 复杂度过高命令不使用
redis在执行复杂度过高的命令时,会消耗很多的CPU资源,那么基于redis是单线程这个模型,其它请求的线程只能等待,此时就也会发生延迟的情况。从而导致类似bigkey的情况发生。所以,在使用redis的过程中,应该尽量不要使用SORT
、SINTERSTORE
、SINTER
等这些聚合的命令。
03 多使用批量命令
如果你在程序中有这个业务,一次性要处理很多个key的情况。那么批量命令处理就是你的最佳选择。批量命令相对于一个个的执行来说,可以显著的减少客户端服务端的IO请求次数以达到提高性能的要求。如:
使用 MGET/MSET
替代 GET/SET
,HMGET/HMSET
替代 HGET/HSET
,
使用Pipeline管道,一次发送多个命令到redis
04 key过期时间设置不要太集中
在前面有提到过,在业务中使用redis,都必须为大部分的key设置一个过期时间,以达到节省内存的目的。但在为key设置过期时间时,要尽量避免每个key的过期时间不要太集中。如果某一时间存在大量key过期的情况,redis在清理这些key时,也会出现线程风暴出现大量被阻塞的线程。亦或是出现缓存雪崩的情况,大量请求因此而打到数据库,从而造成数据的瞬间压力飙升,导致一系列的性能问题。
05 合理的使用redis线程池
在使用redis的时,通常是使用池化技术进行redis的请求。但使用池化技术时,应当合理的设置线程池的参数配置,长时间不操作redis应当及时释放,根据CPU核数合理设置最大连接数等等。
06 使用读写分离或者集群
在文章开头有讲到,redis单机QPS支撑达到了10万。但此种部署方法达不到高可用。redis如果因为某些原因挂了,那么就会直接导致整个系统的崩溃,这是不可接受的。那么如何把redis的性能得到提升的同时从而实现高可用呢?那么你可以把redis进行哨兵模式或者集群模式部署。两种方式各有优缺点,你可以按需选择。
哨兵模式:
优点:
高可靠性:如果一个节点失效,哨兵将自动选举出一个新的主节点并将应用程序重定向到它,无需手动操作。 简单:相对于其他Redis集群构建方式,哨兵模式需要配置的参数较少,容易上手。
缺点:
性能瓶颈:每个Redis节点都需要有一个哨兵节点,会影响Redis性能。 数据分片:哨兵集群不支持数据的分片,可能导致一些节点存储的数据较多,出现性能瓶颈。
集群模式:
优点:
数据被分成多个片段存储,减少了数据在单个节点上的存储,分摊了负载。 高扩展性:Redis节点在Redis分区模式中可以直接添加或删除,而无需停机。
缺点:
复杂度:分区集群较为复杂,因为它需要大量的Redis节点来存储分区数据,并且这些节点需要进行相当复杂的协调和同步以保持一致性。 节点故障的自动恢复:虽然Redis分区已经支持自动故障恢复,但是仍然有可能发生数据损坏或无法恢复的情况
07 AOF不开启或开启为每秒刷盘
对于能忍受数据丢失的业务系统来说,我想肯定是不开启AOF为好,这样可以不用同步数据到磁盘,减少开销提升性能。如果却要开启,那么建议你最好是配置appendfsync everysec,把同步放后台线程执行,从而降低写磁盘对redis性能的影响.
08 redis的部署方式
redis持久化数据时,使用的是创建子线程的方式进行。创建子线程会使用操作系统的fork,这个操作会比较耗时。虚拟环境下的fork操作会比物理机部署慢很多。所以redis也尽量不要部署到虚拟环境或者容器中,部署在物理机上redis性能也会得到极大的提升。
redis的可靠性
前面有提到,保证redis的高可用是一件很重要的事。防止redis因不可控因素导致的宕机事件导致的系统宕机。所以有必要对redis做一些可靠性的处理。
01 按业务部署
不同模块部署不同redis,比如:用户相关业务,订单相关业务,物流相关业务等。不同的业务我每个给它部署一个redis。这样就算某个redis挂了,也只是影响其中一部分业务,而不会影响到其它。但这种部署资源虽得到了隔离,但成本是会上升的。
02 集群或者哨兵部署
前面有讲解到了,给redis进行集群或者哨兵部署。是redis高可用的两种方式。两种方式都能保证redis的高可用。一个节点挂了,不影响redis的使用。
03 主从复制参数要合理配置
redis集群部署时,参数如果配置不合理,也是会发生问题的:
主从复制中断 从库发起全量复制,主库性能受到影响
合理的 repl-backlog
参数:过小的 repl-backlog 在写流量比较大的场景下,主从复制中断会引发全量复制数据的风险
合理的 slave client-output-buffer-limit
:从库复制发生问题时,过小的 buffer 会导致从库缓冲区溢出,从而导致复制中断
redis运维要注意什么
如果你是一名运维人员,那么你也需要注意些redis运维方面的问题
01 系统运行期间禁止执行keys、flushdb、flushall命令
keys命令是模糊搜索命令,是一个极其耗性能的命令。如果在系统运行期间或者高峰时间段执行此命令,极易引起线程的阻塞,从而出现问题。flushdb跟flushall就不说了,直接清空所有。虽说业务可能做了redis读不到就去读redis这些处理。当你可想而知执行了这个命令的后果。
02 从库必须设置slave-read-only
从库必须设置为 slave-read-only
状态,如果不设置,那么可能会导致从库写入数据,从而导致主库从库数据的不一致。除了这个外,从库如果是非slave-read-only
状态,如果你使用的是 4.0 以下的 Redis,它存在这样的 Bug:从库写入了有过期时间的数据,不会做定时清理和释放内存。这会造成从库的内存泄露!这个问题直到 4.0 版本才修复。
03 设置耗时命令记录
记录耗时命令,有助于当redis出现性能问题时,排查耗时命令,好针对性去优化。
slowlog-log-slower-than
:用于设置记录耗时超过指定微秒数的命令。默认值为10000微秒,即10毫秒。slowlog-max-len
:用于限制记录的条数。默认值为128条。
可以通过配置文件的slowlog-log-slower-than
参数设置这一限制,要注意单位是微秒(1 000 000 微秒相当于1秒),默认值是10 000。耗时命令日志存储在内存中,可以通过配置文件的 slowlog-max-len
参数来限制记录的条数。
04 maxmemory调整时,注意主库从库顺序
在Redis 5.0 以下版本:从库内存如果超过了 maxmemory,也会触发数据淘汰。在某些场景下,从库是可能优先主库达到 maxmemory 的,那么此时从库开始淘汰数据,主从库就会产生不一致。要想避免此问题,在调整 maxmemory 时,一定要注意主从库的修改顺序:
调大 maxmemory:先修改从库,再修改主库 调小 maxmemory:先修改主库,再修改从库
直到 Redis 5.0,Redis 才增加了一个配置 replica-ignore-maxmemory
,默认从库超过 maxmemory 不会淘汰数据,才解决了此问题。
redis安全问题
在当下互联网爆炸的时代,安全问题时无时无刻存在的。DDOS攻击,SQL注入攻击等等。其实redis也是可以被注入脚本进行攻击的。运维在部署或者运维redis时也要注意安全方面的问题。如:
Redis 不要部署在公网可访问的服务器 6379默认端口不要使用 把redis部署在普通用户而非root下 限制 Redis 配置文件的目录访问权限 推荐开启密码认证 禁用/重命名危险命令( KEYS/FLUSHALL/FLUSHDB/CONFIG/EVAL
)
redis的监控
针对redis的监控有很多种,如:Prometheus+grafana。监控的指标除了有基本的redis服务内存、磁盘、CPU这几项外。还必须得把redis连接数、slowlog等其它重要指标给监控起来。监控是保证一个系统提前发现问题的有力保证,避免了要出现问题才来手忙脚乱的处理问题。
基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能
项目地址:https://github.com/YunaiV/yudao-cloud 视频教程:https://doc.iocoder.cn/video/
结尾
总结以上所述,我们看到Redis作为一种高性能的内存数据存储系统,提供了许多强大的功能和灵活的用法。通过遵循最佳实践,我们可以确保Redis的性能、稳定性和可靠性。在设计和实施Redis解决方案时,我们需要充分了解其特性和限制,并考虑到数据安全性、持久性、扩展性和维护性等方面。
通过合理的配置、监控和优化,我们可以充分发挥Redis的优势,为企业和应用程序提供高效、可靠的数据存储和处理服务。最后,我们也要不断学习和探索新的Redis技术和最佳实践,以适应不断变化的应用需求和技术环境。
欢迎加入我的知识星球,全面提升技术能力。
👉 加入方式,“长按”或“扫描”下方二维码噢:
星球的内容包括:项目实战、面试招聘、源码解析、学习路线。
文章有帮助的话,在看,转发吧。
谢谢支持哟 (*^__^*)
微信扫码关注该文公众号作者