以下是针对redis的知识点整理,用于复习,主要以罗列为主,详细具体讲解可以参考书《Redis设计与实现》,你可以过一遍看看有无知识点遗漏。个人能力有限,如果你还有补充可以再下方评论指出,万分感谢。

基础知识点

  • 数据类型
    string (字符串)、list (列表)、set (集合)、hash (哈希) 和 zset (有序集合)
    底层实现包括:SDS动态字符串,双向链表,数组加链表,渐进式hash,跳表

  • redis是单线程

  • redis默认有16个数据库,默认先用0,可以使用select命令切换

  • 过期策略
    惰性删除:当这个key被访问到,但是已经过期,那就删除
    定期删除:过一定时间,拿出一定的key判断,进行删除,如果超过一定数量,继续拿出一定的key进行判断删除,时间存在上限

  • 内存超限
    当redis使用超过内存限制会根据策略来执行:
    noeviction:不能put,但是可以del和get,默认是这个策略
    volatile-lru:在有过期时间的key中,淘汰最少用的(redis是近似lru算法,会随机取几个淘汰最少用的)
    volatile-ttl:在有过期时间的key中,淘汰过期时间最短的(剩下寿命最短的)
    volatile-random:在有过期时间的key中,随机淘汰
    allkeys-lru:所有key中,淘汰最少用的
    allkeys-random:所有key中,随机淘汰

  • 持久化方式
    RDB、AOF、混合
    RDB:类似快照,将当前数据拍个照片保存,利用操作系统的 COW 机制来进行数据段页面的分离,进行对数据的复制,同时,新数据会在新的page上面
    AOF:利用日志来完成记录,当逻辑处理完成记录日志,利用日志重放来恢复,会对aof进行重写瘦身,通过fsync来保证数据刷到磁盘上面,1s一次
    混合:rdb存储,增量用AOF,重启后先读取rdb再重放aof

  • 通信协议
    RESP直观的文本协议,利用一些特殊字符来确定当前的是什么语句

  • redis事务
    redis可以使用multi/exec/discard。multi 指示事务的开始,exec 指示事务的执行,discard 指示事务的丢弃。redis是不支持回滚的,只能把当前所有的执行丢弃,事务性能不高,使用管道优化,提供watch机制监听改变,但是针对改变只是知道,但是不予处理。

  • keys和scan
    通过这两个命令可以找到对应的键,keys会卡,scan不会但是慢一点,可能会重复。

  • redis对内存优化
    在存放大key或者数量量大列表时,会对存储结构进行压缩,ziplist
    当删除多个键的时候内存不会马上被回收,因为操作系统的内存是按页来的,只有这个页上面的key全部删除才能回收,同时,新的key会利用删除后的空间

  • Pipeline
    网络交互中利用了内核的特性,客户发送消息时,只需要将消息写入本地缓存,就马上返回,不需要等待,后续操作由内核网关去异步发送,而读取返回消息时也是读取的本地相对应的读缓存,如果没有数据就需要等待网络返回数据从而从缓存中读取数据,这个时候是真正耗时的时候。

常用架构

  • 单机
    单个节点使用

  • 主从
    一方面是从做备份,一方面从可以提供get服务
    Redis同步的是指令流,增量同步,利用buffer进行缓冲,可能出现buffer充满的时候就需要进行快照复制,将主节点进行快照,然后直接发送给从节点,然后从节点删除所有数据,然后从节点进行加载,然后同步新的指令,速度慢。

  • 哨兵
    利用哨兵去自动选举出主节点,同时出现异常自动重新选出主节点

  • 集群
    codis:利用中间代理人去访问,将不同的槽位分配到相应的redis节点上面,client通过codis进行访问,codis可以配置多个,通过zk来同步槽位。
    cluster:官方给出,去中心化,自动维护槽位分布。

应用场景

  • 分布式锁
    setnx(set if not exists)
    一开始不支持设置过期时间,后来2.8更新后,命令为:set lock true ex 5 nx
    但是超时是存在问题的,如果再时间限制过程中,没有执行完,锁自动释放了,但是实际还在执行,但是别的线程可以抢到锁去执行了。

  • MQ
    可以利用list来实现消息队列的操作,rpop lpush,redis的list是一个双端队列,同时也支持阻塞拿出消息,来支持队列为空的时候的问题
    同时有PubSub支持订阅,但是少了很多功能如ack,不能保证数据一定成功发出,后面引入Stream

  • HyperLogLog
    用于模糊统计,可以用于统计网站的uv(单个用户访问只能算一次),利用矩阵。

  • GeoHash
    redis支持存储地理位置,并且进行附近统计和距离计算

  • 布隆过滤
    rebloom用于最大化效率去重,会有误判,利用hash原理。实际适用于:爬虫系统过滤已经查过的url、垃圾邮件过滤、缓存击穿防御等,总之用于数据量大、要求速度快、可以忍受误判的情况。

问题解决

缓存击穿

多次查询那些一定不存在的数据,或者当前数据不在缓存的高并发查询,导致巨大流量涌入数据库。
解决方式:

  1. 缓存空对象,如果可以缓存空对象,将空对象作为null缓存起来,让缓存强制命中(提前缓存或者惰性缓存均可)。存在问题:当空对象多时,浪费了缓存的空间。
  2. 利用布隆过滤器缓存出现过的key,保证不在过滤器里面的key一定不存在,布隆过滤器节省很多空间

缓存雪崩

情况一:多数类似缓存同时过期,导致对这些key的查询同时落到数据库。
情况二:缓存服务器直接挂掉,导致所有请求全部落到数据库,导致后续雪崩。
这里的解决方式就需要视情况而定:
情况一的话,可以尝试设置缓存过期时间为随机值,不让同类型缓存同时过期。
情况二的话,首先优先保证架构上面能压住,尽可能保证有redis的备份节点可以恢复,当然也要做planB,万一全部缓存节点全部挂,最前面网关层面要要做到限流,后续服务需要做降级或熔断,这个时候就不是缓存的问题了,就是架构的问题了。