Skip to content

Commit ad917ef

Browse files
feat: 添加 redis 文章
1 parent 9f8447b commit ad917ef

11 files changed

+1215
-2
lines changed

README.md

Lines changed: 1 addition & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -48,7 +48,7 @@
4848
# :baby_chick: Redis
4949

5050
**面试八股文**
51-
- [『玩转Redis面试篇』看完这20道Redis面试题,阿里面试可以约起来了](docs/expert/middleware/redis/看完这20道Redis面试题,阿里面试可以约起来了.md)
51+
- [『玩转Redis面试篇』看完这20道Redis面试题,阿里面试可以约起来了:+1::+1:](docs/redis/看完这20道Redis面试题,阿里面试可以约起来了.md)
5252

5353
**知识点详解**
5454
- [『玩转Redis基础篇』Redis数据结构和常用命令速记](https://mp.weixin.qq.com/s?__biz=MzIwODI1OTk1Nw==&mid=2650320964&idx=1&sn=c7c3435f8c9dc1b4657034dbc1f1510d&chksm=8f09ce5eb87e4748982d88402ab7d95c2770ed80813e634c42464cec671355b30a8dc53a5384&token=875646549&lang=zh_CN#rd)
@@ -68,7 +68,6 @@
6868
- [『玩转Redis实战篇』记一次由Redis分布式锁造成的重大事故,避免以后踩坑!](https://mp.weixin.qq.com/s?__biz=MzIwODI1OTk1Nw==&mid=2650321391&idx=2&sn=272aafc2c051e3b969efb921b5ab4e81&chksm=8f09cff5b87e46e35b7ca948e08c30a7cf7b20f1254c8609a5e910faeaae738fe035547fec95&token=875646549&lang=zh_CN#rd)
6969

7070

71-
7271
# :tiger: 消息队列(kafka)
7372
- [Kafka支持百万级TPS的秘密都藏在这里:+1::+1::+1:](docs/expert/middleware/mq/Kafka支持百万级TPS的秘密都藏在这里.md)
7473
- [刨根问底,kafka到底会不会丢消息:+1::+1::+1:](docs/expert/middleware/mq/刨根问底,kafka到底会不会丢消息.md)
Lines changed: 92 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,92 @@
1+
> 本文首发我的微信公众号『[爱笑的架构师](https://mp.weixin.qq.com/s?__biz=MzIwODI1OTk1Nw==&mid=2650320964&idx=1&sn=c7c3435f8c9dc1b4657034dbc1f1510d&chksm=8f09ce5eb87e4748982d88402ab7d95c2770ed80813e634c42464cec671355b30a8dc53a5384&token=875646549&lang=zh_CN#rd)』,欢迎大家关注。
2+
3+
<!-- TOC -->
4+
5+
- [1. String字符串](#1--string字符串)
6+
- [2. Hash哈希](#2-hash哈希)
7+
- [3. List列表](#3-list列表)
8+
- [4. Set集合](#4-set集合)
9+
- [5. Sorted Set有序集合](#5-sorted-set有序集合)
10+
- [6. Redis常用命令参考](#6-redis常用命令参考)
11+
12+
<!-- /TOC -->
13+
14+
Redis是key-value数据库,key的类型只能是String,但是value的数据类型就比较丰富了,主要包括五种:
15+
16+
* String
17+
* Hash
18+
* List
19+
* Set
20+
* Sorted Set
21+
22+
<div align="center"> <img src="https://cdn.jsdelivr.net/gh/SmileLionCoder/assets@main/202010/20201025211352.png" width="300"/> </div><br>
23+
24+
## 1. String字符串
25+
26+
**语法**
27+
28+
```plain
29+
SET KEY_NAME VALUE
30+
```
31+
string类型是二进制安全的。意思是redis的string可以包含任何数据。比如jpg图片或者序列化的对象。
32+
string类型是Redis最基本的数据类型,一个键最大能存储512MB。
33+
34+
## 2. Hash哈希
35+
36+
**语法**
37+
38+
```plain
39+
HSET KEY_NAME FIELD VALUE
40+
```
41+
Redis hash 是一个键值(key=>value)对集合。
42+
Redis hash是一个string类型的field和value的映射表,hash特别适合用于存储对象。
43+
44+
## 3. List列表
45+
46+
**语法**
47+
48+
```plain
49+
//在 key 对应 list 的头部添加字符串元素
50+
LPUSH KEY_NAME VALUE1.. VALUEN
51+
52+
//在 key 对应 list 的尾部添加字符串元素
53+
RPUSH KEY_NAME VALUE1..VALUEN
54+
55+
//对应 list 中删除 count 个和 value 相同的元素
56+
LREM KEY_NAME COUNT VALUE
57+
58+
//返回 key 对应 list 的长度
59+
LLEN KEY_NAME
60+
```
61+
Redis 列表是简单的字符串列表,按照插入顺序排序。
62+
可以添加一个元素到列表的头部(左边)或者尾部(右边)
63+
64+
## 4. Set集合
65+
66+
**语法**
67+
68+
```plain
69+
SADD KEY_NAME VALUE1...VALUEn
70+
```
71+
Redis的Set是string类型的无序集合。
72+
集合是通过哈希表实现的,所以添加,删除,查找的复杂度都是O(1)。
73+
74+
## 5. Sorted Set有序集合
75+
76+
**语法**
77+
78+
```plain
79+
ZADD KEY_NAME SCORE1 VALUE1.. SCOREN VALUEN
80+
```
81+
Redis zset 和 set 一样也是string类型元素的集合,且不允许重复的成员。
82+
不同的是每个元素都会关联一个double类型的分数。
83+
84+
redis正是通过分数来为集合中的成员进行从小到大的排序。
85+
86+
zset的成员是唯一的,但分数(score)却可以重复。
87+
88+
## 6. Redis常用命令参考
89+
90+
更多命令语法可以参考官网手册:
91+
92+
[https://www.redis.net.cn/order/](https://www.redis.net.cn/order/)
File renamed without changes.
Lines changed: 176 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,176 @@
1+
> 本文首发我的微信公众号『[爱笑的架构师](https://mp.weixin.qq.com/s?__biz=MzIwODI1OTk1Nw==&mid=2650321284&idx=1&sn=63f0143fd3a7ef408b9810d5208cd343&chksm=8f09cf9eb87e4688a8faef2c7dd4c70139b7a04e512a7adc266de46261477518b77e6af7d54a&token=875646549&lang=zh_CN#rd)』,欢迎大家关注。
2+
3+
<!-- TOC -->
4+
5+
- [缓存穿透](#缓存穿透)
6+
- [什么是缓存穿透?](#什么是缓存穿透)
7+
- [缓存穿透常用的解决方案](#缓存穿透常用的解决方案)
8+
- [缓存击穿](#缓存击穿)
9+
- [什么是缓存击穿?](#什么是缓存击穿)
10+
- [缓存击穿危害](#缓存击穿危害)
11+
- [如何解决](#如何解决)
12+
- [缓存雪崩](#缓存雪崩)
13+
- [什么是缓存雪崩?](#什么是缓存雪崩)
14+
- [缓存雪崩解决方案](#缓存雪崩解决方案)
15+
- [缓存预热](#缓存预热)
16+
- [什么是缓存预热?](#什么是缓存预热)
17+
- [缓存预热的操作方法](#缓存预热的操作方法)
18+
- [缓存降级](#缓存降级)
19+
20+
<!-- /TOC -->
21+
22+
<img src="https://cdn.jsdelivr.net/gh/CoderLeixiaoshuai/assets/202102/20210504215632-2021-05-04-21-56-33.png" alt="20210504215632-2021-05-04-21-56-33">
23+
24+
在实际生产环境中有时会遇到缓存穿透、缓存击穿、缓存雪崩等异常场景,为了避免异常带来巨大损失,我们需要了解每种异常发生的原因以及解决方案,帮助提升系统可靠性和高可用。
25+
26+
## 缓存穿透
27+
28+
### 什么是缓存穿透?
29+
30+
缓存穿透是指用户请求的数据在缓存中不存在即没有命中,同时在数据库中也不存在,导致用户每次请求该数据都要去数据库中查询一遍,然后返回空。
31+
32+
如果有恶意攻击者不断请求系统中不存在的数据,会导致短时间大量请求落在数据库上,造成数据库压力过大,甚至击垮数据库系统。
33+
34+
### 缓存穿透常用的解决方案
35+
36+
**(1)布隆过滤器(推荐)**
37+
38+
布隆过滤器(Bloom Filter,简称BF)由Burton Howard Bloom在1970年提出,是一种空间效率高的概率型数据结构。
39+
40+
**布隆过滤器专门用来检测集合中是否存在特定的元素。**
41+
42+
如果在平时我们要判断一个元素是否在一个集合中,通常会采用查找比较的方法,下面分析不同的数据结构查找效率:
43+
44+
* 采用线性表存储,查找时间复杂度为O(N)
45+
* 采用平衡二叉排序树(AVL、红黑树)存储,查找时间复杂度为O(logN)
46+
* 采用哈希表存储,考虑到哈希碰撞,整体时间复杂度也要O[log(n/m)]
47+
48+
当需要判断一个元素是否存在于海量数据集合中,不仅查找时间慢,还会占用大量存储空间。接下来看一下布隆过滤器如何解决这个问题。
49+
50+
**布隆过滤器设计思想**
51+
52+
布隆过滤器由一个长度为m比特的位数组(bit array)与k个哈希函数(hash function)组成的数据结构。位数组初始化均为0,所有的哈希函数都可以分别把输入数据尽量均匀地散列。
53+
54+
当要向布隆过滤器中插入一个元素时,该元素经过k个哈希函数计算产生k个哈希值,以哈希值作为位数组中的下标,将所有k个对应的比特值由0置为1。
55+
56+
当要查询一个元素时,同样将其经过哈希函数计算产生哈希值,然后检查对应的k个比特值:如果有任意一个比特为0,表明该元素一定不在集合中;如果所有比特均为1,表明该集合有可能性在集合中。为什么不是一定在集合中呢?因为不同的元素计算的哈希值有可能一样,会出现哈希碰撞,导致一个不存在的元素有可能对应的比特位为1,这就是所谓“假阳性”(false positive)。相对地,“假阴性”(false negative)在BF中是绝不会出现的。
57+
58+
总结一下:布隆过滤器认为不在的,一定不会在集合中;布隆过滤器认为在的,可能在也可能不在集合中。
59+
60+
举个例子:下图是一个布隆过滤器,共有18个比特位,3个哈希函数。集合中三个元素x,y,z通过三个哈希函数散列到不同的比特位,并将比特位置为1。当查询元素w时,通过三个哈希函数计算,发现有一个比特位的值为0,可以肯定认为该元素不在集合中。
61+
62+
<div align="center"> <img src="https://cdn.jsdelivr.net/gh/SmileLionCoder/assets@main/202010/20201025213820.png" width="500"/> </div><br>
63+
64+
**布隆过滤器优缺点**
65+
66+
优点:
67+
68+
* 节省空间:不需要存储数据本身,只需要存储数据对应hash比特位
69+
* 时间复杂度低:插入和查找的时间复杂度都为O(k),k为哈希函数的个数
70+
71+
缺点:
72+
73+
* 存在假阳性:布隆过滤器判断存在,可能出现元素不在集合中;判断准确率取决于哈希函数的个数
74+
* 不能删除元素:如果一个元素被删除,但是却不能从布隆过滤器中删除,这也是造成假阳性的原因了
75+
76+
**布隆过滤器适用场景**
77+
78+
* 爬虫系统url去重
79+
* 垃圾邮件过滤
80+
* 黑名单
81+
82+
**(2)返回空对象**
83+
84+
当缓存未命中,查询持久层也为空,可以将返回的空对象写到缓存中,这样下次请求该key时直接从缓存中查询返回空对象,请求不会落到持久层数据库。为了避免存储过多空对象,通常会给空对象设置一个过期时间。
85+
86+
这种方法会存在两个问题:
87+
88+
* 如果有大量的key穿透,缓存空对象会占用宝贵的内存空间。
89+
* 空对象的key设置了过期时间,在这段时间可能会存在缓存和持久层数据不一致的场景。
90+
## 缓存击穿
91+
92+
### 什么是缓存击穿?
93+
94+
缓存击穿,是指一个key非常热点,在不停的扛着大并发,大并发集中对这一个点进行访问,当这个key在失效的瞬间,持续的大并发就穿破缓存,直接请求数据库,就像在一个屏障上凿开了一个洞。
95+
96+
### 缓存击穿危害
97+
数据库瞬时压力骤增,造成大量请求阻塞。
98+
99+
### 如何解决
100+
101+
**使用互斥锁(mutex key)**
102+
103+
这种思路比较简单,就是让一个线程回写缓存,其他线程等待回写缓存线程执行完,重新读缓存即可。
104+
105+
<div align="center"> <img src="https://cdn.jsdelivr.net/gh/SmileLionCoder/assets@main/202010/20201025213939.png" width="500"/> </div><br>
106+
107+
同一时间只有一个线程读数据库然后回写缓存,其他线程都处于阻塞状态。如果是高并发场景,大量线程阻塞势必会降低吞吐量。这种情况如何解决?大家可以在留言区讨论。
108+
109+
如果是分布式应用就需要使用分布式锁。
110+
111+
**热点数据永不过期**
112+
113+
永不过期实际包含两层意思:
114+
115+
* 物理不过期,针对热点key不设置过期时间
116+
* 逻辑过期,把过期时间存在key对应的value里,如果发现要过期了,通过一个后台的异步线程进行缓存的构建
117+
118+
<div align="center"> <img src="https://cdn.jsdelivr.net/gh/SmileLionCoder/assets@main/202010/20201025213959.png" width="500"/> </div><br>
119+
120+
从实战看这种方法对于性能非常友好,唯一不足的就是构建缓存时候,其余线程(非构建缓存的线程)可能访问的是老数据,对于不追求严格强一致性的系统是可以接受的。
121+
122+
## 缓存雪崩
123+
124+
### 什么是缓存雪崩?
125+
126+
缓存雪崩是指缓存中数据大批量到过期时间,而查询数据量巨大,请求直接落到数据库上,引起数据库压力过大甚至宕机。和缓存击穿不同的是,缓存击穿指并发查同一条数据,缓存雪崩是不同数据都过期了,很多数据都查不到从而查数据库。
127+
128+
### 缓存雪崩解决方案
129+
130+
常用的解决方案有:
131+
132+
* 均匀过期
133+
* 加互斥锁
134+
* 缓存永不过期
135+
* 双层缓存策略
136+
137+
(1)均匀过期
138+
139+
设置不同的过期时间,让缓存失效的时间点尽量均匀。通常可以为有效期增加随机值或者统一规划有效期。
140+
141+
(2)加互斥锁
142+
143+
跟缓存击穿解决思路一致,同一时间只让一个线程构建缓存,其他线程阻塞排队。
144+
145+
(3)缓存永不过期
146+
147+
跟缓存击穿解决思路一致,缓存在物理上永远不过期,用一个异步的线程更新缓存。
148+
149+
(4)双层缓存策略
150+
151+
使用主备两层缓存:
152+
153+
主缓存:有效期按照经验值设置,设置为主读取的缓存,主缓存失效后从数据库加载最新值。
154+
155+
备份缓存:有效期长,获取锁失败时读取的缓存,主缓存更新时需要同步更新备份缓存。
156+
157+
## 缓存预热
158+
159+
### 什么是缓存预热?
160+
161+
缓存预热就是系统上线后,将相关的缓存数据直接加载到缓存系统,这样就可以避免在用户请求的时候,先查询数据库,然后再将数据回写到缓存。
162+
163+
如果不进行预热, 那么 Redis 初始状态数据为空,系统上线初期,对于高并发的流量,都会访问到数据库中, 对数据库造成流量的压力。
164+
165+
### 缓存预热的操作方法
166+
167+
* 数据量不大的时候,工程启动的时候进行加载缓存动作;
168+
* 数据量大的时候,设置一个定时任务脚本,进行缓存的刷新;
169+
* 数据量太大的时候,优先保证热点数据进行提前加载到缓存。
170+
## 缓存降级
171+
172+
缓存降级是指缓存失效或缓存服务器挂掉的情况下,不去访问数据库,直接返回默认数据或访问服务的内存数据。
173+
174+
在项目实战中通常会将部分热点数据缓存到服务的内存中,这样一旦缓存出现异常,可以直接使用服务的内存数据,从而避免数据库遭受巨大压力。
175+
176+
降级一般是有损的操作,所以尽量减少降级对于业务的影响程度。

0 commit comments

Comments
 (0)