Redis常见面试题之 - 内存淘汰算法
现在后端面试中比较喜欢问一些 Redis 的问题,比较常见的就是 内存淘汰算法。下面我们通过源码来分析 Redis 内存淘汰算法的实现,从而不会被面试官问到哑口无言。
Redis 内存使用限制设置
一般来说,要开启 Redis 的内存使用限制才会触发内存淘汰机制,Redis 内存使用限制通过以下配置来设置:
# 设置 Redis 最大使用内存大小为100M
maxmemory 100mb
上面的配置设置了,当 Redis 使用的内存超过 100Mb 时就开始对数据进行淘汰。
Redis 内存淘汰算法
而 Redis 的淘汰算法有多种,如下:
随机
TTL
LRU(Least Recently Used,最近最少使用)
LFU(Least Frequently Used,最不经常使用)
随机算法很好理解,就是从数据库中随机淘汰一些 Keys。而 TTL 算法就是从设置了过期时间的 Keys 中获取最早过期的 一批 Keys,然后淘汰这些 Keys。而 LRU 和 LFU 这两种算法在名字上比较容易混淆,所以这里介绍一下这两种算法的区别。
LRU算法
LRU 主要是通过 Key 的最后访问时间来判定哪些 Key 更适合被淘汰,如下图所示:
如上图所示,所有的 Keys 都根据最后被访问的时间来进行排序的,所以在淘汰时只需要按照所有 Keys 的最后被访问时间,由小到大来进行即可。
LFU算法
LFU算法主要通过 Key 的访问频率来统计哪些 Key 更适合被淘汰,如下图所示:
如上图所示,所有 Keys 都根据被访问次数进行排序,所以在淘汰时只需要按照所有 Keys 的被访问次数,由小到大来进行即可。
Redis 内存淘汰算法配置
可以通过 maxmemory-policy
配置项来设置 Redis 的内存淘汰算法,如下:
maxmemory-policy volatile-lru
可以根据应用的使用场景来选择合适的内存淘汰算法。
Redis内存淘汰实现
接下来,我们将通过分析 Redis 源码来了解其实现原理。
1. LRU淘汰算法实现
我们先来分析 Redis 的 LRU 淘汰算法的实现。
前面说过,LRU 淘汰算法是使用 Key 的最后访问时间来进行判定的,所以在 Redis 的 Key 对象中有个字段用于保存其最后被访问的时间,如下代码所示:
typedef struct redisObject {
unsigned type:4;
unsigned encoding:4;
unsigned lru:LRU_BITS; // 记录 Key 的最后被访问时间
int refcount;
void *ptr;
} robj;
在 robj
对象中的 lru
字段就是用来记录 Key 的最后被访问时间。当 Key 被访问时,会调用 lookupKey
函数查找 Key 对应的值,我们可以从 lookupKey
函数中找到 lru
字段更新相关的代码:
robj *lookupKey(redisDb *db, robj *key, int flags) {
dictEntry *de = dictFind(db->dict, key->ptr); // 获取 Key 对应的 Value
if (de) {
robj *val = dictGetVal(de);
if (!hasActiveChildProcess() && !(flags & LOOKUP_NOTOUCH)){
if (server.maxmemory_policy & MAXMEMORY_FLAG_LFU) {
updateLFU(val);
} else {
val->lru = LRU_CLOCK(); // 更新 Key 最后被访问时间
}
}
return val;
} else {
return NULL;
}
}
从 lookupKey
函数的实现中可以看到,当 Key 被访问时会更新其 lru
字段的值为当前时间戳。
2. LFU淘汰算法实现
由于 LRU 算法使用 Key 的最后访问时间来判定是否应该淘汰,那么就会导致以下情况出现:
如上图的情况,由于 Key2 的最后访问时间比 Key1 的要新,所以如果使用 LRU 算法进行淘汰的话,那么应该先淘汰 Key1。但通过观察发现,Key1 的访问频率明显比 Key2 高,所以应该淘汰 Key2 更为合理。
由于 LRU 算法有以上的缺点,所以 Redis 4.0 开始支持 LFU 淘汰算法。前面也说过,LFU 算法是通过访问 Key 的频率来进行淘汰的,下面我们介绍以下 Redis 的 LFU 算法是怎么实现的。
Redis 的 LFU 算法也是通过 robj
对象的 lru
字段来保存 Key 的访问频率的,LFU 算法把 lru
字段分为两部分,如下图:
0 ~ 7 位:用于保存 Key 的访问频率计数器。
8 ~ 23 位:用于保存当前时间(以分钟计算)。
由于访问频率计数器只有8个位,所以取值范围为 0 ~ 255,如果每访问 Key 都增加 1,那么很快就用完。所以 Redis 使用了一种比较复杂的算法了计算访问频率,算法如下:
获取一个 0 ~ 1 的浮点数随机数
r
。根据计数器的旧值与影响因子(通过
lfu-log-factor
配置项设置)计算出一个 0 ~ 1 的浮点数p
,计算公式为:1.0 / (计算器旧值 * 影响因子 + 1)
。如果
p
的值大于r
,那么就对访问频率计数器进行加一。
Redis 通过 LFULogIncr
函数来实现这个算法:
uint8_t LFULogIncr(uint8_t counter)
{
if (counter == 255)
return 255;
double r = (double)rand()/RAND_MAX; // 获取随机数r
double baseval = counter - LFU_INIT_VAL; // 计数器旧值
if (baseval < 0) baseval = 0;
// 根据计数器旧值与影响因子来计算出p
double p = 1.0 / (baseval * server.lfu_log_factor + 1);
if (r < p) counter++; // 如果 p 大于 r, 那么对计数器进行加以操作
return counter;
}
所以从上面的算法可以看出,影响访问频率计数器的增加速度有两个因素:1. 计数器的旧值;2. 影响因子。
下表展示了影响因子的取值对访问频率计数器增速的影响(从0增长到255需要访问的次数):
影响因子 | 100 次 | 1000 次 | 100000 次 | 1000000 次 | 10000000 次 |
---|---|---|---|---|---|
1 | 18 | 49 | 255 | 255 | 255 |
10 | 10 | 18 | 142 | 255 | 255 |
100 | 8 | 11 | 49 | 143 | 255 |
从上表中可知,在影响因子为100的条件下,经过1000万次命中才能把访问频率计数器增加到255。
如果访问频率计数器只增不减的话,那么当所有 Key 到增加到 255 后,LFU 算法就不起效果了。所以 Redis 还实现了访问频率计数器的衰减算法,衰减算法的原理就是,Key 越久没被访问,衰减的程度就越大。
Redis 的访问频率计数器衰减算法是通过 LFUDecrAndReturn
函数完成的:
unsigned long LFUDecrAndReturn(robj *o) {
unsigned long ldt = o->lru >> 8; // 获取 Key 最后访问时间(单位为分钟)
unsigned long counter = o->lru & 255; // 获取 Key 访问频率计数器的值
// 下面是计算要衰减的数量
// LFUTimeElapsed 函数用于获取 Key 没被访问的时间(单位为分钟)
// lfu_decay_time 是衰减的力度,通过配置项 lfu-decay-time 设置,值越大,衰减力度约小
unsigned long num_periods = server.lfu_decay_time
? LFUTimeElapsed(ldt) / server.lfu_decay_time
: 0;
// 对访问频率计数器进行衰减操作
if (num_periods)
counter = (num_periods > counter) ? 0 : counter - num_periods;
return counter;
}
从 LFUDecrAndReturn
函数可知,lfu-decay-time
设置越大,衰减的力度就越小。如果 lfu-decay-time
设置为1,并且 Key 在 10 分钟内没被访问的话,按算法可知,访问频率计数器就会被衰减10。
LFU 算法更新 lru
字段也是在 lookupKey
函数中完成的:
robj *lookupKey(redisDb *db, robj *key, int flags) {
dictEntry *de = dictFind(db->dict, key->ptr); // 获取 Key 对应的 Value
if (de) {
robj *val = dictGetVal(de);
if (!hasActiveChildProcess() && !(flags & LOOKUP_NOTOUCH)){
if (server.maxmemory_policy & MAXMEMORY_FLAG_LFU) { // 如果配置的是LFU淘汰算法
updateLFU(val); // 更新LFU算法的统计信息
} else {
val->lru = LRU_CLOCK();
}
}
return val;
} else {
return NULL;
}
}
我们来看看 updateLFU
函数的实现:
void updateLFU(robj *val) {
unsigned long counter = LFUDecrAndReturn(val); // 对访问频率计数器进行衰减操作
counter = LFULogIncr(counter); // 增加访问频率计数器的值
val->lru = (LFUGetTimeInMinutes()<<8) | counter; // 将当前时间与访问频率计数器组合成LFU统计信息
}
updateLFU
函数比较简单,首先对访问频率计数器进行衰减操作,然后增加访问频率计数器的值,最后将当前时间与访问频率计数器组合成起来保存到 robj
对象的 lru
字段中。