面试问题：Redis 分布式锁的细节-技术圈

不点蓝字关注，我们哪来故事？

正文如下

来源：juejin.im/post/5e61a454e51d4526f071e1df

序-碎碎叨叨
正文-开门见山

setnx
redisson
RedLock

总结

序-碎碎叨叨

在家办公的第N周，

也不知道笔者工位上的键盘和显示器有没有想我，

不知道会不会落灰太严重，被保洁阿姨扔掉了。

笔者今天带来一篇关于redis锁的文章

连敲带画 码出此文，有一些细节，对redis锁不清晰的盆友不妨瞧一瞧。

如果是有经验的盆友，挑挑毛病，那笔者是更感谢了～

闲话不多，马上发车。

正文-开门见山

谈起redis锁，下面三个，算是出现最多的高频词汇：

setnx
redLock
redisson

setnx

其实目前通常所说的setnx命令，并非单指redis的setnx key value这条命令。

一般代指redis中对set 命令加上nx 参数进行使用， set 这个命令，目前已经支持这么多参数可选：

SET key value [EX seconds|PX milliseconds] [NX|XX] [KEEPTTL]

当然了，就不在文章中默写Api了，基础参数还有不清晰的，可以蹦到官网。

上图是笔者画的setnx 大致原理，主要依托了它的key不存在才能set成功的特性 ，进程A拿到锁，在没有删除锁的Key时，进程B自然获取锁就失败了。

那么为什么要使用PX 30000去设置一个超时时间？

是怕进程A 不讲道理啊，锁没等释放呢，万一崩了 ，直接原地把锁带走了，导致系统中谁也拿不到锁。

就算这样，还是不能保证万无一失。

如果进程A 又不讲道理，操作锁内资源超过笔者设置的超时时间 ，那么就会导致其他进程拿到锁 ，等进程A 回来了，回手就是把其他进程的锁删了，如图：

还是刚才那张图，将T5 时刻改成了锁超时，被redis释放。

进程B 在T6 开开心心拿到锁不到一会，进程A 操作完成，回手一个del ，就把锁释放了。

当进程B 操作完成，去释放锁的时候（图中T8时刻）：

找不到锁其实还算好的，万一T7 时刻有个进程C 过来加锁成功，那么进程B 就把进程C 的锁释放了。以此类推，进程C 可能释放进程D 的锁，进程D ....(禁止套娃)，具体什么后果就不得而知了。

所以在用setnx 的时候，key虽然是主要作用，但是value 也不能闲着，可以设置一个唯一的客户端ID ，或者用UUID 这种随机数。

当解锁的时候，先获取value判断是否是当前进程加的锁，再去删除。伪代码 ：

String uuid = xxxx;
// 伪代码，具体实现看项目中用的连接工具
// 有的提供的方法名为set 有的叫setIfAbsent
set Test uuid NX PX 3000
try{
// biz handle....
} finally {
    // unlock
    if(uuid.equals(redisTool.get('Test')){
        redisTool.del('Test');
    }
}

这回看起来是不是稳了。

相反，这回的问题更明显了，在finally代码块中，get和del并非原子操作 ，还是有进程安全问题。

为什么有问题还说这么多呢？

第一，搞清劣势所在，才能更好的完善。

第二点，其实上文中最后这段代码，还是有很多公司在用 的。

大小项目悖论：大公司实现规范，但是小司小项目虽然存在不严谨，可并发倒也不高，出问题的概率和大公司一样低。 -- 鲁迅

那么删除锁的正确姿势之一，就是可以使用lua 脚本，通过redis的eval /evalsha 命令来运行：

-- lua删除锁：
-- KEYS和ARGV分别是以集合方式传入的参数，对应上文的Test和uuid。
-- 如果对应的value等于传入的uuid。
if redis.call('get', KEYS[1]) == ARGV[1]
    then
 -- 执行删除操作
        return redis.call('del', KEYS[1])
    else
 -- 不成功，返回0
        return 0
end

通过lua 脚本能保证原子性的原因说的通俗一点：

就算你在lua 里写出花，执行也是一个命令(eval /evalsha )去执行的，一条命令没执行完，其他客户端是看不到的。

那么既然这么麻烦，有没有比较好的工具呢？就要说到redisson 了。

介绍redisson 之前，笔者简单解释一下为什么现在的setnx 默认是指set 命令带上nx 参数，而不是直接说是setnx 这个命令。

因为redis版本在2.6.12 之前，set是不支持nx参数的，如果想要完成一个锁，那么需要两条命令：

1. setnx Test uuid
2. expire Test 30

即放入Key和设置有效期，是分开的两步，理论上会出现1 刚执行完，程序挂掉，无法保证原子性。

但是早在2013年 ，也就是7年前，Redis就发布了2.6.12 版本，并且官网(set命令页)，也早早就说明了“SETNX, SETEX, PSETEX可能在未来的版本中，会弃用并永久删除 ”。

笔者曾阅读过一位大佬的文章，其中就有一句指导入门者的面试小套路，具体文字忘记了，大概意思如下：

说到redis锁的时候，可以先从setnx讲起，最后慢慢引出set命令的可以加参数，可以体现出自己的知识面。

如果有缘你也阅读过这篇文章，并且学到了这个套路，作为本文的笔者我要加一句提醒：

请注意你的工作年限！首先回答官网表明即将废弃的命令，再引出set命令 七年前的“新特性”，如果是刚毕业不久的人这么说，面试官会以为自己穿越了。

你套路面试官，面试官也会套路你。 -- vt・沃兹基硕德

redisson

Redisson是java的redis客户端之一 ，提供了一些api方便操作redis。

但是redisson这个客户端可有点厉害，笔者在官网截了仅仅是一部分的图：

这个特性列表可以说是太多了，是不是还看到了一些JUC 包下面的类名，redisson帮我们搞了分布式的版本，比如AtomicLong ，直接用RedissonAtomicLong 就行了，连类名都不用去新记，很人性化了。

锁只是它的冰山一角，并且从它的wiki页面看到，对主从，哨兵，集群等模式都支持，当然了，单节点模式肯定是支持的。

本文还是以锁为主，其他的不过多介绍。

Redisson普通的锁实现源码主要是RedissonLock 这个类，还没有看过它源码的盆友，不妨去瞧一瞧。

源码中加锁/释放锁 操作都是用lua 脚本完成的，封装的非常完善，开箱即用。

这里有个小细节，加锁使用setnx 就能实现，也采用lua 脚本是不是多此一举？笔者也非常严谨 的思考了一下：这么厉害的东西哪能写废代码？

其实笔者仔细看了一下，加锁解锁的lua脚本考虑的非常全面，其中就包括锁的重入性 ，这点可以说是考虑非常周全，我也随手写了代码测试一下：

的确用起来像jdk的ReentrantLock 一样丝滑，那么redisson实现的已经这么完善，redLock又是什么？

RedLock

redLock 的中文是直译过来的，就叫红锁。

红锁并非是一个工具，而是redis官方提出的一种分布式锁的算法。

就在刚刚介绍完的redisson中，就实现了redLock版本的锁。也就是说除了getLock 方法，还有getRedLock 方法。

笔者大概画了一下对红锁的理解：

如果你不熟悉redis高可用部署，那么没关系。redLock算法虽然是需要多个实例，但是这些实例都是独自部署的，没有主从关系。

RedLock作者指出，之所以要用独立的，是避免了redis异步复制造成的锁丢失，比如：主节点没来的及把刚刚set进来这条数据 给从节点，就挂了。

有些人是不是觉得大佬们都是杠精啊，天天就想着极端情况。其实高可用 嘛，拼的就是99.999...% 中小数点后面的位数。

回到上面那张简陋的图片，红锁算法认为，只要(N/2) + 1个节点加锁成功，那么就认为获取了锁，解锁时将所有实例解锁。流程为：

顺序向五个节点请求加锁
根据一定的超时时间 来推断是不是跳过该节点
三个节点加锁成功并且花费时间小于锁的有效期
认定加锁成功

也就是说，假设锁30秒 过期，三个节点加锁花了31秒，自然是加锁失败了。

这只是举个例子，实际上并不应该等每个节点那么长时间，就像官网所说的那样，假设有效期是10秒，那么单个redis实例操作超时时间，应该在5到50毫秒 (注意时间单位)

还是假设我们设置有效期是30秒，图中超时了两个redis节点。那么加锁成功的节点总共花费 了3秒，所以锁的实际有效期 是小于27秒的。

即扣除加锁成功三个实例的3秒，还要扣除等待超时redis实例的总共时间。

看到这，你有可能对这个算法有一些疑问，那么你不是一个人。

回头看看Redis官网关于红锁的描述

就在这篇描述页面的最下面，你能看到著名的关于红锁的神仙打架 事件。

即Martin Kleppmann和antirez的redLock辩论. 一个是很有资历的分布式架构师，一个是redis之父。

官方挂人，最为致命。

开个玩笑，要是质疑能被官方挂到官网，说明肯定是有价值的。

所以说如果项目里要使用红锁，除了红锁的介绍，不妨要多看两篇文章，即：

Martin Kleppmann的质疑贴
antirez的反击贴

总结

看了这么多，是不是发现如何实现，都不能保证100 %的稳定。

程序就是这样，没有绝对的稳定，所以做好人工补偿 环节也是重要的一环，毕竟：

技术不够，人工来凑～

往期推荐

国庆，我 “失业” 了！

如果避免反射导致的性能问题？

MySQL从原理到调优，一篇讲清楚了

程序员排位赛中的 14 个等级

程序员被公司辞退都12天了，前领导要求回公司讲清楚代码

-END-

↑ 点击上方关注我公号 ↑

我是泥瓦匠，坚持分享编程，算法，Java 等干货教程

一枚医科大本科生，开源小作者，半吊子创业爱好者...

半吊子的自己在试错，不知道以后会干什么，但享受现在的试错，试错给我惊讶的生活

喜欢公号的互动分享，感谢关注，路上遇见了你，同一小段时间之路，相伴 ~

长按识别，加我微信

点个在看结对编程一把