分布式一致性算法:解决分布式系统 80%核心问题
身为后端工程师,你对这类招聘要求肯定不陌生:熟悉分布式系统的设计和应用;熟悉分布式、缓存、消息、搜索等机制;能对分布式常用技术进行合理应用、解决问题等等。
其中又以分布式协议与算法尤甚。现在很多大厂在招聘架构师或高级工程师时,都会要求候选人熟悉分布式协议与算法。面试官不仅会考察其原理和运行机制,还有面试者对这类问题在架构设计层面的理解,以及具体场景下的应用。
但以我作为面试官的多年经验来看,真正搞懂这部分的候选人少得可怜。
其实,分布式协议与算法(下面简称分布式算法)是分布式系统运行的核心规则和关键步骤,想参透分布式技术、开发一个分布式系统,最先要掌握的就是这部分知识。
以时序数据库 InfluxDB 为例,很多技术团队试图自己实现 InfluxDB 的集群功能,但最终都放弃了。因为这里面的坑实在太多,甚至有些人错误地将一致性等同于完整性,该使用反熵(Anti-Entropy)算法时,却用了 Raft 算法,让人哭笑不得。
如果你想使用集群功能,又无法基于开源版本自研,就只能购买人家的企业版。要知道,企业版每个节点的 License 授权费就要 1.5 万美刀/年,具体贵在哪呢?相比于已经开源的单机版本,其技术壁垒又是什么?
其实,它的护城河就是以分布式算法为核心的分布式集群能力。由此可见,真正掌握分布式算法的人并不多。大多数人只是会用分布式系统,却并不具备分布式系统的独立开发能力。
所以,不论是基于工作需要,还是想寻求长期职业发展、提升职场竞争力,分布式算法作为分布式系统的核心,都是你在这个时代应该掌握的基本功。
如何高效学习分布式算法?
很多同学会发现,尽管看了很多资料和书籍,一旦涉及到具体问题,仍旧一头雾水:
众多开源软件看着都很厉害,事务型、一致性、最终一致性,哪个最适合自己的业务,又该如何选型呢?
想要实现数据副本的一致性,到底该选 Paxos 算法,还是 Raft 算法?
为什么我的集群接入性能低?为什么稍微出现峰值流量,业务就基本不可用了?
如何设计分布式系统架构呢?那么多算法,Paxos、Raft、Gossip、Nuorum NWR、PBFT 等等,究竟该选择哪个?
其实,算法本身相对抽象,即使是非常经典的论文,也有一些关键细节没有交代清楚。网上的信息大多是“复制粘贴”的结果,甚至有不少错误,给自主学习带来了很多障碍和误导。
在我看来,要掌握这部分内容,不仅要理解常用算法的原理、特点和局限性,还要根据场景特点选择适合的分布式算法。
为了帮你彻底拿下分布式技术,理解其中最核心和最为精妙的内容,我跟极客时间合作了专栏《分布式协议与算法实战》,力求将自己支撑海量互联网服务中的分布式算法实战心得全部分享给你,让你真正拿下这场攻坚战。
再具体一点说,就是能在工作中根据场景特点,灵活地设计架构和运用分布式算法,开发出适合该场景的分布式系统,对架构设计的理解更上一层楼。
我是谁?
我是如何讲解分布式算法的?
可落地的 4 大分布式基础理论;
8 个最常用的分布式协议和算法;
3 大实战案例手把手教学;
以实战为中心的分布式内容体系。