分布式存储技术:三副本 vs 双重RAID
共 1809字,需浏览 4分钟
·
2023-06-20 11:56
1
消耗网络带宽,可能会影响到业务数据的正常工作;
2
TCP/IP网络具有数据包丢失与重发的特性,可能导致网络故障或网络抖动,影响OSD的状态,引起OSD重建的连锁反应;
3
严重时可导致业务中断、甚至丢失数据的风险。
三副本分布式存储的另一个弊端就是“慢盘”效应,以及相关的性能及稳定性问题。在三副本系统中,每个机械磁盘(HDD)单独作为一个OSD存储单元承接用户工作负载,而单个HDD随机IO读写非常低,仅为120 次读写/秒,极容易成为瓶颈。
由于分布式存储采用随机数据分布,而随机性必然导致个别磁盘上的负载远超平均值(著名的正太分布效应);此外,磁盘本身的制造缺陷或故障还会加剧 “慢盘”现象发生的频率。当系统出现一个或多个慢盘时,不仅会拖累总体性能与用户体验,甚至可能导致业务卡顿、中断、甚至系统崩溃的严重事故。
与网络数据修复相比,本地RAID数据修复具有以下特征:
1
硬件故障隔离,避免了网络修复可能导致的稳定性问题;
2
可自动避让业务,保证业务无感知;
3
本地修复时数据延迟小,不消耗网络带宽;
4
抵御故障能力强,每个节点都能抵御一个或多个硬盘故障;而三副本最多抵御两个连续的硬盘故障。
双重RAID的另一个技术优势在于,支持在线增加NVMe固态硬盘个数,或在线替换更大容量的NVMe固态硬盘,从而使得用户活动工作负载数据集 (Working Data Set),俗称热数据,可几乎全部落在两级缓存加速层中,从而使得系统总体性能可逼近全闪存存储系统。
10T 技术资源大放送!包括但不限于:Linux、虚拟化、容器、云计算、网络、Python、Go 等。在 开源Linux 公众号内回复 10T,即可免费获取!
有收获,点个在看