高性能负载均衡-分类和算法

开源Linux

共 1650字,需浏览 4分钟

 ·

2023-06-20 11:56

高性能集群之所以复杂,主要原因是增加了任务分配器,以及为任务选择合适的分配算法。负载均衡器就是任务分配器,负载均衡这个名称已经成为事实标准,但负载均衡不只是为了计算单元的负载达到均衡状态。

分类及架构

常见的负载均衡分三种:DNS负载硬件负载软件负载

1、DNS负载均衡

定义:解析同一个域名返回不同的IP地址,一般用来实现地理级别的均衡。例如同样的域名,北方用户和南方用户获取的地址是不一样的。

优点:
简单、成本低
实现就近访问,提升访问速度

缺点:
更新不及时(DNS缓存时间长)
扩展性差(无法根据业务定制和扩展)
分配策略简单(算法少、无法感知后端服务器状态)

2、硬件负载均衡

定义:通过单独的硬件设备实现负载均衡功能,可以理解为一个用于负载均衡的基础网络设备。目前业界典型的硬件负载均衡设备有两款:F5 和 A10。

优点:
功能强大(支持各层级负载、支持全面的负载算法、支持全局负载)
性能强大(支持100万以上并发)
稳定性高(商用硬件负载)
支持安全防护(具备防火墙、防DDoS攻击等功能)

缺点:
价格昂贵(起步15万,最高上百万)
扩展能力差(硬件设备无法进行扩展和定制)

3、软件负载均衡

定义:通过负载均衡软件来实现负载均衡功能,常见的有 Nginx 和 LVS两种。

优点:
简单(部署维护都比较简单)
便宜(只需Linux服务器装上软件)
灵活(可根据业务方便扩展和定制)

缺点(与硬件负载相比):
性能一般(一个Nginx大约支撑5万并发)
功能没有硬件负载强大
一般不具备防火墙和防DDoS等安全功能

4、典型架构

3种负载机制在实际应用中不是非此即彼,可以组合使用。
组合的基本原则为:DNS 负载均衡用于实现地理级别的负载均衡;硬件负载均衡用于实现集群级别的负载均衡;软件负载均衡用于实现机器级别的负载均衡。

算法

根据算法期望达到的目的,可以分为4类:
任务平分类:平均分配,平均可以是数量平均、也可以是比例平均、权重平均
负载均衡类:根据服务器负载进行分配,这里的负载指系统当前压力,如CPU负载、连接数、I/O使用率等
性能最优类:根据服务器响应时间进行分配,响应最快的分配更多新任务
Hash类:根据任务某些关键信息进行Hash运算,结果值相同的分配同一台服务器

1、轮询

定义:按照顺序轮流分配到服务器,不关注服务器本身运行状态如何。
特点:只关注服务器是否在运行,只要运行就分配任务,不管运行是否良好。『简单』是优点,也是缺点。

2、加权轮询

定义:轮询的特殊形式,根据服务器权重进行任务分配,权重指根据硬件配置进行静态配置的,主要目的是为了解决不同服务器处理能力有差异的问题。
特点:解决了轮询算法中无法根据服务器的配置差异进行任务分配的问题,但依然无法根据服务器的状态差异进行任务分配。

3、负载最低优先

定义:将任务分配给当前负载最低的服务器,这里的当前负载根据不同任务类型和业务,可以用不同指标衡量。如连接数、HTTP请求数、CPU负载、I/O负载等。
特点:解决了轮询算法中无法感知服务器状态的问题,代价是增加很多复杂度,因为需要感知服务器当前的运行状态。效果美好但实际应用场景没有轮询多。

4、性能最优类

定义:站在客户端的角度进行分配,优先将任务分配给处理速度最快的服务器。
特点:与负载最低优先类的算法类似,需要感知服务器状态并且在合适周期内进行统计分析,复杂度很高。

5、Hash类

定义:根据任务中的某些关键信息进行 Hash 运算,将值相同的请求分配到同一台服务器,目的主要是为了满足特定业务需求。常见的有源地址Hash和ID Hash。
特点:将同一个源地址或带有某个ID标识的任务分配给同一个服务器,适合于存在事务、会话的业务

链接:https://www.jianshu.com/p/dbba5763b30f

(版权归原作者所有,侵删)



10T 技术资源大放送!包括但不限于:Linux、虚拟化、容器、云计算、网络、Python、Go 等。在 开源Linux 公众号内回复 10T,即可免费获取!

Linux学习指南

有收获,点个在看 

浏览 10
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报