【博士论文】集群系统中的网络流调度数据派THU关注共 1308字,需浏览 3分钟 ·2021-12-13 05:09 来源:专知本文为论文,建议阅读5分钟当前,集群系统的部署和使用非常广泛。来自清华大学张彤的博士论文,入选2021年度“CCF优秀博士学位论文奖”初评名单!https://www.ccf.org.cn/Focus/2021-11-22/750448.shtml集群系统中的网络流调度当前,集群系统的部署和使用非常广泛。在集群系统中,一个任务通常分为多 个处理阶段顺序执行,而在各处理阶段之间需要通过内部网络来传输数据和中间 结果。已有测量工作表明,数据传输时间占整个任务运行时间的比重很大,因此 优化集群系统中的数据传输时间对于加速任务、提升应用性能非常重要。网络流 调度是优化数据传输时间的有效方法,主要指为数据流设定传输顺序以及分配带 宽。在小规模集群系统中,网络内部容易做到无阻塞,流调度主要在边缘链路上;而在大规模集群系统中,网络内部也可能成为瓶颈,流调度也应作用于网络内部。由于集群系统应用种类繁多,通信模式各不相同,因此内部网络中既存在独 立的单流也存在并发的流束。相应地,网络流调度既包括单流调度也包括流束调 度。根据以上分类,本文分别在小规模与大规模集群系统中针对单流调度和流束 调度的问题进行了研究:(1) 提出了稳定的单流调度策略。针对小规模与大规模集群系统都存在的调度 策略不稳定问题,本文设计了稳定的单流调度策略 BASRPT,并且针对小规模和 大规模集群系统分别设计了两个版本。BASRPT 同时考虑流的剩余大小和所在队 列的队长,优先传输长队列中的短流,既能够控制队长又能够缩短流完成时间。仿 真结果表明,BASRPT 能够维持队列长度稳定并取得较低的流完成时间。(2) 提出了已知部分信息的流束调度策略。针对小规模集群系统中部分流束信 息可知的场景,本文设计了已知部分信息的流束调度策略 IICS。IICS 借助流束中 已到达子流信息对剩余传输时间进行预测,并基于预测值近似实现最小剩余时间 优先。仿真结果表明,IICS 能够取得与信息完全可知的策略接近的流束完成时间。 (3) 提出了网络内部瓶颈感知的流束调度策略。针对大规模集群系统中的网络 内部瓶颈约束,本文设计了分布式网络内瓶颈感知的流束调度策略 DBA。DBA 在 所有链路的带宽约束下,通过各节点演化的方式近似实现了全网范围的最小剩余 时间优先策略。仿真结果表明,DBA 具有优越的流束完成时间性能和高吞吐量。(4) 提出了光电路交换网络中的流束调度策略。针对大规模集群系统中光电路 交换技术的快速发展,本文设计了光电路交换网络中优化流束完成时间的调度策 略 GMRTF。GMRTF 同时结合了电路调度与流束调度,将同一电路上的子流适当 分组,组内不切换电路,组间采用最小剩余时间优先策略。大量仿真实验验证了 在光电路交换网络中 GMRTF 能够显著降低流束完成时间并提高吞吐量。 浏览 14点赞 评论 收藏 分享 手机扫一扫分享分享 举报 评论图片表情视频评价全部评论推荐 Cuckoo-ScheduleJAVA集群调度系统Cuckoo-Schedule是基于Quartz-Schedule的轻量级任务调度框架,具有易学习、Cuckoo-ScheduleJAVA集群调度系统Cuckoo-Schedule是基于Quartz-Schedule的轻量级任务调度框架,具有易学习、易上手、开发高效稳定的特点。Demo地址:http://cuckoo.hellosr.com。 CronHub集群调度系统项目下载网址:https://github.com/sharpstill/CronHub你是否经常为CronHub集群调度系统项目下载网址:https://github.com/sharpstill/CronHub你是否经常为每日的crontab定时命令/程序不能自动执行而烦恼,你是否经常为集群化的服务器环境下的大量程序的执Gascheduler集群中任务的调度器这个库是GameAnalytics贡献的。该库实现了一个通用的用于处理集群中任务的调度器。任务的生成和处理是专为特定的应用。客户端传递一个需要被执行的回调函数作为入参,调度器会通过消息返回任务的状态。lite-flow分布式任务流调度系统liteflow是一个基于DAG来实现的分布式任务流调度系统,较azkaban等调度系统,liteflow增加了一些自己的特性:1.实现任务在任务流间共享2.任务/任务流的可视化配置3.一键修复任务/【优秀博士论文推荐】基于网络特征学习的个性化推荐系统机器学习算法与Python实战0heartbeatLinux集群系统我们用到的集群系统主要就2种:高可用(High Availability)HA集群, 使用HeartheartbeatLinux集群系统我们用到的集群系统主要就2种:高可用(HighAvailability)HA集群,使用Heartbeat实现;也会称为”双机热备”,“双机互备”,“双机”。负载均衡群集(LoadBalanceClusHelloJob基于 J2EE 的调度系统hellojob是使用j2ee技术开发的调度系统,提供交互简单的中文操作界面,40秒上手。目前业界有不少调度系统,比如oozie(太难用)、xxl-job(太重量)、airflow(python写的,点赞 评论 收藏 分享 手机扫一扫分享分享 举报