NASA「史上最强超算」投入使用,碾压老超算霸主Pleiades

新智元

共 1934字,需浏览 4分钟

 ·

2022-07-25 21:33



  新智元报道  

编辑:David 如願
【新智元导读】NASA不求E级超算,老机「模块化」升级,皮实又耐用!|还在纠结会不会错过元宇宙和web3浪潮?清华大学科学史系副教授胡翌霖,这次给你讲个透!

NASA宣布,有史以来最强大的超级计算机Aitken已经正式投入使用!
 
不过,这次这个超算Aitken,其实不是新造的,而是对老系统的一次升级。
 
此次NASA对Aitken进行了性能升级,新增了四个包含 512 个 Rome 节点的新 HPE Apollo 系统机架,使 Aitken 的节点总数达到 3200 个,核心数量达到308224 个。
 
这一相当大的改进,让扩展后的Aitken性能提高了16%,自去年以来一共提升了 49%。
 
 

「实力派」Aitken


Aitken始建于2019年,由HPE负责建造,NASA的科学家们使用Aitken来模拟宇宙飞船的进入、下降和着陆过程。
 
这台超算是NASA的Artemis计划的一部分,该计划的目标是,2024年将宇航员送入月球的南极地区。
 
 
说到命名这件事,Aitken是以美国天文学家Robert Grant Aitken的名字命名的,最初设置1150个节点,46080个核心,221 TB的内存,PUE为1.03,以理论性能为3.69千万亿次浮点运算,通过大量模拟,实现准确而安全的登月计划。
 
 
Aitken基于HPE SGI 8600系统,这是一个端到端的、专门建造的HPC平台,包括最佳能源效率的特殊液冷能力。
 
Aitken位于NASA Ames的新模块化超级计算设施中,这个设施基于与HPE联合开发的MDC(Modular Data Center)方法,显著减少了电力和水资源的使用。
 
此前,这台超算一直是数百名与NASA有关的科学家和工程师的关键资源,为该机构的太空探索、地球科学和天体物理学方面的研究项目提供重要的算力支持。
 
 
此前,Aitken在去年6月的超算Top500榜单中排名第 72 位,今年上升至第 58 
 

「模块化」升级,经济又实用


由于任务需要,NASA要的不是单体的、独立的大型超算系统,比如最近刚刚登顶Top500榜单的「E级」超算Frontier,而是采取了类似于最近欧洲超算设计(如LUMI)的「模块化」方式。
 
 
此外,这种额外增加计算节点、增设新机架的升级方式,可以确保在预算中有效控制成本,延长系统的运行寿命。
 
实际上,NASA这种升级方式早就不是首次使用了,在Aitken之前,NASA的头牌超算是Pleiades。自2008年首次运行以来,一直在使用这种「模块化」升级。
 
 
2008年,当「Pleiades」首次投入使用时,它是世界第三强大的超级计算机,今年6月的Top 500排名仍然位居前100。
 
 
目前,「Pleiades」仍在运行,并将在NASA Ames与更年轻,更快的「搭档」并肩前行!
 
 
这次升级可以更好地发挥30.8万个 AMD Zen 2「Rome」核心的威力,这些核心分布在512个计算节点上。据悉,该超算系统的最初设计 「仅有」46080个英特尔Cascade Lake核心,也是由HPE提供的。
 
此次升级后,Aitken共包含12个HPE Apollo 9000机架,提供2048个AMD EPYC 7742 Rome节点,每个节点有128个内核,以及4个HPE E-Cell,提供1152个英特尔 Cascade Lake 节点,每个节点有40个内核。
 
新增加的设备将系统的理论峰值性能推高到每秒13.12PetaFlops,总内存达到1.27PB。
 
此次Aitken的系统升级,保留了未来的可扩展性,这也是模块化升级的另一个优势:可以灵活地建造新的模块,快速增加算力,满足不断变化的优先事项,应对新任务带来的新挑战。

参考资料:

https://www.hpcwire.com/off-the-wire/aitken-becomes-nasas-most-powerful-supercomputer/

https://www.tomshardware.com/news/nasa-hacks-its-supercomputing-way-through-intel-amd-parts


浏览 40
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报