Arm芯片押注HPC市场
基于 Arm 的服务器的历史有些曲折,他们曾多次尝试挑战 X86 处理器霸权,但该公司现在似乎看好其在高性能计算 (HPC) 领域的机会,它相信其许可模式、功耗及其架构的效率使其具有优势。
报告下载:
Arm 的 HPC 业务高级主管 Brent Gorda 在戴尔主办的 HPC 社区活动上发表演讲说,该公司“在 HPC 社区中确实在努力推动”,并强调了其与 Nvidia、Silicon Pearl 和 Fujitsu 等公司的合作伙伴关系开发基于 Arm 的芯片来驱动 HPC 和 AI 应用程序。
事实上,Gorda 指出,Arm 已经在 HPC 行业占据了一席之地,在日本 RIKEN 实验室的“Fugaku”超级计算机 以 152,064 个 48 核排名世界第一的富士通A64FX 处理器就是基于Arm架构打造的。
然而,富士通走的是从 Arm 获得架构许可的道路,这意味着它能够设计和制造自己的定制 Arm 兼容处理器,几乎可以满足自己的要求。这意味着增加了 512 位可扩展矢量引擎单元来支持富士通所考虑的那种计算,以及它自己的 Tofu D 高速互连。
但是很少有 HPC 站点可以从头开始设计自己的芯片。幸运的是,Arm 的商业模式还允许合作伙伴采用现成的核心设计并为其添加自定义模块,Gorda 解释说。
“有一种叫做核心许可的东西,你可以通过它许可 Arm Neoverse,这是我们的 IP。这为您提供了核心构建块,即逻辑本身,您可以围绕它定制和构建您想要构建的芯片,”他说。
围绕这一切的是 Arm ServerReady 合规计划,该计划证明特定芯片符合 Arm 服务器生态系统的兼容性要求。
“一旦你通过了这个认证,你就可以使用软件世界了。它保证了软件的功能,然后您可以为受支持的操作系统版本(如红帽)付费。”
Gorda 声称,这种为特定应用程序或一组应用程序定制芯片的能力是 Arm 的优势所在,尤其是在 HPC 和 AI 似乎正在发展的领域。客户可以使用 Arm 核心引擎和片上网络,并为其目标工作负载添加自定义加速器。
“来自 Nvidia 的 Bill Dally 会说,通过在硅芯片上放置自定义门,您可以获得三个数量级的性能提升。这正是 Arm 的发展方向,”他说。“每个人都有关于加速器的想法。如果你足够了解你的工作量,你可以优化它并获得疯狂的良好性能。事实上,这就是 A64FX 如此出色的原因。他们花了十年时间,研究了他们拥有的十到十二个应用程序,并且成功了。处理器问世了,它完全将日本人想要的应用程序安装在他们的系统上。”
Arm 早在 2018 年就推出了 Neoverse,目标是数据中心基础设施,而不是移动设备市场。Neoverse设计于去年进行了扩展,现在包括三个处理器设计系列:强调性能的 V 系列;专注于云基础设施等横向扩展应用N系列;还有针对边缘应用的E系列。
Gorda 透露,参与欧洲处理器倡议 (EPI) 项目的公司Silicon Pearl正在使用 Neoverse V1 设计。同时,N1 设计已用于英特尔前高管 Renée James 创立的初创公司 Ampere Computing的“Quicksilver”和“Mystique”Altra 服务器芯片。为某些 AWS EC2 实例提供支持的 Amazon Graviton2 芯片使用 N1 核心,而Graviton3 使用 V1 核心。Neoverse V 系列内核显然还包含在 Nvidia 计划中的旨在超级计算的“Grace”芯片 中,以及正在由韩国电子和电信研究所 (ETRI) 开发的服务器芯片中。
阻碍 Arm 在服务器市场的问题之一是软件支持,许多关键软件包都是为 X86 处理器平台开发的。当被问及是否所有部件现在都可以在 Arm 上部署 HPC 时,Gorda 说,总的来说,答案是肯定的。
“你会发现一些地方还是有弱点,虽然我相信说所有 ISV 都在开发 Arm 端口是准确的,但并非所有 ISV 都公开支持 Arm in Silicon。因此,如果您依赖 ISV 许可证和软件,您将不得不轮询您的 ISV 以了解事物的状态,”他解释道。
然而,Gorda 引用了 Lustre 并行文件系统的示例,该系统广泛用于 HPC 环境。多年来,Arm 一直为 Lustre 客户端提供支持,但“基于 Arm 的存储服务器非常少,”Gorda 说,因此用于 Arm 的 Lustre 服务器组件目前不受 Whamcloud 的支持,Whamcloud 是 DDN 内监督 Lustre 的部门发展。他补充说,这是 Arm 试图解决的问题。
Gorda 还指出,大约五年前,Arm 收购了 HPC 软件工具的领先供应商 Allinea Software,以加强 Arm 的 HPC 软件生态系统支持。
Gorda 表示,另一个对 Arm 有利的因素是更高的能效。随着超级计算机扩展到 Exascale 领域并且持续的能源成本成为 HPC 运营商更加关注的问题,这可能变得更加重要。Gorda 表示,尽管 Arm 的 Neoverse V 架构强调性能而不是功率效率,但基于它的芯片仍然比竞争对手的 X86 处理器消耗更少的能量。
“X86 的保证是您可以在其上运行 286 二进制文件,而作为具有 RISC 底层的 CISC 架构的所有历史遗产都需要在解码重新排序、修复指令等方面预先进行大量逻辑这是进入芯片并消耗能量的开销,”他说。相比之下,在某种程度上,您可以将 Arm 视为一张白纸。
Gorda 还声称,最终用户不再关心他们的软件运行在什么芯片上,理由是 AWS 等公司采用了 Arm 驱动的云服务器。
“市场有新的大玩家来控制架构。他们关心的事情与历史上一直关心的事情不同。他们关心成本,他们关心能源消耗,他们关心周转时间,以及在事物之上运行的软件堆栈,”他说。
“如果你看看亚马逊在 Graviton2 上做了什么,他们说它便宜了 40%。从最终用户的角度来看,他们并不关心芯片是什么,他们关心的是它便宜 40%,而且周转时间与他们习惯的时间相当。”
HPC 分析公司 Hyperion Research的首席执行官 Earl Joseph表示,他预计未来几年基于 Arm 处理器的 HPC 服务器将出现高速增长。
“我们预计五年增长率将超过 31%,而基础市场的增长率约为 7% 至 8%,”Joseph说。他补充说,这相当于到 2025 年基于 Arm 的系统将占 HPC 市场的 10% 左右。
然而,Joseph也警告说,收入数字可能会产生误导,因为大型超级计算机项目可能会扭曲数字,就像 2020 年接近 10 亿美元的富岳系统所做的那样。
因此,由于如此庞大的个人安装,市场可能会发生巨大变化,Hyperion Research 表示,预计 2025 年将有两台基于 Arm 处理器的欧洲百亿亿级机器。
他补充说,许多即将推出的 HPC 系统预计将混合使用 Arm 和 X86 以及其他处理器类型的处理器。
转自:半导体行业观察
来源:nextplatform
本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
电子书<服务器基础知识全解(终极版)>更新完毕,知识点深度讲解,提供182页完整版下载。
获取方式:点击“阅读原文”即可查看PPT可编辑版本和PDF阅读版本详情。
温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。