目前业界性能最强的 ARM 服务器芯片,性能超过业界标杆 20%,能效比提升 50% 以上。
10 月 18 日是 2021 云栖大会的开放日,在 40000 平米的展区中,有一个展位格外引人注目。这里展示着阿里的「芯片家族」:从平头哥首颗芯片玄铁 910 到首颗自研高性能 AI 芯片含光 800,再到其他专用芯片,阿里这两年的造芯之路「几乎」一览无余,只有红布之下是个例外。「红布之下是什么呢?」「到明天云栖大会开幕就知道了。」现场工作人员卖起了关子。十几个小时后,阿里云智能总裁、达摩院院长张建锋为我们揭开了谜底:原来这是阿里平头哥芯片家族的新成员——倚天 710。它采用了业界最先进的 5nm 工艺,单芯片可容纳高达 600 亿颗晶体管。和专注于 AI 推理的含光 800 不同,倚天 710 是一颗通用服务器芯片(CPU),也是第一颗采用 5nm 工艺的服务器芯片。它基于最新的Armv9 架构,内含 128 核 CPU,主频最高达到 3.2GHz,能同时兼顾性能和功耗。在内存和接口方面,它集成了业界领先的 DDR5、PCIE5.0 等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。在 SPECInt2017 基础测试平台上,倚天 710 的跑分达到 440 分,是当前性能最强的服务器芯片,超出业界标杆 20%,能效比优于业界标杆 50%,能有效帮助数据中心节能减排。阿里表示,倚天 710 是阿里云推进「一云多芯」策略的重要一步,也是阿里第一颗为云而生的 CPU 芯片,即将在阿里云数据中心部署。「基于阿里云『一云多芯』和『做深基础』的商业策略,我们发布倚天 710,希望满足客户多样性的计算需求,这款芯片不出售,主要是阿里云自用。我们将继续与英特尔、英伟达、AMD、ARM 等合作伙伴保持密切合作,为客户提供更多选择。」张建锋介绍说。作为一家电商、物流、云计算、大数据、全球化等场景的公司,阿里拥有世界上最挑战、最丰富的计算场景、网络场景、机器学习场景,需要使用大量芯片,自研芯片能够降低阿里巴巴集团内部整体计算的成本。随着倚天 710 的发布,平头哥已拥有处理器 IP、AI 芯片及通用芯片等产品家族。其中,玄铁系列为 AIoT 终端芯片提供 IP,出货量已达 25 亿颗;含光 800 为人工智能场景提供 AI 算力,服务于搜索推荐、视频直播等行业;倚天 710 则通过阿里云为云上用户提供算力。造芯难,一直是这两三年的热门话题,国内企业也在快马加鞭补齐芯片设计的短板。但在高性能 CPU 市场上,国内还没有太多成功的经验。正如中国科学院微电子研究所所长叶甜春所说,集成电路就是一座喜马拉雅山,而核心芯片就是珠穆朗玛峰,「需要全世界最高端的技术。」2016 年,阿里投资软件定义网络(SDN)芯片公司 Barefoot 以及翱捷科技、寒武纪、深鉴、耐能、中天微、恒玄科技等多家芯片公司;2017 年又成立了达摩院并组建了一支由半导体行业顶级专家组成的技术团队。2018 年,阿里全资收购大陆唯一拥有自主嵌入式 CPU IP core 的中天微。在那年的云栖大会上,达摩院芯片研发团队与中天微团队合并,平头哥半导体公司就此成立。在之后的三年里,平头哥完成了「三级跳」:先是发布了当时业界性能最强的 RISC-V 处理器玄铁 710,让基于 RISC-V 架构的高性能芯片成为可能,也让芯片设计的门槛进一步降低;紧接着,在 2019 年的云栖大会上,平头哥又发布了阿里第一颗芯片含光 800,这是一颗针对场景深度定制的芯片,创造了性能和能效比的两项第一;再接着就是今年云栖大会倚天 710 CPU 的问世。CPU 是半导体行业设计门槛最高的芯片之一。为了达到通用服务器 CPU 的性能、功耗要求,倚天 710 采用了很多领先的技术,包括 Armv9、DDR5、PCIE5.0 等,并对它们做了深度定制。Armv9 是 ARM 公司在今年 3 月份正式推出的新架构。它的前辈——ARM 在 2011 年推出的第一款 64 位架构 Armv8——之前已经在服务器领域取得了一些成功,不少企业基于此架构开发了可用于服务器和超算领域的产品,个别产品也获得了不错的效果,让 Arm 芯片从小型或移动设备,进入了新的领域。Armv9 在此基础上进一步创新。根据 ARM 官方的介绍,新的 Armv9 架构将会至少使用 10 年,未来两代基于 Armv9 架构的处理器在性能上有望提升 30%。而且与 Armv8 架构不同的是,Armv9 架构的适用范围更广阔,其一系列改进不少都是为了 Arm 架构芯片可以实现高性能计算做铺垫。长期以来,X86 服务器一直占据市场主导地位,而且构建起了成熟的商业生态并占据专利和标准制定等战略高地。相比之下,ARM 芯片在服务器领域存在性能劣势以及生态环境的阻力。Armv9 的一系列改进为芯片企业进一步探索基于 Arm 的服务器芯片设计提供了信心。除了这些国际领先技术,倚天 710 还引入了许多自研技术,从前端架构设计到后端物理实现都是自研。在前端设计方面,为解决核数众多条件下的带宽瓶颈,平头哥对于片上互联作出特殊优化,采用新的流控算法,降低系统反压,有效提升了系统效率和扩展性,使单核高性能有效地转化为整个系统的高性能。此外,通过新的系统地址到 DRAM 地址的转换机制,倚天 710 支持安全、非安全隔离、多 NUMA、异常通道隔离多种特性,同时 DRAM 读写效率大幅度提升。在后端物理实现方面,5nm 工艺对能量密度、芯片内部结构的布局提出了极高的要求。为此,平头哥在研发过程中灵活调度了 30 种不同的 EDA 软件、深度定制时钟网络和定制 IP 技术。此外,他们还采用了先进的多芯片堆叠技术,最后成功确保了芯片性能、功耗的优化。倚天芯片的研制成功,标志着平头哥已经具备大型复杂芯片的研发设计能力,并进入与 Intel、AMD、AWS 等少数一流芯片公司竞争的行列。从服务器芯片发布到玄铁处理器开源,阿里端云一体化战略逐渐清晰除了在纵深向不断突破芯片技术外,平头哥也在积极推动芯片生态的发展。在本次云栖大会现场,平头哥宣布四款开源玄铁 RISC-V 系列处理器(玄铁 E902、E906、C906、C910),并开放相关工具及系统软件。开发者可通过平头哥 Github 和芯片开放社区(Open Chip Community)下载玄铁源代码,在此基础上,实现开源 EDA 协同,创新硬件架构,丰富软件应用生态。这是继发布玄铁 710 等处理器后,平头哥在 RISC-V 生态上的重要举措,也是全球首个商业处理器的开源,进一步拉近了 RISC-V 技术与开发者的距离,成为全球硬件开源的新里程碑。AIoT 时代,RISC-V 架构因其开放、灵活的特性,有望成为继 Intel X86、ARM 后的下一代广泛应用的 CPU 架构。但是,当前 RISC-V 架构面临应用碎片化、开发效率低、软硬件适配难等问题,软硬件生态尚未成熟。玄铁 RISC-V 系列处理器采用自研技术,覆盖从低功耗到高性能的各类场景,支持 AliOS、FreeRTOS、RT-Thread、Linux、Android 等操作系统,并已成功应用于微控制器、工业控制、智能家电、智能电网、图像处理、人工智能、多媒体和汽车电子等领域。不久前,玄铁 910 全球首次实现兼容安卓,极大拓展了 RISC-V 架构面向开放生态的想象力。阿里表示,对于正在上升期的 RISC-V 架构技术而言,只有更多的开发者和企业使用,才能共同推进生态进步,真正让这一技术在芯片和操作系统等软硬件层面实现繁荣,平头哥也会从中受益。服务器芯片发布、玄铁系列处理器宣布开源,阿里的端云一体化战略逐渐清晰。作为构筑这一战略的核心,达摩院、平头哥及阿里云,正在成为阿里巴巴三位一体的核心技术栈。平头哥得到了达摩院和阿里云的软实力加持,例如基于达摩院的算法能力,打破了算法和硬件之间的鸿沟;基于阿里云飞天云平台的优势,快速形成了端云一体芯片生态。阿里表示,他们希望通过自研的强大技术平台和生态系统能力,推动国产自主芯片的产业化落地。