改变AI服务器：互连芯片技术创新和突破-技术圈

根据TrendForce的数据，AI服务器的出货量约为130,000台，占全球服务器总出货量的约1%。随着微软、Meta、百度和字节跳动等主要制造商相继推出基于生成式AI的产品和服务，订单量显著增加。预测显示，在ChatGPT等应用的持续需求推动下，从2023年到2027年，AI服务器市场预计将保持每年12.2%的复合年增长率。在这种背景下，AI服务器的发展尤为引人注目。

相关链接：

GPU深度报告：英伟达GB200 NVL72全互联技术，铜缆方案或将成为未来趋势？

国产AI算力行业报告：浪潮汹涌，势不可挡（2024）

高性能GPU服务器AI网络架构（上篇）

高性能GPU服务器AI网络架构（下篇）

英伟达AI服务器NVLink版与PCIe版的差异与选择

Nvidia AI芯片路线图分析与解读、Nvidia芯片工艺洞察和推演、Nvidia AI芯片架构分析

DGX H100：开拓AI领域的先驱性进展

DGX H100是英伟达（NVIDIA） DGX系统于2022年发布的最新版本，也是英伟达（NVIDIA） DGX SuperPOD的核心。该系统采用8个H100 GPU和6400亿个晶体管，其AI性能是上一代的6倍，尤其是在新的FP8精度方面表现出色。此外，DGX服务器还可提供900GB/s带宽，彰显了AI能力的显著提升。

DGX H100服务器采用IP网卡，既可作为网卡，又可作为PCIe扩展交换机，符合PCIe 5.0标准。此外服务器还包括CX7，以2张卡的形式提供，每张卡含有4个CX7芯片，并提供2个800G OSFP光模块端口。对于GPU互连（H100），NVSwitch芯片起到关键作用。每个GPU向外扩展18个NVLink，实现每个链路双向带宽达到50GB/s，总共达到900GB/s的双向带宽。这些带宽分布在4个内置的NVSwitch芯片上，每个NVSwitch对应4-5个OSFP光模块。每个OSFP光模块使用8个光通道，传输速率为100Gbps/通道，因此总速率达到800Gbps，实现高速数据传输。

CPU、GPU等组件互连：采用PCIe交换机和重定时芯片进行连接

PCIe交换机技术的演进：克服通道限制

PCIe交换机（也称为PCIe集线器）是一个关键组件，用于通过PCIe通信协议连接PCIe设备。它通过扩展和聚合功能，使多个设备能够连接到1个PCIe端口，可在很大程度上克服PCIe通道数量局限的问题。目前，PCIe交换机广泛应用于传统存储系统，并在各种服务器平台上越来越受欢迎，为系统内的数据传输速率提供显著改善。

随着时间的推移，PCIe总线技术的进展意味着PCIe交换机速率的逐渐增加。最初由英特尔于2001年作为第三代I/O技术以"3GIO"的名义推出，经过PCI-SIG的评估后在2002年更名为"PCI Express"。2003年正式发布的PCIe 1.0成为一个重要的里程碑，支持每通道传输速率为250MB/s，总传输速率为2.5 GT/s。在2022年，PCI-SIG正式发布了PCIe 6.0规范，将总带宽提升至64 GT/s。

PCIe重定时行业的主导趋势

在AI服务器中，为了确保GPU和CPU连接时的信号质量，至少需要使用一个重定时芯片。一些AI服务器选择使用多个重定时芯片，比如Astera Labs就在其AI加速器配置中集成了4个重定时芯片。

目前，PCIe重定时市场具有巨大的潜力，有三家领先品牌和许多潜在竞争对手。目前，Parade Technologies、Astera Labs和澜起科技是这个蓬勃发展市场的主要参与者，占据重要的地位。值得注意的是，作为PCIe部署的早期使用者，澜起科技是中国内地唯一能够大规模生产PCIe 4.0重定时的供应商。此外，澜起科技在PCIe 5.0重定时的开发方面也取得了稳步进展。

此外，Renesas、TI和微芯科技等芯片制造商也积极参与PCIe重定时产品的开发。根据官网站信息，Renesas提供2款PCIe 3.0重定时产品，分别是89HT0816AP和89HT0832P。TI提供了一款16Gbps 8通道PCIe 4.0重定时产品- DS160PT801。此外，微芯科技在2020年11月推出了XpressConnect系列的重定时芯片，旨在实现PCIe 5.0的32GT/s速率。

GPU之间的互连：NVLink和NVSwitch

全球主要芯片制造商非常重视推广高速接口技术。其中，英伟达（NVIDIA）的NVLink、AMD的Infinity Fabric和英特尔的CXL都做出了重要贡献。

NVLink是由英伟达（NVIDIA）开发的高速互连技术。它旨在加速CPU与GPU、GPU与GPU之间的数据传输速率，提升系统性能。从2016年到2022年，NVLink经历多次升级，已经发展到第四代。2016年，英伟达（NVIDIA）配合Pascal GP100 GPU的发布推出第一代NVLink。NVLink采用了高速信号互连（NVHS）技术，主要用于GPU之间和GPU与CPU之间的信号传输。GPU之间通过差分阻抗电信号以NRZ（不归零）形式进行编码传输。第一代NVLink单链路实现了40GB/s的双向带宽，单个芯片可以支持4个链路，总双向带宽达到160GB/s。

NVLink不同阶段的发展

NVLink技术经历多次迭代，推动了高速互连的创新。2017年，基于Volta架构推出第二代NVLink。它实现每个链路50GB/s的双向带宽，每个芯片支持6个链路，总双向带宽达到300GB/s。2020年，基于Ampere架构的第三代发布，总双向带宽达到600GB/s。在2022年，基于Hopper架构的第四代推出。这一迭代转向使用PAM4调制的电信号，每个链路保持50GB/s的双向带宽，每个芯片支持18个链路，总双向带宽达到900GB/s。

NVSwitch的发展推动实现高性能GPU互连

在2018年，英伟达（NVIDIA）推出NVSwitch的最初版本，为增强带宽、减少延迟和促进服务器内多个GPU之间的通信提供解决方案。第一代NVSwitch采用TSMC的12nm FinFET工艺制造，拥有18个NVLink 2.0接口。通过部署12个NVSwitch，1个服务器可以容纳和优化16个V100 GPU之间的互连速率。