AMD公布AI路线图：MI325X将比H200快1.3倍！还有全新AI PC芯片！-技术圈

6月3日，AMD董事长兼CEO苏姿丰在Computex 2024展会的开幕主题演讲中，公布了全新云端AI加速芯片路线图，今年将会推出全新Instinct MI325X。同时，AMD还发布了代号为“Strix Point”的第三代AI PC芯片“锐龙AI 300系列”，以及AMD Ryzen 9000系列桌面处理器（Granite Ridge）。

今年将推出MI325X，性能相比英伟达H200提升1.3倍

根据AMD公布的全新云端AI加速芯片路线图显示，AMD今年将会推出全新的AI加速芯片Instinct MI325X，2025年推出MI350，2026年推出MI400。

据介绍，MI325X将延续CDNA3构架，采用第四代高带宽内存(HBM) HBM3E，容量大幅提升至288GB，内存带宽也将提升至6TB/s，整体的性能将进一步提升，其他方面的规格则基本保持与MI300X一致，便于客户的产品升级过渡。

苏姿丰指出，MI325X的AI性能提升幅度为AMD史上最大，相较竞品英伟达H200将有1.3倍以上的提升，同时更有性价比优势，MI325X将于今年第四季度开始供货。

另外，AMD还将在2025年推出新一代的MI350系列，该系列芯片将采用3nm制程，基于全新的构架，集成288GB HBM3E内存，并支持FP4/FP6数据格式，推理运算速度较现有MI300系列芯片快35倍。

据供应链信息透露，MI350将进入液冷世代，为AI服务器运算提供更强的算力、更佳的能源效率。

2026年，AMD还将会推出新一代的MI400系列，保持一年一更新的节奏。

AMD锐龙AI 300系列发布：AI算力高达50TOPS！

早在2023年初，AMD就发布了锐龙7040系列(代号Pheonix)的全球首款集成独立NPU AI引擎的x86处理器，基于全新设计的XDNA架构，算力约10TOPS(每秒10万亿次浮点运算)，加上CPU、GPU整体算力约33TOPS，开创了AI PC的新时代。

2023年底，AMD又推出了锐龙8040系列(代号Hawk Point)，NPU AI算力一举提升了60％，达到约16TOPS，整体算力也提升至39TOPS。

而最新的代号为Strix Point的“锐龙AI 300系列”，则采用了全新的Zen5 PU架构，GPU内核也升级为了RDNA3.5架构，NPU也是全新的XDNA2架构，号称是“面向下代AI PC/Copilot+ PC的世界一流处理器”。

锐龙AI 300系列首发只有两款型号，“锐龙AI 9 HX 370”和“锐龙AI 9 HX 365”都定位高端市场。

其中，“锐龙AI 9 HX 370”是顶级旗舰，CPU部分拥有12核心24线程，多年来首次在这一定位上提供更多核心，相比锐龙8040系列增加了多达1/3。二级缓存还是每核心1MB，总容量自然增加到12MB。三级缓存终于打破了16MB的“禁锢”，增加了足足一半来到24MB。最高主频5.1GHz。GPU部分不但升级架构，CU单元数量也从12个增至16个，命名为“Radeon 890M”。NPU算力则提升到了50TOPS，增加了2倍有余。

“锐龙AI 9 365”也是高端型号，10核心20线程，二级缓存10MB，三级缓存仍为24MB，最高频率达5.0GHz，NPU算力也是50TOPS，GPU部分也是Radeon 890M。

从AMD第一和第二代XDNA NPU架构的对比图中，可以看到整体布局基本一致，但规模大大扩充。

AI Tile(初代叫AIE Tile)也就是核心的AI计算引擎模块，从之前的20个增加到32个，再加上本身的增强。

Mem Tile也就是本地内存模块，从原来的5个增加到8个，可以更好地配合更大规模的本地调度、运算。

另外，用于互连的交叉总线也从普通的Data Fabric，升级为Zen/RDNA家族上无处不在的Infinity Fabric，传输带宽和效率更高。

AMD声称，XDNA2 NPU的计算能力提升了多达5倍，多任务并行能力翻了一番，能效也提升了最多2倍。

需要指出的是，这里说的AI算力提升5倍，是指的Llama 2 70亿参数大模型的响应速度，从启动到获得第一个token，锐龙AI 9 HX 370达到了锐龙9 8940HS的多达5倍。

另外非常关键的一点，XDNA2首发引入了全新的Block FP16浮点精度，也就是BFloat16、BF16。它在CPU、GPU上已经很常见，而在NPU上还是第一次。

传统的FP8浮点格式性能高而精度不足，FP16浮点格式精度高而性能略逊，而将二者融合起来的BF16可以在精度、性能上达到较好的平衡，灵活性也更高。

同时，大多数AI应用都采用了16位精度，因此有了BF16，不再需要量化为8位精度，减少了转换步骤，提高了执行效率。

高通骁龙X Elite NPU的算力为45TOPS，Intel即将推出的下一代酷睿Ultra Lunar Lake NPU算力同样是45TOPS，锐龙AI 300系列则一举超越二者，成为当今最强NPU。

至于苹果M4，其NPU的算力只有区区38TOPS，还不到Windows阵营这边Copilot+ PC的最低算力需求门槛40TOPS。

随着算力的大幅提升，NPU的应用也将不再局限于一些持续性低负载场景(比如视频会议)，而是有了更多可能，一方面可以在更多场景中部分取代CPU、GPU，以更高的能效执行AI运算，大大提升笔记本的续航能力。

另一方面，更强力的NPU配合更强力的CPU、GPU，可以在更多场景中部署端侧AI，进一步摆脱对云侧的依赖，最大好处就是可以避免隐私泄露和安全威胁。

当然，硬件算力再强，也需要生态应用的落地配合。作为AI PC的先行者，AMD 2024年内的ISV合作厂商将超过150家，既有Adobe、微软、Topaz Labs这样的世界级大厂，也有百川智能、钉钉、、无问芯穹、有道这样的国内名企，前途不可限量。

新一代AI PC的最大亮点就是配合最新的Windows系统，可以打造全新的Copilot+体验，比如历史回忆、视频会议实时录制与翻译、协同创作等。

官方提供的数据显示，锐龙AI 9 HX 370对比高通骁龙X Elite，日常办公、生产力创作、多任务、图形等各方面都遥遥领先，尤其是图形计算性能高出了73%。

对比英特尔目前最强的酷睿Ultra 9 185H，无论是日常应用还是游戏，都有着大幅的提升，平均性能提升36%。就看英特尔下一代Lunar Lake的表现了。

对比苹果M3，锐龙AI 9 HX 370在各方面也都有着很大的性能优势，特别是在3D性能上，超出了98%。

锐龙AI 300系列的笔记本将从7月份起陆续上市，目前已有100多款设计，涵盖宏碁、华硕、戴尔、惠普、联想、微星等各大主要OEM品牌。

华硕会在台北电脑展上宣布一系列配备锐龙AI 300系列处理器的笔记本，其中轻薄本有16英寸的灵耀(Zenbook S)、14/15/16英寸的无畏(Vivobook S)，创作本有16和13英寸的ProArt P16/X13，游戏本有16英寸的ROG幻系列、14/16英寸的天选系列(TUF GAMING A14/A16)。

微星首批三款，都是16寸大屏机型，包括面向高端商务办公的Summit A16 AI+，轻薄全能游戏型的绝影A16 AI+、主打超薄商务与创作的尊爵A16 AI+。

AMD Zen5 Ryzen 9000系列发布：性能比i9-14900K快56%！

全新发布的AMD Ryzen 9000系列桌面处理器（Granite Ridge），基于Zen5构架，第一批产品将于2024年7月推出。

苏姿丰强调，Ryzen 9000系列是继Ryzen 7000“Raphael”和Ryzen 8000“Hawk Point”系列之后，AM5插槽的第三个系列，将配备两个Zen5小芯片，每个小芯片最多有8个核心，最高16个内核和32线程，与Ryzen 7000系列类似。AMD还继续支持SMT（同时多线程功能）。