英伟达:下一代GPU细节曝光

架构师技术联盟

共 4448字,需浏览 9分钟

 ·

2024-04-28 07:38


本文转自“英伟达:下一代GPU细节曝光”。Nvidia 正在准备该公司的 GeForce RTX 50 系列 (Blackwell) 产品,以与最好的显卡相竞争。著名硬件泄密者 @kopite7kimi 声称,根据他的信息,Blackwell系列的内存接口配置不会与Ada Lovelace系列有太大差异。既然这是一个泄漏,请持保留态度。我们从之前发布的一些泄密信息中了解到 ,该公司计划在其基于Blackwell 架构 的下一代顶级 GB202 GPU 中保留 384 位内存总线 。


相关链接:

1、英伟达NVLink技术详细概述

2、英伟达Blackwell平台网络配置详解

3、英伟达GB200 NVL72全互联技术,铜缆方案或成为未来趋势?

4、英伟达Blackwell性能翻5倍,AMD/Intel产品升级,国产厂商如果应对?



更多GPU技术细节,请参考文章“最新版:GPU显卡天梯图(2023年11月)”,“全球GPU呈现“一超一强”竞争格局”,“2023年GPU显卡词条报告”,“HBM崛起:从GPU到CPU”,“英伟达GPU龙头稳固,国内逐步追赶(2023)”,“英伟达L40S GPU架构及A100、H100对比”,“AI芯片第一极:GPU性能、技术全面分析”,“主流国产GPU产品及规格概述(2023)”,“新型GPU云桌面发展白皮书”,“国内外GPU现状:海外龙头领跑,国产差距明显”,“GPGPU流式多处理器架构及原理”等等。


Nvidia 的 Blackwell 可能是该公司第一个支持GDDR7内存的系列,与现有的GDDR6和GDDR6X内存解决方案相比,其更高的数据传输速率和架构特性有望显着提高性能。鉴于第一代 GDDR7 SGRAM IC 将具有 32 GT/s 的数据传输速率,采用这些芯片的 384 位内存子系统将提供约 1,536 GB/s 的带宽,因此 512 位内存接口是不容错过的。


虽然我对512位还抱有幻想,但GB20x的内存接口配置和AD10x没有太大区别。


2024 年 3 月 9 日,美光表示 16 Gb 和 24 Gb GDDR7芯片将于 2025 年上市,但其路线图并未表明这些设备是否会同时推出,还是 16 Gb 会更早推出。也就是说,仍有待观察的是 Nvidia 是否会在其最初的 GeForce RTX 50 系列显卡中使用 16 Gb 还是 24 Gb GDDR7 内存 IC。


由于英伟达的Blackwell家族至少还有两到四分之三的时间,现在很难做出预测。然而,我们在表中概述了GB200系列供电产品的可能内存配置。


迄今为止的几代产品中,Nvidia 的顶级消费类显卡均使用 384 位内存接口(AD102、GA102),事实证明,从性能和成本的角度来看,该接口是最佳的。Nvidia 顶级消费类图形产品的精简版采用 320 位内存接口,而高端 GPU 则采用 256 位总线(例如 AD103、GA103 和 GA104)。同时,性能主流段也有采用192位内存总线的GPU(如AD104、GA106)和主流段采用128位内存接口的GPU(如AD106、AD107、GA107)。


虽然泄密者的评论表明Blackwell系列将在很大程度上保留当前Ada Lovelace系列的内存接口配置,但应该记住,根据同一泄密者,Blackwell 系列将缺少 GB204 GPU。相比之下,传闻中的GB205很可能不会直接继承 AD104。



功率突破1000W?



如果您认为 Nvidia 的 700W H100 是又热又耗电的机器,那就等到今年晚些时候 的 B100  GPU上市吧。

戴尔科技集团首席运营官杰夫·克拉克 (Jeff Clarke) 表示,Nvidia 最新的 AI 加速器的功耗将达到 1,000 瓦,比其前身高出 42%。但别担心,他非常确定驯服这头野兽不需要液体冷却。

克拉克上周在戴尔财报电话会议上对投资者表示:“我们对 H200 所发生的事情及其性能改进感到兴奋。”他补充说,他对 Nvidia 即将推出的 B100 加速器和另一个他称为 B200 的加速器也有同样的感受。。

他认为,处理每个功耗 1,000 瓦的 GPU 不需要直接液体冷却——他说“明年 B200 就会达到这一水平”。

目前还不完全清楚 Clarke 所指的“B200”卡是什么,因为去年秋天英伟达与投资者分享的路线图上没有出现该名称的芯片。然而,我们怀疑 Clarke 实际上指的是 GB200 Superchip,它与GH200一样,预计将 Nvidia 的 Grace CPU 与其 B100 GPU 结合起来。


根据我们对 GH200 中 Grace CPU 的了解,并假设功耗没有重大变化,GB200 的热设计功耗 (TDP) 约为 1,300 瓦,比其前身高出 30%。

英伟达也可能还有另一张我们还不知道的牌。这家 GPU 巨头的下一代 Blackwell 架构的细节仍然很少。

除了命名之外,克拉克表示即将推出的芯片将提供一个机会来大规模展示戴尔在其他形式的液体冷却方面的专业知识。他提到“流体化学和性能、我们的互连工作、我们正在做的遥测、我们正在做的电源管理工作”作为直接液体冷却替代方案的步骤,即使对于非常密集的芯片也是如此。

在 Nvidia 的带宽使H200 GPU 在今年上半年首次亮相后,B100 预计要到 2024 年年底才会推出。

H200 于 2023 年末发布,是 H100 的更新版,配备高达 141GB 的 HBM3e 内存,可实现高达 4.8TB/秒的带宽。Nvidia声称,由于该芯片的 HBM3e 内存堆栈,该设备可以使包括 Llama 70B 在内的大型语言模型的性能提高一倍。

分析师警告称,即使今年有两款新的加速器上市,Nvidia 的 GPU 供应仍将受到限制。尽管有报道预测 Nvidia 的 GPU 出货量可能会在 2024 年增加三倍以上。

除了新的加速器之外,Nvidia 的路线图还要求在今年年底前推出速度更快、功能更强大的 InfiniBand 和以太网 NIC 以及交换机,每个端口的带宽可达 800Gb/秒。

来源:半导体行业观察

相关阅读:

转载申明:转载本号文章请注明作者来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。

推荐阅读
更多架构相关技术知识总结请参考“架构师全店铺技术资料打包(全)”相关电子书(41本技术资料打包汇总详情可通过“阅读原文”获取)。

全店内容持续更新,现下单“架构师技术全店资料打包汇总(全)”一起发送“服务器基础知识全解(终极版)和“存储系统基础知识全解(终极版)pdf及ppt版本,后续可享全店内容更新“免费”赠阅,价格仅收249元(原总价399元)。


温馨提示:

扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)电子书资料详情


浏览 337
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报