在宣布400亿美元收购Arm的6个月后,NVIDIA连发三款基于Arm IP打造的处理器,包括全球首款专为TB级加速计算而设计的CPU NVIDIA Grace、全新BlueField-3 DPU,以及业界首款1000TOPS算力的自动驾驶汽车SoC。NVIDIA在2021年 GTC线上大会,公布了其首款代号为Grace的CPU产品,它是为现代数据中心设计的。该CPU以计算机科学家Grace Hopper的名字命名,Grace Hopper是计算机科学的先驱之一,也是哈佛Mark 1的第一批程序员和第一个链接器的发明者。Grace CPU是NVIDIA首次采用研发多年的下一代Neoverse核心的设计。整个SoC是由多个芯片组合构成,它主要有三个部分,分别是CPU、GPU和内存/IO子系统。英伟达并没有透露太多细节,但该公司表示,Grace CPU将能够在SPECrate2017_Int_base中提供300分以上的成绩。Grace是一款高度专业化的处理器,主要解决工作负载问题,例如训练拥有超过1万亿个参数的下一代NLP模型。当与英伟达GPU紧密结合时,基于Grace CPU的系统将比当今最先进的基于英伟达DGX的系统(运行在x86 CPU上)的性能还要快10倍。英伟达推出Grace的原因是,AI模型的数据量和规模正在成倍增长。当今最大的AI模型包括数十亿个参数,并且每两个半月就会翻一番。训练它们需要一个新的CPU,可以与GPU紧密结合,以消除系统瓶颈。英伟达通过利用ARM数据中心架构的灵活性来构建Grace。通过推出全新的服务器级CPU,英伟达正在推动AI和HPC社区实现技术多样性的目标,而在这些社区中,选择是提供解决世界上最紧迫问题所需创新的关键。Grace性能的基础是第四代NVIDIA NVLink互连技术,该技术在Grace和NVIDIA GPU之间提供了创纪录的900 GB/s连接,与当今领先的服务器相比,总带宽提高了30倍。此外,Grace还将采用创新的LPDDR5x内存子系统,与DDR4内存相比,可提供两倍的带宽和10倍的能效。此外,新的架构提供了统一的缓存一致性和单一的内存地址空间,将系统和HBM GPU内存结合在一起,简化了可编程性。Grace将得到NVIDIA HPC软件开发包和全套CUDA和CUDA-X库的支持,这些库可以加速超过2000个GPU应用,加快科学家和研究人员对世界上最重要挑战的发现。Grace CPU预计将于2023年初上市,作为首批客户,洛斯阿拉莫斯国家实验室已经计划在2023年上马由惠普企业公司打造的Grace驱动的超级计算机。1、行业深度报告:GPU研究框架
2、信创产业研究框架
3、ARM行业研究框架
4、CPU研究框架
5、国产CPU研究框架
6、行业深度报告:GPU研究框架
1、2020信创发展研究报告
2、中国信创产业发展白皮书(2021)
3、信创研究框架
4、云计算行业:新基建和信创云计算进阶
5、深度研究:云计算与信创产业持续快速发展
6、深度:信创产业系列专题(总篇)
7、计算机行业研究:信创和鲲鹏计算产业链
《NVIDIA A100 Tensor Core GPU技术白皮书》《NVIDIA Kepler GK110-GK210架构白皮书》《NVIDIA Kepler GK110-GK210架构白皮书》《NVIDIA Kepler GK110架构白皮书》《NVIDIA Tesla V100 GPU架构白皮书》
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
电子书<服务器基础知识全解(终极版)>更新完毕,知识点深度讲解,提供182页完整版下载。
获取方式:点击“阅读原文”即可查看PPT可编辑版本和PDF阅读版本详情。
温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。