发布前已出货20万颗!英特尔40核第三代至强压制64核AMD最新EPYC

雷锋网

共 4431字,需浏览 9分钟

 ·

2021-04-08 11:53


面临AMD和其他架构的竞争,英特尔强调其产品组合的优势。

作者 | 包永刚

大数据对计算和存储性能更高的要求,引发了高性能CPU市场的新一轮争夺战。x86架构是在这一市场拥有优势,但英特尔和AMD的竞争正在加剧。另外,Arm阵营近年来在服务器市场发起猛烈攻势,新兴的RISC-V也不想错过这一利润丰厚且潜力巨大的市场。

今天,英特尔正式发布第三代至强可扩展处理器(代号:Ice Lake)及一系列相关产品组合,开启了x86阵营英特尔和AMD第三代高性能CPU新一轮的争夺战。

核心数最高为40核的10nm第三代至强处理器对战三月中旬AMD发布的最高64核7nm第三代EPYC(霄龙)CPU,谁更有优势?正式发布前就已经出货20万颗第三代至强CPU的英特尔,能否压制AMD在CPU市场的上升势头?

1


第三代至强平均性能提升46%

自2017年英特尔发布首款至强可扩展处理器,英特尔至今已经交付了超过500万颗至强处理器,部署了超过10亿个至强核心,有超过800个云服务提供商部署了基于英特尔至强CPU的服务器。

这是值得骄傲的成绩,但市场的竞争也足以让英特尔保持警惕。市场分析公司Mercury Research指出,截至2020年第三季度,AMD在客户计算芯片市场的份额已经连续12个季度增加。IDC分析师Shane Rau指出,2020年第四季度,AMD在服务器CPU市场的单位占有率为7.7%,营收占有率为8.7%。

英特尔公司副总裁兼至强处理器与存储事业部总经理Lisa Spelman在新品发布会上表示:“我们没有把至强称作一个服务器产品,它是一个数据中心产品。”

无论定位如何,处理器的升级最为直观的就是性能提升。据悉,第三代至强可扩展处理器采用英特尔10nm工艺,最多有40个核心, IPC相比上一代20核Cascade Lake有20%的提升,AI性能相比上一代提升74%,总体性能相比上一代平均提升46%,相比第一代产品平均提升2.65倍。

“我们一直努力保守核心数这一秘密,但在发布前还是泄漏了。”Lisa Spelman表示。

核心数虽然是被迫介绍,但Lisa对最新至强处理器的其它特性显然非常乐于分享,她特别介绍了三个特性。

首先,第三代至强可扩展处理器是英特尔的第一个主流双插槽并启用SGX英特尔软件防护扩展技术的数据中心处理器。

雷锋网了解到,SGX已经上市好几年了,但是这是第一次应用到至强E平台。双插槽平台可以用于增强安全性,增加指定位址空间大小和驱动基于云的机密计算环境。数据中心处理器在插槽内外的性能拓展,从根本上取决于相关架构的效率。第三代至强处理器增加了总体共享缓存,同时新的Sunny cove架构以及缓存架构升级,可以实现八个内存通道和最高3200的内存速度。

第二,作为仍然是目前唯一内置AI加速的数据中心处理器,英特尔增强了AI性能。这得益于英特尔在软件和指令集方面的投资,最新的至强处理器引入了DL Boost和VNNI指令集,可以对指令数量进行4:1或者是3:1的压缩。体现在性能上,比如Mobilenet模型处理能力提升了66%,BERT语言模型处理提升了74%。

第三,第三代至强可扩展处理器内置英特尔密码操作硬件加速。“大家都在争先恐后的去加密用户数据,想走在威胁前面,这必然会带来一些‘性能税’,我们通过创新指令,降低算法成本,最新的至强处理器可以为很多重要的加密算法包括公钥对称加密、哈希法等提供突破性的性能。”Lisa Spelman表示。

2


英特尔与AMD第三代CPU的性能对决 

升级后的第三代至强,与几周前发布的AMD第三代EPYC对比有哪些优势?英特尔的技术专家给出了两者从架构、内存到工作负载的对比数据。首先是内存时延,无论是L1、L2还是L3级缓存,第三代至强比第三代AMD EPYC都有一定程度的优势。

“至强处理器可以直接访问统一的缓存,从而获得一致的响应时间和访问数据时间。竞争对手的产品有8个不同的计算芯片,每个都有独立缓存,如果数据在本地缓存,响应时间会很短,但数据不在本地缓存就需要到另一个芯片检索数据,因此本地缓存访问和远程访问响应的时间会差很多。”英特尔技术专家解释。

内存能力方面,第三代至强可以支持两条DIMM在最高3200的频率下运行,AMD三代EPYC只能单通道运行3200的频率,这将会降低内存的吞吐量。DRAM的时延,也因为架构的差别有所差异,至强在芯片旁边就是内存控制器,所以本地插槽延时更短,可以实现最高30%的性能提升。特别是,最新至强配容量可达6TB的傲腾持久内存,能够更好地实现快速访问。

接下来看在工作负载方面的提升。英特尔技术专家表示:“工作负载加速器指令就好比性能倍增器,它提供的增益要比仅向处理器添加核心所能带来的增益高很多。”这是至强40个核心能比64核心EPYC有更高性能的关键。

根据技术专家给出的数据,在高性能计算中,在至强AVX-512指令集的优化作用下,EPYC的性能只达到1,第三代至强的性能都在1之上。这种优化对于生命科学、化学、金融领域等的工作负载加速都有积极意义。

在云服务器和基础架构服务的工作负载中,第三代至强的加密指令可以显著提升速度,在网络交易库可以实现2-3倍的性能提升,对于云基础设施的新工作负载云专家等都能体现出优势。

对比AI推理能力,至强比EPYC的优势也十分明显,单一AI负载可以比64核EPYC高25倍。英特尔技术专家指出,“许多应用是在产品发布之后通过客户软件来持续提升,这种提升非常惊人,在一些AI推理中可以达到30倍的性能提升,一些应用时延降低了10倍。”

Lisa Spelman说:“几年前开始我们就开始早早投资指令集和软件,这个战略正在产生巨大的回报。”

有意思的是,至强展现出的架构、时延的优势,其关键是传统架构与小芯片架构之间的差异。英特尔也在推动小芯片和先进封装技术的发展,未来也会将小芯片架构应用到至强处理器中,英特尔如何解决小芯片带来的挑战值得关注。 

3


强调组合产品优势,英特尔至强出货有保证

“CPU是客户购买决策的关键部分,但是这不是唯一的因素,其中最酷的因素之一就是让客户看到我们提供的整个产品组合。通过使用整个产品组合,客户能完成复杂而重要的购买决策。”Lisa Spelman表示。

英特尔公司市场营销集团副总裁、中国区数据中心销售总经理陈葆立也说:“我们之前做过一些调查,企业购买一个服务器最关心的是可靠性、稳定性、大规模部署的实力。至强已经有5000万颗的出货量,非常多软件开发商已经有很多版本的优化软件,这对客户来而言是非常大的一个吸引力。对于至强或者是x86的竞争力,我们都非常有信心。”

因此,英特尔发布第三代至强可扩展处理器的同时,还发布了傲腾持久内存200系列,内存带宽增加32%,每个插槽内存容量最高可以达到6TB。

同时,号称世界上最快的数据中心固态硬盘傲腾P5800X也正式发布,IOPS提升4倍,满足高速网络需求,TOS最高提升6倍,满足最严苛SLA要求,相较NAND固态硬盘,延迟降低13倍。

除此之外,英特尔还发布了最新的以太网适配器800系列,吞吐量最高为200GB/s,适合高性能 vRAN、NFV转发面、存储、高性能计算、云和CDN等应用场景,能够为虚拟机的密度提供最多两倍的资源。

2019年宣布的Agilex FPGA也在此次发布会上正式发布。Lisa Spelman解释,由于对灵活性和敏捷性的要求都很高,所以FPGA的研发需要漫长的时间。采用英特尔10纳米SuperFin工艺的Agilex FPGA,搭配Quartus Prime软件,与竞争对手的7纳米FPGA相比,能实现高于2倍的每瓦性能。

英特尔的组合产品在传统的零售、供水等领域都展现出了优势。

“在某些情况下,通过软件优化,我们的处理器的性能会比发布的时候有所提升。对我们来说,关键的改变重点和战略是在我们交付的产品性能基础之上进行部署优化,而不是让我们的客户或者是解决方案团队直接转移到下一代产品的开发上去。”Lisa Spelma同时表示。

陈葆立也提到:“头部客户我们直接和他们合作,一起做优化;中小企业更多是和方案商合作,我们全球有500个英特尔精选解决方案,我们还会继续投资,聚焦边缘网络、云、高性能计算、HPC和传统的企业工作负载提供精选解决方案。”

头部客户的需求让至强在正式发布之前就已经出货了20万颗。陈葆立透露:“已经出货的20万颗至强第三代可扩展处理器,主要是一些重点客户,可以进行早期验证,包括他们内部的工作负载。”

Lisa透露,第三代至强处理器在2020年底投入生产,2021年一季度一直在加大生产力度。“我们打算利用自身OEM的优势最大限度满足市场对第三代产品的需求。所有主要的云服务提供商都计划部署Ice Lake的服务,他们会在4月份首次推出此类服务。我们有超过50个优秀的OEM、ODM预计将向市场推出超过250个基于Ice Lake的设计。“

英特尔公司副总裁兼中国区总经理王锐对雷锋网(公众号:雷锋网)表示:“至强处理器的出货有保证,特别是数据中心。我们在全力提升产能,实际的提升比计划更高。”

4


小结

2015年就开启并购布局XPU的英特尔,如今看来又一次引领了异构计算的时代。因此,在外界看来英特尔面临着AMD的挑战之时,英特尔依然能够凭借全面的产品组合来应对当下的竞争。当然也可以看到,在激烈的市场竞争之下,英特尔也愿意直接拿出详细的产品性能对比数据来证明自己的实力。

AMD凭借选用台积电的先进工艺制程,以及更早使用小芯片设计赢得了再次抢夺英特尔CPU市场份额的机会,但在全球芯片缺货的背景下,产能抢夺成了纯芯片设计公司最具挑战的问题,同时,英特尔也从性能对比中指出了小芯片设计的不足,并且强调了至强独一无二的AI性能优势。在这样的情况下,拥有芯片工厂的英特尔也迎来了压制住AMD的好时机。

但是,面对来势汹汹的Arm和RISC-V,以及大数据和AI时代更加多样化的需求,英特尔也无法高枕无忧,这或许也是英特尔更加重视定制化方案,与最终用户走的更近的原因所在。

迎来新任CEO以及进入IDM 2.0时代的英特尔,还能给我们带来惊喜吗?

本文由雷锋网原创,作者:包永刚。申请授权请回复“转载”,未经授权不得转载



END

推荐阅读
早报 | 拼多多回应砍价活动涉嫌欺诈,起诉律师再发声;雷军公布小米汽车售价,并回应新Logo被骗;滴滴启动造车计划




花了6年时间,创维将电视“掰弯”


全球首款RISC-V DSP即将量产 | 国产芯片四大件





浏览 24
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报