数据处理器(DPU)行业概览(2021)

智能计算芯世界

共 4383字,需浏览 9分钟

 · 2021-07-26


今天分享内容来源头豹“中国数据处理器行业概览(2021)”,重点分析DPU定义、分类、技术路线、产业链、商业模式、主流应用场景以及全球竞争格局。


下载链接:中国数据处理器行业概览(2021)


DPU产品最初主要游有一定市场和技术储备的成熟网络设备生产商以及芯片巨头 提供,包括Mellanox,Netronome,Broadcom,Cavium。随着数据流量的暴涨以 及CPU算力瓶颈的凸显,中小企业亦开始布局DPU市场,例如BittWare与Ethernity 等。DPU市场处于早期阶段,技术路线与产品形态均不明确,中小企业试错成本 高,难以迅速发展。云计算厂商巨头包括亚马逊以及华为云通过收购优质的DPU 企业或自研DPU用于自身部署。


国际DPU市场上,英伟达、英特尔以及博通均推出了多款产品,数据的传输速率以及存储的读写速率分别达到40Gbps以及32Gbps。中国本土DPU企业起步较晚,数据的传输速率以及存储的读写速率分别为10Gbps与8Gbps,与国际头部厂商有着1-2代的技术差距。同时,本土企业DPU商用化不足,在性能上以及可靠性上都无法满足当代云计算厂商的需求。


速向100Gbps发展。数据中心算力提升遭遇瓶颈,难以匹配快速增长的网络传输速率,激发DPU需求。此外,CPU相对更适合处理串行的复杂指令操作,对大量并行的固定模式计算并不适用,例如网络传输的协议栈(TCP/IP)等。



DPU本质作用在于承载网络侧专用性的网络堆栈算法和传输协议运算转移,核心效用在于释放CPU算力资源、助力其他计算模块高效处理业务数据。相对而言,传统网卡仅负责数据链路的传输,故而CPU承担存储、数据、网络加密等繁杂事务,占用大量业务计算资源。


DPU可基于FPGA、MP(Multi-core,MP)与ASIC三类核心处理器进行设计;产品实现角度:已商用的DPU产品形态包括“ASIC+GP”(NVIDIA等采用)、“ASIC+NP”(华为等采用)。



差异化技术路径满足用户差异化需求:基于FPGA、MP、ASIC的DPU在性能、成本、可编程性等方面的表现存在较大差异,供应商可通过不同处理器组合的技术路径,实现单点突破的产品模式,或寻求不同需求点之间的平衡。


云数据中心流量高速增长,软件加速、嵌入式CPU加速方案将逐渐被DPU替代;FPGA与SoC是DPU主流的技术路线,在性能、成本以及灵活性上实现了较为理想的平衡。



DPU是网卡与处理器的结合,具备传输与计算的能力。早期,Intel为对抗异构芯片(CPU+专用芯片)的趋势,推出了软件加速(SR-IOV、DPDK)与嵌入式CPU的加速方案。软件加速与嵌入式CPU都存在性能上限,无法满足当前数据中心需求,因此逐渐被DPU替代。


嵌入式CPU逐渐被DPU替代,削弱了Intel在服务器处理器的市场份额以及影响力;服务器处理器有望形成DPU、GPU、CPU三足鼎立的状态;NVIDIA通过收购Mellanox积极布局DPU,抢占市场。凭借在GPU的绝对优势以及未来DPU的发力,NVIDIA有望在服务器处理器三大芯片中占据其二,替代Intel的霸权地位。


DPU产线向上游采购三类处理器,采购方式包括外购、同厂跨部门采购等,DPU产线基于底层处理器开发更为专用的计算、传输等功能;中国DPU行业下游市场发展成熟,数通市场需求扩容速度最快,电信市场存在潜在底层需求,或驱动下一轮数通市场对DPU需求释放。



DPU产线上游EDA市场已在全球范围形成较为成熟、全面、分工明晰的产品线,EDA三巨头已通过兼并购形成壁垒。中国本土EDA厂商可通过行业资源整合、定制化产品路线突围。



DPU采用10/14纳米先进工艺,集成的IP数量多,设计成本高;在NPU、BPU等专用产线,中国IP核市场取得突破,在CPU、GPU等通用处理器市场,中国IP核积累不足。


随着先进制程的演进,线宽的缩小使得芯片中晶体管数量大幅提升,单颗芯片中可集成的IP数量也因此大幅增加。IP可帮助降低芯片的开发难度、缩短芯片的开发周期并提升芯片性能。随着先进工艺的升级,IP核数升级为芯片设计厂商带来的收益呈现边际递减趋势。中国IP产业发展滞后,难以为中游DPU设计厂商提供有力支持,限制DPU新兴市场的发展。



中国IP产业目前已实现在接口IP细分领域的国产替代,但在处理器类芯片的IP产出较少。在人工智能芯片领域,以寒武纪为代表的本土厂商在NPU IP细分市场已有较强的影响力;地平线在BPU IP细分市场取得重大突破。


数通领域是DPU最大的应用市场,可为终端政企用户提供较为成熟的硬件加速解决方案;随着NFV技术的演进,电信市场对DPU的需求将逐步释放。



网络虚拟化(NFV)是5G关键技术之一。NFV技术推动下,运营商对于边缘计算开放生态、降本增效、缩减部署周期的诉求愈发明晰。边缘计算是赋能行业数字化转型的关键技术,对网络带宽、时延、可靠性要求严苛,进而激发电信行业对DPU硬件加速技术的需求。


中国本土初创DPU供应商:前期资本充足的情况下,初创DPU团队可自主研发处理器微架构,该类企业或将成为推动DPU国产替代的主力;以高级软件自研为核心的初创企业通过定制化服务方案积累第一批熟客,以平均低于境外同类服务>10%的价格,满足并理解中国云计算市场复杂应用场景的需求。



全球DPU供应商:收并购扩充产线是DPU头部供应商巩固现有市场地位的惯用手段。初创企业通过相同技术与产品难以颠覆头部企业的市场地位,只有结合商业模式以及逻辑上的创新才有机会突破头部企业的封锁。



2020 年 , 中国DPU产品主要由 NVIDIA(Mellanox)、Intel与Broadcom三家企业提供,其中Mellanox凭借在网卡上积累的优势,占据市场龙头位置。中国DPU市场规模预计在2025年达到40亿美元。通常数据中心带宽升级周期在3年左右。中国将在2023-2025年进入下一轮服务器设备以及DPU更换周期,DPU市场规模有明显的增幅。


数通市场是DPU最大的应用市场,其中裸金属服务器对DPU存在刚需。DPU在电信市场的应用主要为边缘计算场景,渗透率不足5%。针对智能驾驶领域的DPU仍在探索阶段,预计在2023年DPU才有望布局在智能驾驶领域。


数通市场:数据中心2-3年迭代一次,DPU随数据中心带宽的升级而迭代。2020年,头部云计算厂商买入400G数据中心时代,对DPU的需求为25G/40G。预计到2023年,数据中心将升级至800G,届时云计算厂商需要升级100G DPU。



数据中心带宽升级,出于成本与算力需求考虑云计算厂商同时会在当年更换1/3的DPU。在随后2年里,算力需求持续增加,更换老旧服务器(服务器的生命周期通常在4-5年)的性价比更高。


电信市场:5G技术要求网络实现“大容量、大带宽、大联结、低延迟、低功耗”驱动了DPU在边缘机房部署的可能。在当前网络架构中,核心网部署在远端,传输时延较大,且无法满足5G时代下数字化和智能化对算力的高要求。



为了分担终端算力,将算力向云端移动,同时为了降低时延,将业务向边缘移动。MEC部署在网络边缘,可以减少数据传输过程中的转发和处理时延,并降低终端成本。但随着各种业务和应用汇聚在边缘端,导致MEC边缘云的计算开销激增,而边缘机房的供电、散热及承重能力有限,无法通过堆加大量的X86 CPU来提升算力,且CPU性能已无法按摩尔定律增长。此时,在MEC边缘云上,可将消耗CPU资源高的业务卸载至DPU上,释放边缘机房CPU的算力,降低机房功耗,同时提升边缘业务体验。


智能驾驶:未来智能驾驶汽车可看做一个小型数据中心,并伴有大量的数据处理、转发、交换和存储。为降低车载终端在无线侧的传输时延,每辆智能驾驶汽车有望配备至少两块DPU。



5G时代,自动驾驶和车联网等智能驾驶相关业务为行业带来了高带宽、低时延以及大联接的网络需求。自动驾驶业务中辅助驾驶要求时延为20~100ms,而自动驾驶要求时延可低至3ms。DPU在车载终端的部署可提升终端处理能力并降低时延。


全球DPU市场排名前三的企业包括NVIDIA、Intel与Broadcom,在技术积累与市场渠道上优势显著。其中,NVIDIA通过收购优质标的,在DPU市场实现弯道超车。



DPU市场是 各 大 芯 片厂商新战 场 。NVIDIA 、 Intel 以 及Broadcom陆续发布旗下的DPU(Intel与Broadcom定义为智能网卡),分别位列市场前三。NVIDIA通过收购Mellanox,其产品在时延与功能均位居市场第一。


超低时延:Mellanox在InfiniBand领域技术专利第一。相比于以太网技术,InfiniBand具备高带宽、低时延的优势。Mellanox也因此在时延上领先于Intel与Broadcom。在25G及以上的网卡领域,Mellanox市场份额领先于Intel,位列市场第一。中国初创企业25G网卡中使用的网络芯片多基于Mellanox的CX5与CX6(ConnectX-6)架构上研发。


RDMA业界独一档:RDMA最初是InfiniBand网络的技术,最后移植在以太网技术上。Mellanox在InfiniBand网络上提前布局,因此在RDMA的开发上具备天然的优势。NVIDIA通过收购Mellanox ,其DPU产品RDMA功能的实现节点与性能上都领先Intel与Broadcom。



DPU是芯片异构趋势下的产物。英伟达是芯片异构的拥护者,期望通过发力DPU狙击英特尔。英特尔CPU“一招吃遍天下”的模式与异构相违背。因此,为顺应大趋势,英特尔亦大力布局FPGA以及DPU。


下载链接:

中国数据处理器行业概览(2021)

DPU在数据中心和边缘云上的应用

英伟达DPU集数据中心于芯片


本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料




免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。


电子书<服务器基础知识全解(终极版)>更新完毕,知识点深度讲解,提供182页完整版下载。

获取方式:点击“阅读原文”即可查看PPT可编辑版本和PDF阅读版本详情。



温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。


浏览 74
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报