从全球领先企业看GPU发展方向

架构师技术联盟

共 5548字,需浏览 12分钟

 ·

2021-10-30 06:39



GPU的优势在于多核,每个核拥有的缓存相对较小,数字逻辑运算单元少且简单。GPU市场已经进入寡头竞争时代,PC端方面主要以Intel, NVIDIA,AMD为主。


Intel借助其CPU在PC及服务器的绝对优势,在GPU市场方面也占据优势地位;NVIDIA与AMD则凭借领先的技术,在独立GPU领域占据优势。我们通过分析GPU的特性,以及NVIDIA与AMD的发展历程,得出两点结论:第一,外延并购加强研发才能提升市场竞争力;第二,独立显卡由于其优秀的性能将会是未来的主要发展方向。


捕捉GPU应用的三大方向之一:追求极致的娱乐与性能平衡。全球游戏市场蓬勃发展,带动PC出货量上升。在多种PC当中,游戏本受到的关注最多。游戏本的出货的上升在较大的程度上是由于支持光追技术的游戏本增加。但是高性能的GPU相对笨重且功耗大,未来笔记本会向轻薄化与强性能方向发展。


捕捉GPU应用的三大方向之二:人工智能与深度学习。人工智能已经成为经济发展的助推器。人工智能起始于深度学习。深度学习分为“训练”与“推理”两个过程。在“训练”阶段,GPU由于其多核特性,适用于并行计算;在“推理”阶段,由于目前FPGA与ASIC的技术尚未成熟,GPU仍是较为主要芯片。


捕捉GPU应用的三大方向之三:自动驾驶。自动驾驶技术已经成为整个汽车产业的最新发展方向,市场空间广阔。目前,全球多个GPU公司已经在自动驾驶方面布局。GPU由于其并行计算的优势能较好地处理图像与媒体信息。目前GPU是自动驾驶领域的主流方案。


GPU的作用与分类

GPU(Graphic Processing Unit),及图形处理器,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。在 PC 诞生之初,并存在 GPU的概念,所有的图形计算都由 CPU 进行计算。然而,使用 CPU 做图形计算速度较慢,于是就设计了专门的图形加速卡用以帮助处理图形计算。再后来,NVIDIA 提出了 GPU 的概念,将 GPU 提升带了一个单独的计算单元的地位。



CPU 一般由逻辑运算单元、控制单元和存储单元组成。CPU 虽然有多核,但总数没有超过两位数,每个核都有足够大的缓存;CPU 有足够多的数字和逻辑运算单元,并辅助有很多加速分支判断甚至更复杂的逻辑判断的硬件。因此,CPU 拥有超强的逻辑能力。GPU的优势在于多核,核数远超 CPU,可以达到数百个,每个核拥有的缓存相对较小,数字逻辑运算单元少且简单。因此,GPU 相对于 CPU 更适用于处理数据并行计算问题。


GPU 具有两种分类方式,一种根据与 CPU 的关系,另一种是根据 GPU 所在的应用端类别。根据与 CPU 的关系,GPU 可以分为独立 CPU 和 GPU。独立 GPU 一般焊接在显卡的电路板上,位置在显卡的风扇下面。独立 GPU 使用的是专用的显示存储器,显存带宽决定了和GPU 的连接速度。集成 GPU 一般与 CPU 集成在一起。集成 GPU 与 CPU 共有一个风扇和缓存。



集成 GPU 由于设计制作、驱动程序都由 CPU 厂家完成,因此兼容性较好;此外,由 于 CPU 与 GPU 实现了集成,因此,集成 GPU 的占用空间小;实现 GPU 与 CPU 的适配与兼容,集成 GPU 的性能相对独立 GPU 较弱,因此功耗和成本相对独立 GPU 较低。独立 GPU由于拥有独立的显存,更大的空间和更好的散热,因此在性能上面独立显卡更好;但需要额外的空间,能够满足复杂庞大的图形处理需求,并提供高效的视频编码应用。然而,强劲的性能意味着更高的耗能,独立 GPU 需要额外的供电,并且成本也更高。


根据应用终端类别,可以分为 PC GPU,服务器 GPU,移动 GPU。PC GPU 应用于 PC 端。根据其所在产品定位既可以使用集成 GPU,也可以使用独立 GPU。例如,若 PC 以轻办公,文字编纂为主,一般产品会选择搭载集成 GPU;若 PC 需要制作高清图片,编辑视频,渲染游戏等,则选择的产品搭载独立 GPU。服务器 GPU 应用于服务器,可做专业可视化、计算加速、深度学习等应用,根据云计算、人工智能等一系列技术的发展,服务器 GPU将会以独立 GPU 为主。



移动端轻薄化已经成为趋势,终端内部净空间由于多种功能模组的增加已经快速下降;同时就目前移动端需要处理的视频和图像而言,集成 GPU 已经能够满足。所以移动 GPU 一般采用集成 GPU。


GPU市场:寡头竞争时代已经来临

PC GPU市场,Intel优势明显。Intel 是全球最大的处理器供应商。目前主流的处理器架构是 X86,主要的供应商是 Intel,AMD,VIA。Intel 凭借在 CPU 出货量上的优势,通过销售集成 GPU,实现了在 GPU 市场的霸主地位。AMD 作为全球第二大的 X86 架构处理器供应商,既受益于 CPU 出货带动的集成 GPU 出货量,也受益于自身优秀的独立 GPU 的出货。NVIDIA 是全球领先的独立 GPU 供应商,同时结合 ARM 架构处理器,出货集成GPU.


独立CPU领域,AMD奋起直追。AMD 推出的Radeon 系列部分型号采用 7nm 工艺,并且在与 NVIDIA 的产品对比中(RTX2070 对标RX5700,RTX2070S 对标 5700XT),同系列 AMD 性能略强,价格更低,重点是功耗一样。更强的性能,更低的功耗,AMD 的产品无疑对 NVIDIA 的市场份额造成了挑战。



五雄争霸,手机厂商不甘寂寞。在移动 GPU 领域,主要以 Imagination、ARM、Qualcomm、Vivante、NVIDIA 为主。高通目前是 Android 阵营最大的处理器供应商。移动端主要使用集成 GPU,因此,高通 GPU 因其处理器的市场优势也有所受益。ARM Mail GPU 的主要使用者是华为和三星。ARM Mail 的 GPU 性能相对较弱,因此华为在2018年通过推出 GPUTurbo 软硬件优化弥补短板。



三星方面已经与 AMD 前敌多年的 IP 授权,AMD 将向三星授权最新的 7nm RDNA 架构 Radeon 显卡 IP,并且尝试自研 GPU。苹果在与 Imagination取消合作两年后,再次选择与 Imagination 合作,并给予支付授权费。虽然目前手机巨头都是采取购买 GPU 厂商 IP 的方式,但是目前三星、苹果、华为等有相关计划进行 GPU 自研项目。手机已经进入同质化时代,手机之间的差异性已经成为手机厂商竞争优势的关键。公版 GPU 难以使手机厂商产生本质的差异性。因此,手机需要通过自研 GPU 以及 CPU 实现手机性能的差异化,从而获得市场的竞争优势。


捕捉GPU 应用的三大方向之一:追求极致的娱乐与性能平衡

移动端占据主要市场,PC 端游戏市场规模继续扩大。近年来,随着移动终端与 PC 终端的普及率不断提升,游戏开发商提供各类吸引玩家的游戏,游戏市场出现了蓬勃发展。


中国赛区具备良好的电竞市场土壤,市场规模巨大。中国电竞用户分布更为分散。根据前瞻产业研究院数据显示,中国有 48.1%的电竞用户是在 24 岁以下的学龄段用户,更有高达 28.1%的 30 岁以上用户。


捕捉GPU 应用的三大方向之二:人工智能与深度学习

人工智能影响深远,三大因素驱动发展。当前,人工智能已进入新一轮爆发期,主要驱动因素来自三个方面:一是互联网发展提供了海量大数据资源,大大提升了算法有效性;二是计算机变革降低了硬件成本,缩短了运算时间,推动人工智能再次崛起;三是基础算法和 AI 平台自身创新加速,克服了传统算法和人类手工总结不完备的缺点,实现算法有效性大幅提升。


人工智能前景广阔,是经济社会发展的一大助推器,吸引世界主要国家争相布局。近年来,美国、中国、日本、英国、法国、韩国、欧盟委员会都发布了促进 AI 研究、开发和应用的战略,积极在人工智能领域进行卡位


全球人工智能市场将在未来几年经历现象级的增长。德勤预测,未来 2025 年世界人工智能市场将超过6万亿美元,2017-2025 年复合增长率达 30%。


人工智能是实现数字化和智能化社会必不可少的条件。人工智能的三大要素:数据、算力、算法。数据是人工智能算法的原材料。人工智能需要对大数据的处理与分析,挖掘出数据背后的信息与规律。算力是对大数据进行处理的能力。算法是计算机通过对数据的处理获得的数据模型。深度学习的本质是通过对大数据的处理并建立的算法模型,可以实现各行业的 AI 应用,算法将数据和算力连到一起,共同针对不同细分场景,提供效率优化方案。


人工智能运行过程中有两部分:训练与推理。“训练”可以看作算法产生的过程。具体而言就是,在现有数据基础上,经过大量计算,确定模型参数,即建立算法模型的过程。“推理”可以看作将算法应用的过程,即在已建立的算法模型基础上,将新数据通过算法模型处理,得出结果的过程。



“训练”阶段 GPU 具备明显优势。虽然 CPU 的功能模块较多,但是大部分晶体管主要用于构建控制电路和高速缓冲存储器,只有少部分的晶体管可以组成各类专用电路。CPU的优点在于调度、管理、协调能力强,计算能力不是重点。因此,从运算性能和效率看,CPU 不是计算芯片的最佳选择。深度学习算法需要处理海量数据,需要进行大量的简单运算,因此,深度学习对并行计算计算能力有较高的要求。在这一方面,GPU 拥有较强的优势,尤其是在训练过程中。


“推理”阶段 GPU 是其中一种选择。训练与推理阶段对运算的要求有所不同,训练阶段需要大量繁复的运算,并且为了让人工智能模型获得更佳的参数调整数据,运算的精准细腻度较高,而推理阶段则相反,模型已经训练完成,不再需要庞大运算量,且为了尽快获得推理结果,允许以较低的精度运算。因此,在推理过程中,芯片有多种选择,主要用 CPU、GPU、FPGA、ASIC 四种芯片。



CPU适合进行逻辑控制、串行计算等通用计算;GPU 并行计算能力强,但是无法单独工作,必须由 CPU 进行控制调用才能工作;FPGA 适用于多指令,单数据流的分析,因此常用于预测阶段,如云端。但是 FPGA 在实现复杂算法方面有一定的难度,运算量相对 GPU 小,量产成本高;ASIC 专用性强,但是开发周期较长,开发环境需要底层硬件编程,开发难度极高。


捕捉GPU 应用的三大方向之三:自动驾驶

智能汽车是指通过搭载先进传感器等装置,运用人工智能等新技术,具有自动驾驶功能,逐步成为智能移动空间和应用终端的新一代汽车。当前,自动驾驶技术已经成为整个汽车产业的最新发展方向。应用自动驾驶技术可以全面提升汽车驾驶的各方面性能,满足更高层次的市场需求。5G 的加速推进使自动驾驶的落地可能性在不断增大,同时近两年随着感知技术、算法、芯片、决策控制、系统融合等关键技术的快速发展。


自动驾驶目前以 GPU 为主:一般而言,自动驾驶车身需要配置 12 个摄像头。为了识别障碍物,处理器需要对多路摄像头实时拍摄的数据进行解析。因此,单颗 1080P的高清摄像头每秒可以产生超过 1G 的数据。12 个摄像头每秒产生 12G 数据量。


瞬时海量的数据处理对计算能力要求非常高,GPU 有着较强的优势。相比 GPU 在传统的车载仪表盘渲染能力要求,ADAS 更强调 GPU 的并行计算能力,已实现对图像进行分析和处理。ADAS 和全自动驾驶平台将使用 GPU 来分析传感器数据,以此迅速做出反应。这些数据不仅来自传感器,还来自摄像头。图像处理本身需要的是能对计算密集度较高得并行计算做出反应,在并行计算方面,GPU 有着较强的优势。


目前,自动驾驶的主流方案是GPU + CPU 。这是由于 FPGA 的技术门槛较高,处于创业类自动驾驶公司而言在短期内掌握足够熟练的 FPGA 编程技术并实现硬件可靠性设计的难度太大,因此使用通用型 CPU+GPU 来做自动驾驶计算平台或域控制器的开发成为当前的主流。



下载链接:GPU技术专题汇总

1、AI芯片—下一代计算革命基石

2、自主可控GPU机遇,逐步渗透市场

3、从全球企业看GPU 发展方向 

4、人工智能核“芯”,GPU迎来发展良机 

5、芯片竞争:GPU、ASIC和FPGA

6、自动驾驶芯片:GPU现在和ASIC未来 

7、GPU制霸AI数据中心市场


ARM架构参考手册及文档

ARM的体系结构与编程.pdf

ARM架构参考手册.pdf

ARM架构参考手册ARM V9.pdf

CPU之战:ARM vs Intel.pdf

ARM系列处理器应用技术完全手册

CPU和GPU研究框架合集

来源:智能计算芯世界




转载申明:转载本号文章请注明作者来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。


推荐阅读

更多架构相关技术知识总结请参考“架构师全店铺技术资料打包”相关电子书(37本技术资料打包汇总详情可通过“阅读原文”获取)。

全店内容持续更新,现下单“全店铺技术资料打包(全)”,后续可享全店内容更新“免费”赠阅,价格仅收198元(原总价350元)。



温馨提示:

扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)电子书资料详情


浏览 42
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报