主流国产GPU产品及规格概述(2023)

架构师技术联盟

共 5605字,需浏览 12分钟

 ·

2023-08-16 07:27

美国对 AI 芯片出口管制,自主可控要求下国产芯片需求迫切。2022 年 10 月 7 日美国商务部工业安全局(BIS)发布《美国商务部对中华人民共和国(PRC)关于先进计算和半导体实施新的出口管制制造》细则,其中管制物项 3A090、4A090 包含高性能 AI 芯片产品,而Nvidia A100 和 H100 均符合管制要求。


在此背景下,Nvidia 推出性能阉割的中国特供版芯片 A800 和 H800。在国内自主可控大背景下,国内 AI 产业对国产芯片需求迫切,或加大对国产芯片公司支持力度,国产 AI 芯片有望迎来技术进步和市场机遇。


未来在人工智能芯片,特别是 GPU 上对中国的制裁将对中国 AI 产业提出极大的挑战。挑战伴随着机遇,高端 GPU 的限售给予了国产厂商替代空间。


在国产替代的背景下,政策支持推动国产 GPU 行业高速发展。2020 年以来,国家及各省市陆续出台了若干政策,通过税收减免、财政补贴等方式支持半导体与集成电路产业发展。


国产GPU 持续发力,对标行业龙头缩小差距。GPU 有两条主要的发展路线:分别为传统的 2D/3D 图形渲染 GPU 和专注高性能计算的 GP GPU,近年来,国产GPU 厂商在图形渲染 GPU 和高性能计算 GPGPU 领域上均推出了较为成熟的产品,在性能上不断追赶行业主流产品,在特定领域达到业界一流水平。生态方面国产厂商大多兼容英伟达 CUDA,融入大生态进而实现客户端导入。


本文内容来源:AI算力行业深度:AI模型乘风起,GPU掌舵算力大,上篇内容参考“GPU竞争壁垒:微架构和平台生态”。



1、寒武纪


寒武纪自 2016 年成立以来一直专注于人工智能芯片产品研发与技术创新,致力于打造人工智能领域的核心处理器芯片。公司主要提供云端智能芯片及加速卡、训练整机、边缘智能芯片及加速卡、终端智能处理器 IP 及配套基础软件开发平台,产品广泛应用于消费电子、数据中心、云计算等诸多场景。



2022 年 月 21 日,公司正式发布新款训练加速卡 MLU370-X8,搭载双芯片四芯粒思元 370,集成寒武纪 MLU-Link™多芯互联技术,在业界广泛应用于YOLOv3Transformer 等训练任务中。


MLU 370-S4MLU370-X4 和 MLU370-X 均基于思元 370 智能芯片的技术,通过 Chiplet 技术灵活组合产品的特性,可满足更多市场需求。


2、海光信息


海光信息主要从事高端处理器、加速器等计算芯片产品和系统的研发、设计和销售。公司的产品包括海光通用处理器(CPU)和海光协处理器(DCU),具有成熟而丰富的应用生态环境,内置专用安全硬件,可满足互联网、金融、能源等行业的广泛应用需求。


公司 DCU 系列产品海光 8100 采用先进的 FinFET 工艺,以 GPGPU 架构为基础,兼容通用的类 CUDA”环境以及国际主流商业计算软件和人工智能软件,可充分挖掘应用的并行性,发挥其大规模并行计算的能力。



3、景嘉微


景嘉微致力于信息探测、处理与传递领域的技术和综合应用。公司产品涵盖集成电路设计、小型雷达系统、无线通信系统、电磁频谱应用系统等方向,广泛应用于有高可靠性要求的航空、航天、航海、车载等专业领域。


公司先后自研制成功 JM5 系列、JM7 系列、JM9 系列高性能 GPU 芯片,其中最新的 JM9 系列两款图形处理芯片皆已完成阶段性测试工作,并进入放量阶段。JM9 系列芯片应用领域广泛,可满足个性化桌面办公、网络安全保护、轨交服务终端、多屏高清显示输出和人机交互等多样化需求。



4、芯原股份


芯原依托自主半导体 IP,为客户提供平台化、全方位、一站式芯片定制服务和半导体 IP 授权服务,拥有独特的“芯片设计平台即服务”经营模式。公司可提供高清视频、物联网连接、数据中心等多种一站式芯片定制解决方案,拥有自主可控的图形处理器 IP、神经网络处理器 IP 等五类处理器 IP 1400 多个数模混合 IP 和射频 IP,可快速打造出从定义到测试封装完成的半导体产品,业务范围覆盖消费电子、汽车电子、物联网等多种应用领域。据 IPnest 2021 年的统计,芯原的半导体 IP 销售收入排中国大陆第二,全球第七,其中公司的图形处理器 IP 排名全球前三。



公司的 GPU IP 已被众多主流和高端的汽车品牌所采用,同时,公司基于约 20Vivante GPU 的研发经验,所推出的 Vivante 3D GPGPU IP 还可提供从低功嵌入式设备到高性能服务器的计算能力,满足广泛的人工智能计算需求。


5、壁仞科技


壁仞科技创立于 2019 年,在 GPUDSA(专用加速器)和计算机体系结构等领域具有深厚的技术积累。公司致力于开发原创性的通用计算体系,建立高效的软硬件平台,同时在智能计算领域提供一体化的解决方案。



2022 8 月公司发布的通用 GPU 芯片 BR100 创下全球通用 GPU 算力记录,峰值算力达到国际厂商在售旗舰产品 3 倍以上。BR100 率先采用 Chiplet 技术、新一代主机接口PCIe 5.0、支持 CXL 互连协议,确立了公司在国内厂商间的技术领先地位。公司坚持自主研发,同步推出原创架构“壁立仞”和自研BIRENSUPA 软件平台,实现了 BR100 性能的大幅提升。


以壁仞科技于 2022 8 月发布的首款 GP GPU BR100 为例,该芯片采用 Chiplet 技术,16 位浮点算力达到 1000T 以上、8 位定点算力达到 2000T 以上,单芯片峰值算力达到 PFLOPS级别,是国际厂商在售旗舰产品的 3 倍以上,创造了全球通用 GPU 的算力记录。


6、摩尔线程


摩尔线程专注于设计高性能通用 GPU 芯片,提供图形计算和 AI 计算的元计算平台的集成电路高科技公司。公司高管团队来自英伟达、AMDARM 等知名芯片公司,拥有丰富的 GPU 研究经验,致力于创新面向元计算应用的新一代GPU,构建融合视觉计算、3D 图形计算、科学计算及人工智能计算的综合计算平台,建立基于云原生 GPU 计算的生态系统。



2022 11 月,公司推出基于第二代 MUSA 架构的处理器春晓,并基于”GPU 发布面向消费领域的国产芯片显卡 MTT S80 和面向服务器应用的MTTS3000 显卡。同时,公司围绕 MUSA 发布了系列 GPU 软件栈与应用工具,包括 MUSA 开发者套件、云原生 sGPU 技术及元宇宙平台 MTVERSE 等。


7、芯动科技


芯动科技是国内一站式 IP 和芯片定制及 GPU 领军企业,聚焦计算、存储、连接等三大赛道,提供从 55 纳米到 5 纳米全套高速 IP 核以及高性能定制芯片解决方案。公司拥有经验丰富的技术团队,成立 16 年来已赋能全球数百家知名客户,授权逾 80 亿颗高端 SoC 芯片进入规模量产,拥有过十亿颗 FinFET 定制芯片成功量产经验。



公司瞄准商用市场推出芯动风华系列 GPU。该系列 GPU 性能强劲、跑分领先、功耗低、自带智能计算能力,且全面支持国内外 CPU/OS 和生态,包括 LinuxWindows Android


8、兆芯


兆芯成立于 2013 年,提供高效、兼容、安全的自主通用处理器和芯片组等产品,公司掌握自主通用处理器及其系统平台芯片研发设计的核心技术,全面覆盖其微架构与实现技术等关键领域,拥有较为完整的知识产权体系,截至目前已获权约 1300 件专利。



2020 年,兆芯将自身 GPU 业务进行切分独立,建立了格兰菲智能科技有限公司。公司目前已推出 Arise-GT10C0 芯片及 Glenfly Arise-GT-10C0 显卡。芯片内置完全独立自主研发的新一代图形图像处理引擎,兼容银河麒麟 KOS、统信软件 UOSWindows 等主流操作系统,同时可在 X86ARMMIPS 等主流硬件台操作运行,支持多种图形和图像的 API 接口标准。


9、天数智芯


天数智芯致力于开发自主可控、国际领先的高性能通用 GPU 产品并提供解决方案,是国内头部通用 GPU 高端芯片及超级算力系统提供商。公司以“成为智能社会的赋能者”为使命,立足客户、市场的需求,加速 AI 计算与图形渲染融合,探索通用 GPU 赶超发展道路,产品广泛应用于智算重心、智慧医疗、互联网、智能制造等领域。



12 20 日,天数智芯推出通用 GPU 推理产品智铠 100”及其丰富的 AI 应用案例。智铠 100 计算性能高、应用覆盖广、使用成本低,支持 FP32FP16INT8多精度混合计算,可提供最高 384TFlops@int896TFlops@FP1624TFlops@FP32 的峰值算力,800GB/s 的理论峰值带宽以及 128 路并发的多种视频规格解码能力。


10、沐曦


沐曦于 2020 9 月成立于上海,致力于为异构计算提供全栈 GPU 芯片及解决方案,可广泛应用于人工智能、智慧城市、自动驾驶、数字孪生、元宇宙等前沿领域。公司拥有技术完备、设计和产业化经验丰富的团队,核心成员平均拥有近20 年高性能 GPU 产品端到端研发经验。



公司拥有完全自主研发的 GPU IP、指令集和架构,以及兼容主流 GPU 生态的完整软件栈(MXMACA),产品具备高能效、高通用性。目前已推出 MXN 系列GPU(曦思)用于 AI 推理,MXC 系列 GPU(曦云)用于 AI 训练及通用计算,以及 MXG 系列 GPU(曦彩)用于图形渲染,可满足数据中心对高能效和高通用性的算力需求。


11、龙芯中科

龙芯中科主要产品与服务包括处理器及配套芯片产品与基础软硬件解决方案业务。公司基于信息系统和工控系统两条主线,秉承独立自主和开放合作的运营模式,面向网络安全、工控及物联网等领域与合作伙伴保持全面的市场合作,产品广泛应用于电子政务、能源、交通、金融等行业领域,相关软硬件开发人员数万人,已经形成强大的产业链与生态支撑能力。


在通用图形处理器及系统研发方面,龙芯中科于 2017 年开始研发 GPU,已掌握 GPU 研发的关键技术,第一款GPU IP 核已经在龙芯 7A2000 桥片样片中流片成功。


下载链接:
AI算力行业深度:AI模型乘风起,GPU掌舵算力大时代
《70+篇半导体行业“研究框架”合集》
《42份智能网卡和DPU合集》
230份重磅ChatGPT专业报告
GPT4专题:构建模型理解能力,商业落地未来可期
华为昇腾服务器研究框架(2023)
《华为鲲鹏产业链深度研究合集》

推荐阅读:
高性能计算技术、方案和行业全解(第二版)
InfiniBand架构和技术实战总结(第二版)
RDMA原理分析、对比和技术实现解析


或者获取全店资料打包,后续免费获取全店所有新增和更新。

全店铺技术资料打包(全)



转载申明:转载本号文章请注明作者来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。

推荐阅读

更多架构相关技术知识总结请参考“架构师技术全店资料打包汇总(全)(39本全)”相关电子书已经更新至39本,持续更新中。
1、下单“架构师技术全店资料打包汇总(全)”,包含服务器基础知识全解(终极版)pdf及ppt版本,价格仅收239元(原总价399元)。

2、随着电子书数量增加及内容更新,价格会随之增加,所以现在下单最划算,购买后续可享全店内容更新“免费”赠阅。


温馨提示:

扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)电子书资料详情



浏览 6739
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报