华为智能化战略,国产AI基础设施突破

共 3013字,需浏览 7分钟

 ·

2023-11-07 11:12

华为在计算、网络、存储等领域的综合优势明显,从器件级、节点级、集群级和业务级全面提升系统可靠性,将大模型训练稳定性从天级提升到月级。

下载链接:
华为全面智能化战略,国产AI基础设施曙光初现
《华为:迈向智能世界白皮书2023版(合集)》
1、迈向智能世界白皮书2023版(计算)
2、迈向智能世界白皮书2023版(云计算) 
3、迈向智能世界白皮书2023版(数字金融) 
4、迈向智能世界白皮书2023版(数据通信) 
5、迈向智能世界白皮书2023版(数据存储)

《FMS 2023闪存峰会CXL合集(1)》

《FMS 2023闪存峰会CXL合集(2)》


1.1.算力、运力、存力全方位发展,国产算力瓶颈有望突破

大模型进入万亿参数时代,单体服务器算力有限,需要将大量杰斯安服务器、存储器等通过网络相连,打造大规模算力集群。通过对处理器、网络架构和存储性能的全面优化,为大模型训练提供高性能、高带宽、低延迟的智算能力支撑。

关于算力发展的突破方向,华为改变了传统的服务器堆叠模式,以系统架构创新的思路,着力打造 AI 集群,实现算力、运力、存力的一体化设计,突破算力瓶颈。

1.2.昇腾 AI 计算集群打造超大规模无收敛集群组网

华为昇腾 AI 计算集群采用全新的华为星河 AI 智算交换机 CloudEngine XH16800,借助其高密的800GE端口能力,两层交换网络即可实现2250节点(等效于 18000 张卡)超大规模无收敛集群组网。

算力方面,华为通过架构和系统创新,构筑面向多场景的大算力平台,突破 AI 大模型训练的算力瓶颈。

存力方面,华为发布领先的 AI 知识库存储 OceanStor A800, 以创新架构构建高性能数据存储。

运力方面,华为发布业界首款高运力 DCN 星河 AI 智算交换机,和业界容量最大的超宽全光智能 DCI 方案,以大规模,大容量网络运力释放大算力。

1.3.昇腾芯片+ MindSpore 生态,全球算力第二极

华为深耕 AI 算力,推出了完全自主架构的昇腾 AI 处理器 910 (Ascend 910),Ascend 910 采用华为自研达芬奇架构。

昇腾 910 的半精度 (FP16)算力达到 256 Tera-FLOPS,整数精度(NT8) 算力达到 512 Tera-OPS,且芯片最大功耗仅为 310W,比此前设计规格的 350W 更低。

除了超高的算力之外,昇腾 910 还拥有高集成度和高速互联的特性。它集成了CPU、DVPP 和任务管理器,因此它能独立完成 AI 训练流程。同时昇腾 910 集成了 HCCS、PCIe 和 RoCE 三种高速接口。其中最新的 PCle 吞吐量相比上一代翻了一倍。这些特性共同组成了算力最强的昇腾 910 处理器。

配合昇腾 910,华为采用全栈全场景AI 计算框架 MindSpore,打造昇腾 AI 基础软硬件平台, 携手伙伴共建昇腾 AI 计算产业。

1)硬件方面,华为采用自有硬件+硬件生态伙伴方式,为终端客户提供多样化算力选择。

2)软件方面,开发、销售自有知识产权的应用程序、软件、垂直细分应用等产品,能对接昇腾产品,有能力二次开发的软件伙伴,相关上市公司包括:智洋创新等。

3)算力生态运营方面,具备区域运营能力,可主导运营指定区域人工智能计算中心、生态创新中心或创新实验室等的合作伙伴。
下载链接:

一周解惑系列:光刻机各环节国产化情况

华为全面智能化战略,国产AI基础设施曙光初现

芯片战争:世界最关键技术的争夺战

光刻机深度:筚路蓝缕,寻光刻星火(2023)

九天人工智能大模型创新实践
联邦学习算力加速方案
400+份重磅ChatGPT专业报告(合集)
隐私计算中的多层次计算技术
端云协同隐私计算系统的设计和落地探索
《大模型和AIGC技术合集(2023.9)》
1、AI大模型落地的前景和痛点,兼谈工程师架构师所面临的机会和挑战 
2、AIGC驱动下高校数字化转型 
3、大模型趋势下的企业数据体系思考 
4、大模型时代下数据中台该何去 
5、大模型重塑软件开发以及实践案例展示 
6、当GPT遇到低代码低代码平台AIGC开发落地实战 
7、迈向通用人工智能时代之路——边缘与管力网络演进及思考 
8、网宿边缘智能平台与AIGC探索
人工智能和虚拟现实将如何改变职场世界
2023年生成式人工智能的突破年
华为昇腾:国产AI算力的扛旗者(2023)
中国联通新一代AI计算基础设施白皮书
《海光CPU+DCU技术研究报告合集(上)》 
《海光CPU+DCU技术研究报告合集(下)》 
龙芯CPU技术研究报告合集
CPU生态、价值与机遇研究(2021)
行业研究:国产6大CPU全对比
CPU研究框架:CPU国产替代成长空间广阔
信创研究专题框架
异构芯片研究框架合集
中国数据处理器行业概览(2021)
DPU在数据中心和边缘云上的应用
英伟达DPU集数据中心于芯片
行业研究:国产6大CPU全对比
龙芯LoongArch指令集全集
RISC-V芯片产业指令集架构研究
服务器研究框架合集
异构芯片研究框架合集
芯片技术设计和应用汇总
CPU和GPU研究框架合集

本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料



免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。

温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。

浏览 475
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报