突发!英伟达、AMD 恐断供高端 GPU,中国 AI 计算或需另起炉灶
FightingCoder
共 4526字,需浏览 10分钟
· 2022-09-16
“
阅读本文大概需要 8 分钟。
【新智元导读】近日,AMD 和英伟达接到消息,美国政府要求其对中国区断供高端 GPU。
8 月 31 日晚,集微网突然发布消息称,AMD 和英伟达中国区已相继接到总部通知,要对中国区客户断供用于人工智能和数据中心的顶级计算芯片。
AMD 方面:
- 暂停对中国区所有 MI100 和 MI200 发货;
- 统计中国区 Ml100 已发货量;
- 统计中国区 MI200 已发货客户清单和发货明细。
英伟达方面:
- 暂停对中国区所有客户所有代理商的 A100 和 H100 的发货,其它 GPU 卡不受影响;
- 各服务器 OEM 库存的 A100 可以对各自的行业客户继续交付, 英伟达中国区目前没有对 OEM 发任何 Letter。
目前,英伟达 H100 在今年 GTC 大会上刚刚发布还未出货。但已经出货 2 年的 A100 在最新 MLPerf 中,打破 16 项性能记录领跑。
可见,仅英伟达这两款高端 GPU 的断供,直接打击了智能计算以及 AI 大模型的训练。
截至发稿前,AMD 和英伟达都未予置评。
美国再次加大力度!
遗憾的是,这个消息似乎并不是空穴来风。
根据英伟达向美国证券交易委员会提交的一份文件,美国政府已于 8 月 26 日对英伟达下发了通知,对现有的 A100 和即将推出的 H100 提出了新的出口管制许可,并立即生效。
此外,DGX 或任何其他采用 A100 或 H100 和 A100X 的系统,以及未来任何能够在峰值性能和 I/O 性能达到或高于 A100 的,都在新的许可证要求范围之内。
文件显示,该禁令针对的地区为中国大陆、中国香港和俄罗斯。 不过,英伟达在俄罗斯并没有付费客户。
英伟达表示,此举可能会影响到 H100 的开发,以及支持 A100 现有客户的能力,并可能进一步要求公司将某些业务从中国转移出去。
2022CTC大会H100发布
目前,英伟达正与美国政府接触,试图为公司的内部开发和支持活动寻求豁免。
英伟达发言人也表示,「我们正在与中国客户商讨对策,以满足他们计划或未来购买替代产品的需求。如果客户需要的替代产品不足,我们会为客户寻求豁免或许可证,但不能保证美国政府会批准,或及时回应。」
受该禁令的影响,英伟达股价开盘后下跌近 6.6%。
在 8 月 24 日英伟达曾预计,第三财季销售额约为 59 亿美元,然而禁令一出,英伟达第三季度在中国的潜在销售额可能会损失 4 亿美元,如果客户不想购买替(旧)代(的)产品,而美国政府不及时或拒绝向重要客户发放许可证的话。
此外,据 AMD 的一位发言人称,美国政府也已经通知他们说要停止向中国出口顶级的人工智能芯片。
AMD 表示,新的许可要求将阻止 MI250 芯片运往中国,但 MI100 芯片应该不会受到影响。
AMD 认为,新规并不会对其业务产生实质性影响。但股价仍在开盘后下跌了。
对国内影响有多大?
近年来,美国不仅针对中国不断地加强芯片的出口限制,并且还试图将制造业带回本土。
拜登已经正式签署《芯片与科学法案》,美国商务部向中国断供了可用于 14nm 以下先进制程芯片制造的设备,实施了对 EDA 软件工具的出口管制,且美国正在促成与其他国家的结盟。
而美国此次对英伟达和 AMD 实施芯片的出口禁令,除了阻碍英伟达在中国高达 4 亿美元的业务以外,还会影响国内 AI 领域的研究。
不过目前来看,对消费电子领域的影响并不严重。除了这两家的芯片,还有像高通、联发科、三星等芯片可用。
智能计算
但是,大多数国内服务器离不开这两家都芯片。显然,美国的这番断供就是冲着算力去的,目的就是阻碍中国在人工智能领域领先世界。
建设强大的智算中心就需要高端 GPU,如果没有智算,智慧交通、智慧城市、工业互联等众多领域都会受到影响。
因此,芯片断供将会直接影响国内的云计算产业及人工智能产业的发展。
根据 6 月份最新全球超算 TOP500 榜单,排在前十的超算中基本上都用到了 AMD、英伟达、英特尔的处理器或技术。
其中,中国神威·太湖之光超级计算机用的是我们自主研发的神威 26010 众核处理器。天河二号超级计算机则是使用基于英特尔集成众核架构的 Xeon Phi 31S1P 协处理器。
因此,断供 AMD 和英伟达对我国最有影响力的两大超算并未造成影响。
然而,对于国内提供服务器的企业来讲,就不那么幸运了。 服务器都是企业用得多,比如数据中心、云计算。
目前,国内像阿里等公司都在开始自研云原生处理器,这是值得肯定的。
元宇宙
要知道,GPU 是元宇宙核心计算资源的底座。未来,元宇宙市场规模或超 4700 亿美元。
元宇宙中有大量的程序需要计算,构成元宇宙的虚拟内容、区块链网络、人工智能技术都离不开算力的支撑。
没有强大的算力支撑,元宇宙就如同空中楼阁。
因此,元宇宙中更加真实的建模与交互需要更强的算力作为前提,更加说明我们自研 GPU 的重要性。
AI 大模型
另外,如果没有英伟达和 AMD 等公司的芯片,国内在图像、语音识别以及其他机器学习方面的任务也将受到严重的影响。
2020 年大火的 GPT-3 参数规模达到 1750 亿,而且,其训练数据集规模也超过 500GB。
训练这么大的 AI 模型,必然会吃很大的算力,仅 GPT-3 就消耗了 10000 块 GPU,花了 30 天才完成。
那么,断供高端 GPU 将如何影响国内 AI 模型的训练呢?
拿英伟达 A100 来举例,它的深度学习性能在 2021 年的实测中可达 V100 的 3.5 倍。而在最新的 AI 芯片跑分大赛结果中,A100 打破了 16 项性能纪录。
相比于「只有」540 亿个晶体管的前辈 A100,英伟达在 H100 中装入了 800 亿个晶体管,并采用了定制的台积电 4nm 工艺。
在算力上,H100 的 FP16、TF32 以及 FP64 的性能都是 A100 的 3 倍,分别为 2000 TFLOPS、1000 TFLOPS 和 60 TFLOPS。此外,H100 还增加了对 FP8 的支持,算力高达 4000 TFLOPS,比 A100 快 6 倍。
在 AI 训练中,如果采用 H100 来训练 GPT-3 的话,就可以将速度提升 6.3 倍,如果结合新的精度、芯片互联技术和软件,则可以提升至 9 倍。
此外,在新的 Hopper 架构加持下,大型模型的训练可以在数天甚至数小时内完成。
其中,Transformer Engine 可以用 2 倍于 FP16 的速度打包和处理 FP8 数据,于是模型的每一层可以用 FP8 处理的数据都可以提升 2 倍的速度。
如果美国真的对高端 GPU 断供,国产 GPU 是否有可行的替代方案呢?
国产 GPU 准备好了吗?
「芯智讯」在一篇较为详尽的总结中表示,从整体来看,目前国产 GPU 仍处在一个发展的初期。
在图形显卡领域,只有景嘉微取得了一些成绩,但与英伟达和 AMD 还有较大的差距。
而对于此次断供影响到的高性能计算领域,文章分析称,仅天数智芯、壁仞科技和芯动科技有推出相应的产品。
其中,根据壁仞科技官方公布的数据,BR100 在 AI 算力方面已经超过了英伟达的 A100。不过,由于该产品才刚刚推出,所以仍需要市场来检验。
一直以来美国对国内不断打压,国产 GPU 厂商也在加速自身研发,就是为了在紧要关头能够实现自给自足。
现在,这条自研路仍任重道远。
参考资料: https://mp.weixin.qq.com/s/V7X2gRVZchHVg9WTrI_P-g https://laoyaoba.com/n/831077 https://www.reuters.com/technology/nvidia-says-us-has-imposed-new-license-requirement-future-exports-china-2022-08-31/ https://www.reuters.com/technology/amd-says-us-told-it-stop-shipping-top-ai-chip-china-2022-08-31/
End
崔庆才的新书《Python3网络爬虫开发实战(第二版)》已经正式上市了!书中详细介绍了零基础用 Python 开发爬虫的各方面知识,同时相比第一版新增了 JavaScript 逆向、Android 逆向、异步爬虫、深度学习、Kubernetes 相关内容,同时本书已经获得 Python 之父 Guido 的推荐,目前本书正在七折促销中!
内容介绍:《Python3网络爬虫开发实战(第二版)》内容介绍
扫码购买
评论
科普:深度学习训练,不同预算GPU选购指南
以下文章来源于微信公众号:DeepHub IMBA作者:Mike Clayton本文仅用于学术分享,如有侵权,请联系后台作删文处理导读购买显卡第一个要考虑的问题是什么?当然是预算。本文提供了不同预算的显卡选购指南,希望能对各位读者有所帮助。在进行机器学习项目时,特别是在处理深度学习和神经网络时,最好
机器学习初学者
0
如何计算数据中心的冷却需求?
今日分享 【导读】数据中心的冷却要求受多种因素影响,包括设备的热量输出、占地面积、设施设计和电气系统功率额定值等等……众所周知,环境因素会严重影响数据中心设备。过多的热量积聚会损坏服务器,可能导致其自动关闭。经常在高于可接受的温度下运行服务器会缩短其使用
数据中心运维管理
0
聊一聊我最常关注的9个计算机视觉、自动驾驶、AI方向高质量圈子
随着计算机视觉(2D/3D)、SLAM、自动驾驶、AI技术的快速迭代更新,可落地的技术也成为人们争先学习的重点。这使得从业者对于最前沿技术的获取能力变得至关重要。微信公众号便是一个非常有效的前沿信息分享平台。这里给大家推荐9个最常打开的计算机视觉、自动驾驶、SLAM、机器学习和AI方向的优质公众号平
机器学习初学者
0
突发!特斯拉大裁员,毁约应届生offer!
4月24日消息,特斯拉公司近期在全球范围内进行裁员,同时取消了许多应届毕业生的工作邀约(Offer),这一行为引起了广泛的讨论和关注。有不少网友在社交平台发帖称“特斯拉毁约应届生”,还有网友表示:还没上班就被公司单方面违约,感谢特斯拉让应届大学生真正做到了毕业即失业……还有网友发帖求职,在春招都快结
码农突围
0
2024中国ESG传播趋势白皮书
下载报告去公众号:硬核刘大 后台回复“ ESG”,即可下载完整PDF文件。更多报告内容,可加微信:chanpin628 领取。(ps:加过微信:yw5201a1 的不要再加,分享的内容一样,有一个号就行。)申明:报告版权 SCA传媒 独家
产品刘
0
互联网晚报 | 大麦网已退款凤凰传奇演唱会“柱子票”;钟薛高再成被执行人;iPhone 16或取消实体音量键和电源键
大麦网回应凤凰传奇演唱会买到“柱子票”:已退票退款据报道,凤凰传奇2024巡回演唱会常州站演出结束的第二天,有网友称自己在大麦网买到“柱子票”,因为观看效果不佳,要求退款被拒。23日,记者从涉事网友处了解到,大麦方面给出了退款建议,但被其拒绝,“我希望平台退款加赔偿,并重视屡次出现的‘柱子票’问题。
产品刘
0
AI论文写作工具和生成器(一)
随着人工智能和大模型的迅猛发展,AI对研究人员和学生提供了极大的写作便利。本文将介绍市面上常用的AI论文写作工具,帮助你提高论文写作效率并遵循学术道德。请仅将AI论文生成器视为辅助参考手段,切勿直接挪用全文。XPaper AlXPaper AI是由点击式创作工具晓语台推出的一款论文写作生成平台,只需
IQ前端
0
奇域AI,最懂新中式美学的AI绘画神器
「奇域AI」是一款非常适合驾驭新中式审美的AI绘画工具。作为国内首个主打新中式插画的AI绘画产品,它提供了上百种新中式美学风格模型,包括新中式插画、笔墨水彩、新铅油画等,为用户提供了丰富的选择。这款工具在「网页版」和「小程序」上都可以使用,只需输入你想要的画面,就能生成出符合新中式审美的作品。奇域A
IQ前端
0