「2020中国AI算力报告」重磅出炉:中国怎么解决GPT-3的算力难题?
共 3377字,需浏览 7分钟
·
2020-12-21 10:08
新智元报道
新智元报道
来源:IDC
编辑:小匀
【新智元导读】2020就快划上句号!12月15日,IDC与浪潮联合发布了《2020-2021中国人工智能计算力发展评估报告》。报告从AI算力产业发展趋势、市场规模、区域算力分布和行业AI算力保有程度等多个角度进行全面综合评估,旨在评估中国人工智能发展的现状,为推动产业AI化发展提供极具价值的参考依据和行动建议。这是该报告自2018年发布以来,连续第三年发布。
如果要评选AI圈儿的年度关键词,GPT-3绝对榜上有名。
1750亿个参数,比2019年发布的谷歌T5还翻了16倍,解锁各项技能,和人类对话,无所不能。GPT-3正是AI崛起,突飞猛进的最佳例证。
然而,为了训练它,Open AI可是花费了460万美元。如果不是以API的方式开放给普通用户使用,这个NLP神器可不是大家都能玩的起的。
而且,随着模型参数和训练数据越来越大,若算力跟不上,GPT-3根本「跑」不起来。
我们可以用petaflops/s-day这个单位来衡量算力,可以玩「变脸」的生成对抗网络(GAN)大概需要3petaflop,目前全球第一快的超级计算机日本的富岳Fugaku ,每秒550petaflop;而GPT-3计算需求居然达到了3640petaflop。
算力,也就是数据的处理能力,与数据、算法,并称为AI三要素。从GPT-3中可以见得,如果没有强大的处理能力,模型的规模再大、再全面,也是纸上谈兵。可以说,算力已经成为制约AI产业化发展的关键因素。
12月15日,权威分析机构IDC与浪潮联合发布《2020-2021中国人工智能计算力发展评估报告》(以下简称《报告》)。
报告从AI算力产业发展趋势、市场规模、区域算力分布和行业AI算力保有程度等多个角度进行全面综合评估,旨在评估中国人工智能发展的现状,为产业AI化提供极具价值的参考依据和行动建议。
此报告也是自2018年起连续第三年发布,已经逐渐成为AI领域内许多用户、企业,甚至地方政府的权威参考。
逆势强增长:37%持续增长,北京仍居中国AI城市首位
2020年,在数据大爆炸和算力、算法的极大提升下,中国AI资源迎来了爆发式的增长。
《报告》显示,人工智能是全球IT产业发展最快的新兴技术应用之一。
先来看一组数据,2020年,整个中国的人工智能市场规模是63亿美元,据IDC预测,到2024年,这个数字将会达到172.2亿美元。而且,虽然今年受到疫情影响,但中国AI整体市场仍然保持着37%的增长。
这个增长率有多惊人?
相比之下,2020年美国整个IT的支出同比在下降,整个AI算力等方面的支出基本和去年持平,没有显著增长,相对来说,中国增速37%属于「逆境中生长」。与此同时,中国在全球AI市场的占比将从2020年的12.5%上升到2024年的15.6%。
全球来看,中国人工智能市场正处于稳步上升的状态,而且会在世界AI市场占有越来越重要的地位。
而在中国AI城市之间,排名较过去两年有了显著的变化。
根据《报告》,2020年AI城市TOP5依次为北京、深圳、杭州、上海、重庆。
对比2018年,北京凭借百度,头条等互联网公司以及国家对AI的扶植,仍然保持在第一位。值得关注的是,与2019年相比,深圳超过杭州位居第二,而重庆也首次进入第一梯队,西安超过南京位居第九。
IDC预测,到2021年,各地方政府将会加大对AI产业的投资30%以上。各个城市在自身产业优势及各种因素推动下,AI应用取得了较大进展。例如东莞的智能制造、武汉的智慧医疗、合肥的智慧农业、重庆的人工智能课程等。
中国人工智能城市正利用自己的差异化优势,为产业发展树立标杆。
2020就快句号,未来的AI圈儿怎么走出感叹号
未来人工智能算力发展的大方向是怎样的?《报告》给出来了几点重要趋势:
首先,技术层面。
人工智能芯片将继续呈现多样性的发展,GPU依然是数据中心加速的首选,占有95%以上的市场份额;中国人工智能服务器将在未来五年保持高速增长,是整体服务器市场增长的核心驱动力;
提到算力时候大家常会提到是芯片,而算力的载体服务器也是近些年不得忽视的因素。前些年,深度学习之前发展缓慢,除了算法的原因外,很重要的一个原因是算力的不足,而解决计算力最重要的支撑是AI服务器。
在这里,国内头部AI服务器厂商浪潮有着清晰的定位。多年来,浪潮一直专攻计算系统,打造了业内最强最全的AI服务器产品阵列。作为系统提供商,浪潮积极推动开放生态建设,AI服务器适配了寒武纪、燧原科技、英特尔等芯片产品,促进AI计算产业的协作共赢。
其次,是架构层面的趋势。
AloT时代,日益增长的业务实时性需求使边缘和端侧的计算能力变得越来越重要,人工智能算力会逐渐向边缘渗透,到2023年,将近20%用于处理AI工作负载的服务器将部署在边缘侧。
浪潮信息副总裁、浪潮AI&HPC产品线总经理刘军表示,「现在的边缘端大家做了一些部署的尝试,做一些样板,场景怎么打通,要更进一步让边缘进入批量化,大规模上业务,我们还是要解决额定功耗条件下尽可能去提升算力的核心问题。」
浪潮信息副总裁、浪潮AI&HPC产品线总经理刘军
另外,AIaaS也会成为人工智能市场发展的重要驱动力,《报告》预测,其2018至2024年的年复合增长率预计将达到93.6%,同时,AI基准测试也会逐步完善,MLperf、SPEC ML、AI-Rank等权威基准测试陆续推出,不仅仅为企业的成本效益提供参考,也对人工智能应用未来可持续发展具有重要意义 。
「未来对AI算力要求以后只会越来越大,五年后,所有计算力都将是AI计算力,所有服务器也都是AI服务器。」
比尔盖茨曾说过,微软的使命是让每个家庭拥有一台PC;未来,浪潮也许可以让每个企业像用水用电一样使用算力。
算力就是生产力,得算力者得「天下」
「让算力变成生产力,我们是叫数据进去,AI出来。」
疫情期间,AI经济以前所未有的方式爆发了。
《报告》显示,2020年,人工智能行业应用渗透度排名TOP5 的行业依次为互联网、政府、金融、电信和制造。同2019年相比,2020年互联网行业仍然保持第一,而电信和制造行业的应用场景更加丰富,市场潜力预计将有较大的提升,但在疫情的影响下,医疗行业人工智能的应用渗透度超过教育行业位列第七。
在这样的成果背后,海量的数据功不可没,它是大量模型训练的基础。据 Open AI 的一份报告显示,从 2012 到 2019 年,人工智能训练集增长将近 30 万倍,每 3.43 个月翻一番,比摩尔定律快 25000 倍。
但是,如果没有足够的算力支撑,就会有大把的数据被浪费掉,算法也不能进入到AI产业的生产力阶段。
为什么人工智能对算力的需求如此之高?
一方面,随着AI应用成熟度的提升,从通用场景走向细分,人工智能面临着识别度不高、准确度不高等关键问题。
根据《报告》,除了人工智能投入相对集中的行业之外,在业务需求的推动下,很多碎片化应用也开始被广泛使用,并辐射到媒体娱乐、现代农业、智能家居、智慧电力等多个不同领域。
另一方面,IDC认为,未来三年,用户的算力还是集中在两个方面:训练和推理,其中,训练仍然是未来投资的主要方向,并且这个方向已经从纯感知的训练,图像识别,视频识别,语音识别,转向了对语意理解,纯感知到感知以后的推理分析。
对于自动驾驶、机器人、内容推荐等综合场景的算力需求也相对较高,平均算力值将达到146P OPS左右。
这些都对算力提出了更高的要求,而算力也已成为制约AI产业化进一步发展的关键。
在2020年4月,浪潮曾提出「智算中心」,即「智能计算中心」。今年4月,以智能计算中心为代表的算力基础设施首次被国家发改委明确新型基础设施的范围。
如果智能计算中心成为全行业的算力提供者,以中国AI市场的规模,类似GPT-3、谷歌T4的超大AI模型的出现将被提上日程,届时,我们就会真正感受到「算力改变中国,算力驱动未来,算力是生产力」。
而那时,算力时代也将真正到来。