从Create大会,看AI黄金10年里的百度

雷锋网

共 5022字,需浏览 11分钟

 ·

2021-12-30 16:51

AI全面爆发,人机共生时代到来。 

作者 | 李溪

编辑 | 余快

作为科技顶会,百度AI开发者大会,这次有些不一样:

取消线下会场,全程线上直播。

乍一看,似乎并无新奇,毕竟直播已经“飞入寻常百姓家”,普通人一台手机、一个APP就能实现。

但,如果要实现让参会者感受到在万人会场中央身临其境的效果,又或者,一张图片、一句话就能生成虚拟形象呢?

显然,这样的“直播”,与普通公众理解的直播,有着本质的区别。

外行看热闹,内行看门道。

公众可能震惊于现场效果,但开发者们看到的,是更为真实的与会体验背后强大的空间声场重建、AI声学建模等技术,是更为真实的交互场景背后领先的视觉、语音、自然语言理解等能力。

它实际上实现超大型露天复杂开放会场的舞台中央演讲者声场重建,10万人级别实景观众声音的实时背景音还原,以及通过3D音效技术打造的覆盖周围环绕用户拟真效果的沉浸式交流空间音效。

它结合了增强现实、知识图谱、语音识别、自然语言处理和图像识别等技术,以及海量的人物知识数据,实现了多模态的技术融合。

作为这次线上大会的“主播”,百度再一次刷新了人们对技术的认知。

这个不折不扣的技术信徒,也许能让我们窥见未来科技的真实模样。  

1


在中国,你将见证AI的黄金10年

近几年,祛魅后的AI,走向了“被平庸化”的极端。AI的时代过去了吗?

也许事实恰恰相反——属于AI的时代现在才真正到来。

纵观前三次工业革命,各自的标志是:蒸汽机的广泛使用、电力和内燃机地广泛应用、信息技术的广泛应用。由此使得机器取代体力,社会生产力得到极大的提升。

注意一个关键词:取代。何为取代?用某一件事物代替另一件事物。

要实现这一点,离不开“广泛地、大规模地”应用。

如今第四次工业革命,要促进机器取代脑力,实现真正的智能化,需要全社会、全行业的应用落地。

其实从互联网巨头纷纷开始“养猪”起,AI就开始“不对劲”了。

AI开始在交通、政务、电力、教育、工厂、医疗、金融、文旅、城管、钢铁、港口、水务、农业、边海防等领域全面开花。

人工智能之所以不再“性感”,不能带给人们更多多巴胺,是因为它不再是镜中月、水中花,已经无孔不入地进入人类的方方面面了。

根据Gartner模型五阶段,如今的AI,已经走过从无到有、造神阶段、落地拮据的三个阶段,眼下正处于低谷期向爬升期迈进的途中。

AI在政策层面的高度,可以从十四五规划的科技前沿领域攻关中,“新一代人工智能”排在了第一位中得见。

毫不夸张地说,在中国,如果说过去是AI技术兴起的10年,未来是AI落地的10年。

跨进黄金10年,其实需要“AI工具箱”,有了它,万千创造者才能化身“披荆斩棘的哥哥”和“乘风破浪的姐姐”。

百度想成为,也能够成为那个“造箱子的人”。

打造AI底座扉页上,赫然写着不可逾越的硬指标:算力(算力设施)、算法(训练框架)、数据(知识)。

先看知识。

AI要大规模落地,要有算力设施和训练框架做根基,行业知识做内涵。

工业时代是力量的比拼,智能时代是知识的比拼。

工业时代的核心是力量,是大规模的机械与能源应用,互联网时代的核心是信息交流,大规模的信息流通,而智能时代,核心是知识。

比如识别天气,需要了解不同类别的云,生成原理,演变过程,还需要模拟测试环境和测试集;再比如识别猪,需要了解猪的全生长周期,每个周期具体情况。

传统大模型只从海量的文本中学习,只能死记硬背海量文本的规律,这些模型并不能从本质上理解世界是怎样运行的,只可以解决一些文本表象上的问题。

为了跨过这道坎,更好地理解真实世界的复杂场景,百度很早就开始挖掘知识增强型预训练模型的潜力。

具备知识内涵的大模型,也就具备了更多对现实的先验洞察,自然在学习新事物时会更加的快,也就是小样本能力更强。

2019年发布第一代知识增强的预训练模型 ERNIE1.0,今年7月,训练出了百亿参数规模的知识增强型预训练模型——ERNIE 3.0。这促进了结构化知识和无结构文本之间的信息共享,从而大幅提升模型对于知识的记忆和推理能力。

12月8日,鹏城-百度·文心千亿大模型发布,百度“文心”系列产业级知识增强大模型亮相。在大模型之上,是EasyDL-大模型零门槛AI开发平台和BML-大模型全功能AI开发平台,以及大模型开发工具、大模型轻量化工具和大模型部署工具。

不止于参数,文心大模型带着核心buff来的:知识增强。

知识增强大模型能够同时从大规模知识和海量无结构数据中持续学习,如同站在巨人的肩膀上,训练效率和理解准确率都得到大幅提升,并具备了更好的可解释性。

除了将知识和数据融合学习,百度文心还通过知识增强跨语言学习与知识增强跨模态学习,从多种语言、多种模态数据中学习到统一的语义表示和理解能力,具有很强的通用性。能够有效提升效果、减少应用成本、降低应用门槛,满足真实场景中的应用需求。

百度文心自2019年诞生至今,在语言理解、文本生成、跨模态语义理解等领域取得多项技术突破,在公开权威语义评测中斩获了数十项世界冠军。

基于此,百度文心大模型已广泛应用在金融、医疗、保险、证券、办公、互联网、物流等行业。

再谈训练框架。

百度CTO王海峰曾表示,深度学习框架是“智能时代的操作系统”。 

作为底层语言和算法模型的骨架,深度学习框架省去了开发者从0到1地搭建地基的成本,提高开发效率。

开发人员可以像搭积木一般,根据自身行业的特点和场景需要,选择框架中的模型,进行组装或训练自己的模型,导入数据并得到模型,最终实现部署。

如果说芯片是算力平台,那么深度学习框架就是编程生产力平台,两者已经成为AI基础设施基座。

此前,主流的开源深度学习框架一直由国外科技巨头主导,这让在日渐焦灼的中美关系中,国产开源框架成为一件势在必行的事。

2016年,百度在国外巨头霸屏中正式开源深度学习框架,飞桨成为中国首个自主研发、开源开放、功能完备的产业级深度学习平台。

5年里,飞桨在开发便捷性、超大规模深度学习模型训练技术、多端多平台部署的高性能推理引擎、产业级开源模型库等方面进行多次迭代升级,截至目前,飞桨已汇聚了406万开发者,开发了47.6万个AI模型,服务超15.7万企事业单位,覆盖工业、农业、医疗、城市管理、交通、金融等数十个领域。

如今,飞桨已经成为全球第二的开源深度学习框架,中国第一的学习框架。

AI全面落地的阶段,文心大模型则拉高了AI底座的城墙,飞桨极大降低了算法的门槛,与百度昆仑芯片一起,成为百度大脑AI基础设施坚实臂膀。

2


驶入产业数字化转型深水区

作为智能时代的基础设施,百度智能云在今年上半年稳居“中国科技公司四朵云之一”,并以73%的增速领跑市场。在AI Cloud的细分领域,则连续四年位居第一。

在这结实的AI底座,如同卫星发射基地,正在源源不断地发射产业应用卫星。

最瞩目的要数智能交通。

智能交通,离不开车的智能,离不开路的智能,更离不开车路协同的智能。从车到路到人,百度多年来步步为营。

2017年出生的“Apollo”,即将升级到7.0版本,在这个过程中,Apollo成长为全球最活跃的自动驾驶开放平台,拥有全球生态合作伙伴超过210家,汇聚全球开发者80000 名,开源代码数70万行。

8月公布的自动驾驶出行服务平台“萝卜快跑”,最新的成绩是,一个季度提供了11.5万次服务,这让萝卜快跑成为全球最大的自动驾驶出行服务提供商。

这给了百度喊出其野心底气:到2025年,该服务扩展到65个城市,到2030年扩展到100个城市。

百度这么多年的无人驾驶技术以及智能驾舱技术的市场推广任务,则交给了今年新成立的集度汽车机器人。

这个百度口中“拥有L4级别的自动驾驶能力,人车交互及语音语义的精准识别,可以自我学习和迭代”的未来汽车机器人,预计2-3年内可以和大家见面。

交通的故事多了后,百度不知何时奉上了最新鲜的产业故事。 

今年两会期间,数字经济再次成为举国瞩目的关注焦点,国家提出了在2023年将数字经济核心产业增加值占GDP比重提高到10%的目标。

数字化经济浪潮来临,产业数字化转型是门好生意。在看不见的起跑线上,无数企业穿越层层铁幕,或是战八方,或是在方寸间展开一场场谷脊之战。

百度,就这样一头扎进了产业数字化转型的浪潮里。以云计算和AI的技术实力,百度智能云极尽“云智一体”的优势,脚步遍布工业、能源、智慧城市、农业、城市治理等领域。

走进水务,百度智能云在福建泉州参与打造的“水务大脑”智能化升级城市水务流程,通过AI技术训练的精准调压,智能曝气、智能加药、智能排水等模型,让水务运行更高效。

拐进工业,百度的AI和云计算走进苏州常熟的恺博车间,AI帮助质检工人“听音”、“识图”,提高效率和质量,帮助企业积累和沉淀知识,推动中国制造业实现从“制造”到“智造”。

在“科学之城”北京海淀,从违规停车到井盖缺失,从路面水渍到垃圾乱放,都能智能识别,系统及时监控并通知工作人员处理;

在新疆,百度智能云联合国网电力建设“AI中台”,为疆电外送提供有力支撑,也降低了在条件恶劣环境中的巡检风险。

迁入高危行业,百度在化工行业某石油化工厂,在不增加人力投入前提下,通过提高巡检频次与提前发现,隐患风险能力,降低企业运维成本,实现安全生产。

不仅在城市,百度还走进农业,在中国蔬菜之乡山东寿光,百度智能云打造的寿光大脑,给蔬菜大棚披上AI的衣,2个工作人员加一个APP,就可以管理数十个蔬菜大棚。只要老乡们愿意,他们可以随时随地和小度聊天,学习农艺、病虫害处置防范等农业知识。

这些只是万千产业智能化中一个小小的案例。

百度的云计算和AI就像产业数字化转型升级的水、电,借助中国智能产业化的大趋势在工业、金融、交通、能源、城市、医疗、自动驾驶等领域静静流通。

在这背后,都得益于多年技术积累和产业实践之下的百度大脑,以及其中的飞桨平台、文心大模型、昆仑芯片等的综合之力。进化为AI大生产平台的百度大脑,将以“融合创新、降低门槛”的利器,劈开更多传统产业的外壳。

3


技术信仰的魔力

2010年,智能手机刚刚普及时,AI还未露出真容时,百度就在国内开始AI的技术布局,成立“自然语言处理部门”。

此后十多年,不管是AI市场一拥而入的癫狂,还是AI从高光跌倒谷底的受尽嘲讽,百度对AI保持一如既往的投入和难以相信的定力。

百度创始人、董事长兼CEO李彦宏曾说过:“有1块钱的时候,我们会投进技术里;有1个亿,我们会投进技术里;有100个亿,我们还是会投进技术里。”

近11年来,百度在AI技术上的研发投入早已超过1000亿元。成为人工智能国家队、不断升级的百度大脑、不断扩容的AI生态,不断增加的产业智能化领域,即将量产的智能汽车......都在诉说着这位AI布道者的付出。

或许是技术对百度有一种天然吸引力,或许是刻在文化中的社会责任感,百度不懂得停下脚步,永远在奔向前沿科技的途中。

不间断的疫情、不断变异的病毒,使得疫苗研发与生产极为关键。其中mRNA疫苗是一种可以大规模快速生产的新型疫苗,但设计出稳定的mRNA疫苗序列难度极大,这使得限制了mRNA未能得到大规模应用。百度重投之下,推出业界首个mRNA疫苗序列设计算 法,做到在短短十分钟内找出稳定的疫苗序列。

百度也布局可推动化学、金融、材料等领域应用的量子计算技术,打造出国内提供从应用到量子处理器一站式服务的量子计算云平台,让量子计算学习与应用的门槛再低一点点,就是他们的动力。

百度无形中肩负起“打造出负责任、可持续的AI”的历史责任感,秉持乐观主义与长期主义,他们讨论概念,也致力于将理念应用在实践当中;他们不慕名利,也不惧将自己投入到艰难的未来科技探索中。


END


推荐阅读

辛巴薇娅们那些事儿

2021-12-20

大公司该不该砍掉 IT 部?

2021-12-15

时间的力量——1991 人工智能大辩论 30 周年纪念:主义不再,共融互生|GAIR 2021

2021-12-12

未来已来,元宇宙比你想象中来得更早丨GAIR 2021

2021-12-11

GAIR 2021大会首日:18位Fellow的40年AI岁月,一场技术前沿的传承与激辩

2021-12-10





浏览 49
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报