阿里巴巴达摩院三周年,立的 flag 有没有被打脸?
共 5605字,需浏览 12分钟
·
2021-02-27 11:33
不点蓝字,我们哪来故事?
作为阿里巴巴打响基础科研和硬科技发展的技术研究院,号称3年投入千亿人民币,发力硬核基础科技,于是从创办至今始终备受关注。
所以如今三年已过,超千亿的资金已投,达摩院当初旗帜鲜明立下的几大Flag:
“服务全世界至少20亿人口。”
“必须面向未来、用科技解决未来的问题。”
“活得要比阿里长。”
……
都实现了吗?
达摩院的三周年
达摩院于2017年云栖大会落子,志在打造新型研发机构。
但熟悉阿里发展史的人都知道,技术研究院的执念,其实在阿里存在已久。
早在2008 年,阿里就开始考虑阿里技术的独立研发问题,希望建设一所技术研究院,并因此请来了时任微软亚洲研究院常务副院长的王坚,后来的故事变成无心插柳:
技术研究院没做起来,却做成了阿里云。
不过,基于阿里云,以云计算为起点,阿里技术逐步产生了向底层算力、中台算法、上层技术产品延伸的需求。
对整个阿里集团而言,技术与业务的互动关系也动态调整,从早期的“业务驱动技术”,发展到“技术驱动业务”。
紧接着2014年9月阿里集团纽交所上市后,另一个“技术驱动业务”的新研发机构,紧锣密鼓建立。
iDST,institute of Data Science & Technologies,这就是达摩院的前身。
在IDST时期,就已经有不少学界的科学家前往阿里,比如现在的阿里巴巴达摩院机器智能实验室负责人金榕。
iDST创始人之一,在加入阿里前曾任美国密歇根州立大学终身教授,曾任NIPS、SIGIR等顶级国际会议领域主席及KDD、AAAI、IJCAI等顶级会议高级程序委员会委员。
不过没想到,他们一来阿里,就经历了从天上掉到地上的落差。
按照内部的说法,就是他们被“上山下乡”了——从研究前沿理论到被打散到业务部门去了解“粮食是怎么生产的”,去探索如何解决现实、接地气的问题。
三年之后,这群早期的科学家再次星聚,成立了阿里达摩院。
由于这段前奏历史,达摩院的基因,也从第一天开始就与其他研究机构和企业研究院不同。
达摩院,宗旨就展现出研究院前所未有的接地气。
以解决社会问题为导向、以市场需求为导向,立足基础科学、创新性技术和应用技术,用技术创新推动产业创新,培养科研-产业双栖人才,探索建立“科研-工程-产业”的产学研一体化体系。
并进一步有了长-中-短期结合的分层技术布局。
打造前沿技术有布局(如量子)、核心技术能突破(如AI、芯片)、关键技术可应用(如数据库)的架构,针对不同层次技术制定不同的目标、考核周期和激励机制。
至于今,达摩院设立了“4+X”的研究领域,即机器智能、数据计算、机器人、金融科技,和X的研究方向,并分别于2018年、2020年孵化出平头哥半导体、小蛮驴两个科技公司
目前,达摩院共有14个实验室。
而在杭州、北京、上海、新加坡、以色列、西雅图、硅谷等全球8个地区设立了研究中心。
从内部看,全职研究人员中,平均年龄32岁、90后占比34%,有知名高校教授30多人、IEEE Fellow 级别科学家10多人。
从外部声势而言,达摩院也正在成为阿里吸引全球顶尖科学家和技术大牛的最强技术品牌。
所以这样的团队,3年来都做了什么?
达摩院交出的成绩单
按结果归类,达摩院的三年成绩单可以划分为这三个维度:
基础科研,产业应用、民生相关。
先看基础科研。
对内,达摩院先后在国际顶级技术赛事上获得了60多项世界第一,发表了100多篇国际顶会论文。
对外,发起了多项基础科研为主题的社会活动,尤其是针对青年人才的比赛、奖项。
比如,面向全球数学爱好者的公益赛事“阿里巴巴全球数学竞赛”,两届赛事吸引了全球近10万人次参加。
再比如,设立针对35岁及以中国青年科学家的奖项——青橙奖,如今已经举办了三届,共有29位青年科学家获得100万奖金。
此外,还有核心基础技术突破。
比如超大规模图计算系统Graphscope,量子电路模拟器“太章2.0”,新型存算一体架构……
以量子实验室为例。
“太章2.0”是达摩院量子实验室开源的首个大规模量子开发平台(ACQDP)。
它以分布式张量网络收缩算法库作为计算引擎,可以实现大规模的量子电路模拟,帮助大规模的量子计算机、量子硬件的研发。
2020年年初,太章2.0还模拟了谷歌宣称实现“量子优越性”的量子电路,整个任务压缩到20天完成,比之前的方案改进了4个数量级。
这一成果也纷纷被社会各界点赞。
这只是开始。当前,达摩院团队进一步展开了超导量子硬件项目的建设。
量子实验室负责人施尧耘透露,下一步突破点,就在量子硬件项目。
但与传统的IBM、谷歌聚焦于比特数不同的是,他们首要做的是高精度。
我们既要做很多比特,但是也要做很好的比特,这其实是非常重要的。
而好的比特,就需要高的精度,即便是两个比特,实现99.9%的精度,目前没有人做到。
达摩院团队,希望加速带来这种前沿基础上的关键突破。
第二,产业应用。
对于公众而言,达摩院这三年里,印象最深刻的产业产出,莫过于平头哥和小蛮驴。
平头哥,立足集成电路创新,真正够硬够刚,不服就干。
这是达摩院正式孵化出的第一个公司。2018年9月,阿里宣布整合中天微和达摩院成立旗下芯片公司:平头哥半导体。
其后一年不到的时间,以成功实现第一颗芯片流片来交货。
玄铁910和含光800,就是达摩院产业应用中最硬核的成果。
但除了易于被关注到的平头哥半导体,达摩院内部,还有其他切实改变产业,却又不太能轻易感知的项目。
比如达摩院内部的视觉实验室,就已经实现4个业务场景并驱。
视觉实验室负责人徐盈辉介绍,目前实验室在数智电商、数智媒体、数智地球、读光OCR(文本图像理解)等场景进行产业应用。
视觉是一个场景依赖性的技术体系,因为我们感知的是现实的社会、现实的世界。
具体像数字地球这一领域。
遥感AI平台AI EARTH,就是其中一个代表性的平台。
AI Earth利用深度学习、计算机视觉等技术,对卫星影像、无人机影像、实时视频流、气象数据、IoT数据等多源地球观测数据进行融合分析,实现建筑、土地、植被、河流等多种目标信息的智能解译及变化感知。
以单个地级市的物理提取为例,传统人工方式需要数月时间,但AI Earth只需要数分钟即可完成,目标检测准确率可达到95%以上。
在去年7月全国汛情期间,视觉实验室仅用7天的时间研发并上线了SAR雷达影像水体识别算法,处理影像数量要比平时提升5倍。
徐盈辉还举了一个气象的例子。
大气科学是一项历史悠久的专业方向,而传统的气象预测方式,是要靠大规模的气象物理方程计算,但这种方式不能进行短时间的预测。
而徐盈辉团队做的,是进行2-3小时的气象预测,不确定性不会那么强,可以依靠数据驱动来实现。当然,未来实验室还将进一步拓展到中长期的气象预测。
所以无论是平头哥的芯片,视觉实验室的遥感应用,都是达摩院内从“实验室”到产业应用的成果。
从理论到应用。
最后,纵览达摩院这三年,还有民生相关的成果,毕竟从一开始,达摩院就有解决“社会挑战”的雄心。
最具代表性的,就是医疗AI。今年年初疫情爆发,达摩院成为了阿里AI抗疫的代表性标签。
不管是与浙江疾控中心合作的基因检测平台,将疑似病例基因分析时间缩至半小时。
还是率先在各地应用的CT影像系统,在浙江、河南、湖北、上海、广东、江苏等城市及日本、印尼等全球多个国家的600多家医院都有落地。
截至现在,CT影像系统已累计诊断80万临床病例。
还有首款量产物流机器人小蛮驴,希望成为新时代的“赶集”工具,帮助缓解物流现状。
小蛮驴具有类人认知智能,能轻松处理复杂路况,能聪明选择最优路径,遇到紧急情况,大脑应急反应速度是人类的7倍。
不仅低成本、还很可靠,只需4度电就能跑100多公里,每天最多能送500个快递,雷暴闪电、高温雨雪以及车库、隧道等极端环境均不影响其性能。
对于一线物流和快递业态来说,小蛮驴的从无到有,利于进一步改善物流工作环境。
去年双十一前夕,小蛮驴就来到浙江大学,承担浙大菜鸟驿站3万多件包裹的送货上门服务。
所以归结起来,达摩院当初立下的flag中……
服务20亿人、必须面向未来、用科技解决未来的问题……都应该有了阶段性实现。
唯一剩下的,就是活得比阿里巴巴更长了。(手动狗头)
达摩院模式
不过问题也来了,三年时间,达摩院可以从无到有产生上述的成果和影响力。
那么达摩院模式,是否可以复制和推而广之?
我们先试着梳理总结下达摩院模式。
三周年之际,该模式或许可以这样总结——
以问题驱动,聚焦一个个关键小问题,最终突破技术边界。
比如量子实验室,终极目标是实现量子计算。
目标大吗?很大,甚至有些不着边际。
具体到如何实现上,他们却是一个很详细、很量化的规划。
比如先实现高精度,再实现多比特,100个量级的物理比特,并且都是3个9的高精度。然后做到实用性,比如实现100数量级的逻辑比特,最后到规模化的程度。一步一台阶。
再比如视觉实验室负责人徐盈辉,想要打造一个视觉AI native的产品体系。
将这一目标拆分成两个方面来思考。
一是新甲方。寻找具备颠覆性视觉AI技术的赛道去做,能够打造代差式的技术领先性。
另一个是大乙方。健全和完善大乙方技术体系,也就是一些视觉领域所必备的基础能力。
也就是要做到什么样的设备你都能用,什么样的困难的场景你都能用,什么样新建的场景能快速适配,这个就是我们追求的。
那么可以适当总结下达摩院的特点。
首先,达摩院的理论研究与学术界不同,更务实,更看重与产业的结合
其次,达摩院也不纯服务于企业具体业务,不是技术部门的支持,它又没那么实。
达摩院展现出的的研究模式是——基础研究和工程研发并行的发展。
即技术与产品、业务共舞。
因此,达摩院科学家不再局限于解决单纯的学术科学研究问题,他们还需要思考如何满足工程实践上的需求,例如,达摩院科学家需要深入一线,到一线技术部门去了解行业及用户需求,而不仅仅是发论文。
达摩院机器智能实验室语言技术实验负责人司罗就曾表示,
“此前在学校主要是跟学生打交道,处理一些相对学术性的研究工作;现在在企业界可以跟更多非常优秀的同事交流,有机会跟更大的、更强的技术团队去合作。”
从当前结果来归纳,达摩院模式,至少有三大创新机制。
第一,导向:以需求和问题为科研导向。
需求导向是达摩院区别于一般研究院的最大特点。达摩院内部始终强调的是,好的技术应当具备应用落地前景、应当切实解决现实问题,并以足够低廉的成本普惠大众,因而达摩院坚持以解决社会问题和市场需求为导向,从需求倒推技术研发和技术创新。
第二,机制:研发-应用双循环。
一方面,面向业务/市场需求设立研发项目,以研发驱动业务,帮助业务/市场提质增效。
另一方面,以业务验证研发成果,让科研成果在业务和应用场景中快速落地、经受检验并复制推广。
“研发—应用”双向循环模式的优势在于,可以减少从研发到应用的中间环节,缩短科研成果转化链条、提升科研成果转化效率。
基于这一模式研发的达摩院城市大脑相关技术,不仅在车辆检测、深度学习等技术领域取得多项世界第一,还快速在全球数十个城市落地应用。
第三,组织设计:技术-业务双肩挑。
达摩院实验室的负责人需要技术-业务双肩挑,确保技术和业务的无缝衔接、双轮驱动。
一方面,在业务和场景中发现问题、定义问题,基于问题开展前沿探索和技术创新。
另一方面,将前沿技术快速应用化、产品化,沉淀形成可交付的产品/系统,通过业务系统完成技术验证。
而最终,在这套机制下,达摩院已在基础科研(量子计算、新型计算架构)、行业技术(芯片设计、自动驾驶)、产业应用(医疗/交通/教育)等维度实现突破。
另外,面对突发疫情,达摩院还能做到最快的技术动员,把最前沿的医疗AI、智能外呼、机器翻译技术用到救援一线,为防控疫情贡献技术力量。
所以总体来说,达摩院似乎找到了一条企业研究院的长久发展之路。
达摩院院长张建锋在创立时曾说,
在金庸小说中,达摩院代表最高武学机构,我们希望达摩院真正做到‘侠之大者、利国利民’。
我们也期望,下一个类似电和计算机的颠覆性技术创新,诞生在达摩院。
毫无疑问,科技是第一生产力,但科技的发展最关键的还是人才,过程中还要兼顾平衡科研项目和产业落地。
纯追求科研项目,最后的结果可能就是不接地气,找不到可持续发展的商业模式。
纯追求产业落地,就无法真正实现对未知之境的探索,失去创新的锐气和勇气。
于是如何平衡二者,如何可持续发展,才是新型研究机构的最难挑战。
科技史上,因为无法平衡科研和产业落地,最后无奈跌落神坛的明星实验室、项目比比皆是。
最近一则最令人感慨的案例,来自谷歌X实验室的Project Loon项目。
这是一个利用大气球,为全球——特别是基建欠发达地区解决上网问题的项目,其志远大,其利深远,更何况还是谷歌出品,可以一直不考虑回报。
但最终,该项目还是以找不到可持续的商业模式而关停了,令人不甚唏嘘。
而回到问题探讨本身,如今随着新一轮技术创新周期到来,中国众多在互联网和移动互联网中攒下“家业”的企业,也开始更加重视基础研发,建立研究院,展开更深层次的技术突破。
阿里达摩院,作为其中龙头代表,现在用三年时间,树立了一种新范式。
达摩院范式,能复制吗?
往期推荐
下方二维码关注我
技术草根,坚持分享 编程,算法,架构