下载链接:人工智能核心技术产业白皮书(2021)
人工智能本轮爆发初期主要在探讨算法理论的可能性,聚焦探索强化学习、迁移学习等新的学习方式以及 AlexNet、VGG、GooqLeNet等结构多样的算法模型,算法理论的不确定性和技术的不成熟耗费产业界大量精力和时间,阻碍人工智能大规模应用进程。
人工智能企业增速明显放缓,产业生态已现加速构建态势资本寒冬已经出现。2019、2020 年全球每年新增人工智能企业数量已不足 100 家,且投融资的轮次后移趋势不断扩大。
从技术基础理论突破到工程化落地应用,既有技术红利已为产业发展奠定坚实基础。当前,虽然资本市场的泡沫逐步破裂,但优质企业的估值仍在持续增长,独角兽企业不断出现,产业呈现良性发展态势。深度学习技术局限性似乎导致人工智能产业发展将遇天花板,然而事实并非如此。
虽然,可解释性、理解推理等局限性确已显现,但这是下一时期理论技术突破重点,不能因此否定图像识别、语音合成、机器翻译等感知类任务上的应用技术成就和产业应用前景。
目前,基于深度学习理论的优化技术层出不穷,RegNet、GPT-3 等模型不断提升视觉处理、阅读理解等基础智能任务水平,虚拟助手、多语种翻译等智能应用已开始进入规模化应用阶段。
任务场景愈加复杂,倒逼学习方式多元化发展。有监督学习建立在严苛条件之上,已不能完全满足模型学习需求,面对更为复杂的任务场景,业内加速探索强化学习、自监督学习等多元学习方式,试图缩小与通用智能的距离。深度强化学习不断演进,加速提升自主决策能力。深度强化学习加速拓展任务边界,突破性解决多人棋牌、即时战略游戏等多智能体非完全信息博弈任务。目前,OpenAl、谷歌、微软等企业相继攻克即时战略、德州扑克、麻将等复杂游戏,并加速向无人机群体飞行等更为实际的应用场景拓展。另一方面,深度强化学习不断提升处理复杂任务的能力,逐步拓展至芯片设计、音乐编曲等对知识技能要求更高的专业领域。
谷歌、脸书等多家企业先后发布使用自监督学习的算法模型,通过挖掘无标注数据的监督信息,显著减少人为干预,在自然语言理解(NLP)领域取得显著成效,如谷歌 BFRT、脸书 RoBFRTa、OpenAL GPT-3 等。训训练模型参数已至万亿级,训练成本之高几乎成为业内头部玩家的专属技术路径。2020年,OpenAl 发布 GPT-3 模型,模型参数多达 1750 亿个,高达 1200 万美元的训练费用为预训练模型的构建构筑壁垒,中小型人工智能企业难以望其项背。2021年,谷歌发布 Switch Transformer模型,再次将模型参数推至 1.6 万亿新高。此外,微软宣布与 OpenAl 达成合作协议,获得 GPT-3 语言模型源码的独家授权,升级巨型模型的寡头格局形势,预示着未来超大规模预训练模型或将掌握在少数头部企业手中。
预训练模型已进入可直接用于多种自然语言处理任务的"通用"智能阶段。预训练模型再次升级,头部人工智能企业先后发布通用预训练模型,可直接面向多种自然语言处理任务使用,不再需要针对不同任务进行微调。目前,谷歌 T5、OpenAl GPT-3 等通用预训练模型进一步提升文本理解能力,在包含阅读理解、问答等任务的基准测试中接近人类水平。另一方面,通用预训练模型加速步入产业应用阶段, OpenAl 公司发布 GPT-3 商用应用程序接口(API),提供问答、翻译、文本生成等服务,搜索服务提供商 Al golia、社交媒体平台 Reddit等多家企业已开始使用。
模型小型化成为提升模型运行效率的主要方向。开发框架中的模型压缩功能创新活跃,模型压缩已成为开发框架必不可少的关键能力,脸书、腾讯、谷歌等头部人工智能企业以及英伟达、英特尔等芯片大厂加速构建完善模型压缩能力,依托自身算法技术与硬件芯片优势,在其主导的TensorFIow、PyTorch、TensorRT 等开发框架中提供剪枝、量化等算法压缩工具,并针对 GPU、CPU 等硬件芯片进行特定压缩优化。以谷歌 TensorFlow、脸书 PyTorch 等为代表的开源框架格局初显清晰,框架格局已从百花齐放转向几家分争。目前,业界开源开发框架主导权基本被 TensorFlow(谷歌)、PyTorch(脸书)等掌握;微软 CNTK、日本初创企业首选网络(preferred networks)Chainer、加拿大蒙特利尔大学主导的 Theano 等早期热点框架已通过与主流框架合并或直接停止更新的方式退出历史舞台。TensorFIow 依托工业界的部署优势持续位于第一,市场关注度达15万,超过第二名3倍以上,脸书的 PyTorch(合并 Caffe2)凭借其易用性迅速突起,在各大顶级学术会议论文中占比超过 50%,有赶超势头。同时,我国正在快速进行开源开发框架的系统化布局,百度飞桨、旷视 MeqEnqine、华为 MindSpore、清华大学 Jittor 等国产框架加速升级,其中,百度飞桨作为最早推出的开放框架之一,已初步应用于工业、农业、服务业等业务场景,服务 230 余万开发者,整体应用广度和深度正在不断成熟和完善。端侧推理框架遇碎片化挑战。随着各行业终端智能化需求加速增加,算法模型的终端推理性能引起业内重视。目前,推理框架面临碎片化挑战,一方面,计算终端所使用的芯片类型多样,CPU、GPU 虽为主流架构,但 NPU、DSP、FPGA 等多样的人工智能芯片也在不断涌现,终端推理框架对底层硬件的适配难以统一;另一方面,算法架构尚不稳定,算子(卷积、激活函数-ReLU等)及组合方式的多样化和持续演化使得单一的推理框架短时间内难以覆盖所有的可能性,推理框架显现出各为其主的发展格局。技术工具链成为研发平台的竞争核心。目前,研发平台整体呈现三类发展特点∶ 一是工具体系化,打造全面的技术工具链成为了这一时期研发平台的竞争核心,技术工具链提供数据处理、模型构建、部署、监测分析等全生命周期的工具服务,如 SagelMaker Autopilot、谷歌 AutoML、微软 MLOps 等;
二是开放框架开放化,研发平台基本均同时支持 TensorFlow、PyTorch、MXNet 等多个主流框架;
三是分布式计算不断优化,研发平台围绕人工智能技术的特点和开发框架对自身的云计算架构进行深度优化,如 SageMaker 在 256 个 GPU下的TensorFlow扩展效率可达 90%,并同时支持多种类型人工智能芯片。
智能计算已初步形成智能芯片、软硬协同、多样化算力供给模式的产业形态。目前,人工智能芯片架构百花齐放,云侧虽仍以 GPU 为主,但端侧涌现出面向不同场景的芯片架构,英伟达、英特尔等芯片厂商面向人工智能应用的软硬件工具生态日益完善,面向深度学习的大规模分布式计算平台不断成熟,云智能服务、公共智能超算中心、自建数据中心等多种计算供给模式逐步形成。围绕智能计算芯片的软件工具开始从基础计算向场景计算转变。早期,以英伟达为代表的芯片企业不断构建以 CUDA 编程模型为核心的高性能算子库、通信算法、推理加速引擎等多层次基础软件工具生态。当前,随着智能技术在传统行业中渗透的不断深入,头部智能芯片企业开始构建面向差异化场景的软硬一体平台,实现底层芯片、编程框架、行业算法库、细分场景研发平台等全栈高效整合,试图培育多样化行业场景的计算生态、抢占细分市场。例如,2020 年,英伟达围绕机器人和自动驾驶场景,打造 Jarvis 对话系统、ISAAC 机器人等软硬一体计算平台,宝马公司使用英伟达 ISSAC 机器人平台、 Jetson AGX Xavier 芯片平台以及 EGX 边缘计算机等。数据集建设需求更为专业。监督学习仍是产业界人工智能算法训练的主要方式,因此大规模、高质量的人工标注数据集是产业发展刚需。目前,数据标注从简单、重复的拉框标注向精细化方向发展,呈现三类发展特点∶一是数据标注流程趋于智能化,通过预标注技术和半自动化校验的方式辅助人工标注已成为当前发展重点,业内涌现出一批标注工具,可对未标记图像直接生成分割轮廓,并借助人工进行微调;
二是标注数据质量要求不断提升,自动驾驶、工业制造等智能任务场景愈之复杂,高质量、精细化的标注数据直接影响算法鲁棒性和准确性,标注准确率需求从 90%提升至 99%;
三是医疗、工业等差异化垂直应用驱动数据标注服务进一步贴合个性化、多元化的场景需求,如数据服务企业 Scale AI 为自动驾驶场景提供标注服务,对车道、烟尘、尾气、雨水等更为个性化的目标物体进行标注。
产业主体以自身优势切入,初步形成四种小生态模式。一是人工智能全面融入云服务体系,云服务厂商积极构建 Al 基础设施生态。亚马逊、微软、谷歌为代表的厂商布局人工智能专用硬件、开源开发工具、研发平台、技术服务、行业使能方案等全栈 Al 技术支撑体系。
二是人工智能技术服务企业、互联网企业以视觉、语音等技术优势切入,加速打造垂直行业技术服务平台和解决方案生态。
三是传统企业以行业经验切入,强调解决问题的实际应用能力,积极构建围绕基础科研、成果转化、产业培育多维度的创新生态。传统行业头部企业针对颠覆性、前沿性技术展开系统布局,巩固行业领先地位和优势。
四是硬件厂商以芯片设计、整机集成为切入点,加速构建软硬协同产业生态。英伟达、英特尔、华为、浪潮等芯片、设备厂商围绕其芯片和计算设备积极丰富性能库、编译器、编程框架、编程工具等配套软件,通过多样化方式壮大开发者社区及产业合作伙伴规模,力图构建软硬协同的产业生态体系。
本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
电子书<服务器基础知识全解(终极版)>更新完毕,知识点深度讲解,提供182页完整版下载。
获取方式:点击“阅读原文”即可查看PPT可编辑版本和PDF阅读版本详情。
温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。