吴恩达在斯坦福大学 HAI 研讨会上进行内容分享,指出 AI 部署所面临的三大挑战,并给出解决方案。
随着人工智能的不断发展,大量先进算法以及配套硬件设施不断涌现,研究人员凭借新算法等不断刷新 SOTA 记录,但是在科研中、论文中实现的高精度性能,很多却不能应用于实际的生产中。AI 离真正的落地还有多远? 现阶段,许多公司和研究团队正在努力将研究转化为实际的生产部署。近日,机器学习大牛吴恩达在斯坦福大学 HAI 研讨会上分享了一些有趣的观点,即「如何弥补 AI 的概念验证与生产之间的差距」。 HAI(「以人为本」人工智能研究院)成立于 2019 年 3 月,由斯坦福大学人工智能科学家李飞飞和哲学教授约翰 · 埃切曼迪(John Etchemendy)共同领导,致力于推动人工智能领域的跨学科合作,让科技以人为中心,并加强对人工智能社会影响的研究。HAI 定期举办研讨会,此前吴恩达参加研讨会并做了演讲。 AI 部署所面临的挑战 在这次研讨会上,吴恩达分享了人工智能面临的挑战之一,即 AI 概念验证与产品落地之间的差距。 吴恩达从三个方面介绍了 AI 部署所面临的挑战:小数据、算法的鲁棒性和泛化能力,以及变更管理。 挑战 1:小数据问题 小数据在消费互联网以外的工业应用中很常见,而 AI 研究通常使用大数据,很多算法是针对大数据开发的。 但是很多行业可获取的数据规模有限,为了使 AI 在这些行业中起作用,我们必须开发针对小数据的算法。小数据适用的算法包括 GAN、GPT-3、自监督、迁移学习等。 挑战 2:算法的鲁棒性和泛化能力 大家可能已经发现,已发表论文中效果显著的模型通常在生产中不起作用,研究中声称算法结果已经超过人类的方法却不能很好地投入到生产,训练的模型不能很好地泛化到其他数据集等。吴恩达以医疗领域举例进行说明。然而这些问题不仅存在于医疗领域,其他领域也面临相同的问题。 挑战 3:变更管理 AI 技术可以使工作流程实现自动化或部分自动化,而这对相关人员的工作带来了影响。我们需要对整体的改变有更好地掌握。 解决方案 对于上述挑战,吴恩达也表达了自己的观点,给出了解决方案。他指出我们应该关心整个机器学习项目周期,除了构建机器学习模型以外,其他问题也应该更系统化,让 AI 更具可重复性和系统性: 我们应从范围界定到数据、建模和部署,系统地规划机器学习项目的整个周期。 吴恩达表示,学界和工业界应努力将机器学习转换成系统化的工程学科。 吴恩达演讲完整视频: