专访邱锡鹏:人工智能开源社区的「先行者」
共 4898字,需浏览 10分钟
·
2022-01-23 23:10
邱锡鹏,复旦大学理学学士和博士。任职复旦大学计算机科学技术学院教授,博导。发表 CCF A/B 类论文 70 余篇,获得 ACL 2017 杰出论文奖(CCF A类)、CCL 2019 最佳论文奖。出版开源专著《神经网络与深度学习》,主持开发了开源自然语言处理工具 FudanNLP 和 FastNLP,获得了学术界和产业界的广泛使用。
前章
PREFACE
赓续科研初心
RESEARCH
推进人工智能术语标准化
VISION
中国历史上出现过三次翻译高潮:东汉至唐宋的佛经翻译、明末清初的科技翻译、鸦片战争至“五四”的西学翻译。每次翻译热潮都引发海量知识的交汇融通,外眺可打通中外知识视域,前瞻可优势互补、关注盲点并寻找突破。当下,信息时代降临,在科研圈更是呼唤有效翻译,启迪影响科研人员,降低交流成本。
2015年,邱锡鹏在写书过程中发现国内学术术语混乱,经常遇到不同的教科书中术语使用标准不一致、中英术语夹杂等问题。比如很多人把 recurrent neural network 翻译成“递归神经网络”,但 recursive neural network 也被译为“递归神经网络”,这样就分不清了。当时他推荐翻译成“循环神经网络”。经过这么多年,大家基本认可了“循环神经网络”的叫法。
但是想要推进整个行业术语标准化并不是一件轻松的事情,一是中英文词性的差异,中文词汇存在引申意义,传词达意存在天然鸿沟。另外,很多翻译其实并不好,但已经被广泛发行刊印,成为业内流行甚至是行业共识称法,这些已被沿袭使用的词汇很难修正,成为推进术语标准化的顽固阻挠。
邱锡鹏希望为术语标准化做一些努力。在2021年上半年,他曾和《统计学习方法》作者李航,《机器学习》作者周志华,《动手深度学习》作者李沐和 Aston Zhang 博士等人开了几次会,探讨在丛书中将术语进行统一对齐,把相关术语整理成一个列表,希望逐步做到规范统一。
当然,日常交流中他推荐术语规范,表达更方便清晰,减少让人产生困惑的地方。一些东西很难翻译,像 Transformer 不论怎么翻译,都不能涵盖其意义和除机器翻译外的场景,此时直接使用原文是便捷的。他也一直在知乎等技术社区为大家推荐一些更准确的翻译,例如 Pooling 应译为“汇聚”,而非“池化”,因为“池化”没有正确表达出 CNN 执行这一操作的真正含义;Dropout 应译为“暂退”;Robustness 则推荐译为“稳健性”,原翻译“鲁棒性”缺乏中文的美感。
一个人可以走得很快,但一群人可以走得很远,邱锡鹏呼吁更多的人注重术语标准化使用,但他不强求每个人都使用目前所倡导推行的翻译。比如他不会要求自己的学生如何如何,只管以身作则。在他看来,推行术语标准化是有兼容性的,无论是争议还是随从都是一种积极的信号,这种关注本身就是一种向心力,能促使行业向前。
感恩智识上的先行者,感谢他们托举思考的宝石,缀满某些空白缺失处的漆黑夜幕。感谢邱老师谦逊地垂着他的绿荫,坚持为人工智能研究发展不断地奉献和努力。
-END-
如果觉得有帮助,就请分享到朋友圈吧!
公众号后台回复“transformer”获取最新Transformer综述论文下载~
# CV技术社群邀请函 #
备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳)
即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群
每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~