高考之后七年多,杨幻睿如今22岁了,杜克大学博士四年级在读。
9月26日,在杨幻睿正吃晚饭的时候,一封邮件发到了他的手机邮箱里。起初他还没有在意,但是随后看到是微软CMT代发的邮件,他突然意识到了什么......果然,NeurIPS 2020放榜了:邮件以Congratulations!开头。看到这里他突然长舒了一口气,“半年多的付出总算得到了回报,还好,还好。”之后,杜克大学电子与计算机工程系陈怡然教授,在微博上晒出了杨幻睿的成绩——论文被NeurIPS 2020接收为最优等级的Oral 。陈怡然教授微博截图NeurIPS是学术界和业界都广为认可的人工智能顶级会议,本次NeurIPS 2020接收到了破历史纪录的9454篇论文,而只有1900篇论文通过评审,其中包括280篇Spotlight以及105篇Oral,Oral等级论文比例仅为1.1%。至于陈怡然教授所说的家里的领导,就是其爱人李海教授,也即是杨幻睿的导师。两人是杜克大学同一个实验室的教授。近日,AI科技评论通过陈怡然老师联系到了杨幻睿同学,并对他做了一次深度专访。在和杨幻睿同学的交流中,他不凡的求学经历、乐观的人生态度给我们留下了深刻的印象。在详细介绍杨幻睿同学不同寻常的故事之前,AI科技评论先对他这篇Oral论文进行介绍。
这篇论文主要就是利用集成模型的思想,可以形容为“三人行,必有我师焉,择其善者而从之,其不善者而改之” ——杨幻睿
论文标题:《DVERGE:通过“缺陷”多样化构建鲁棒集成模型》
论文链接:https://arxiv.org/abs/2009.14720别急,其实这篇论文所做的工作和对抗攻击有关,那什么是对抗攻击呢?对抗攻击指的是对目标机器学习模型的原输入施加轻微扰动以生成对抗样本来欺骗目标模型的过程。对抗攻击可以暴露机器学习模型的脆弱性,从而提高模型的鲁棒性和可解释性,它在图像领域已有广泛的研究。在下图中,将微小的噪声加到一张熊猫图片后,原本可被图像分类模型正确识别的熊猫被识别为了长臂猿,尽管人类肉眼完全无法分辨加噪声前后两张图片的区别。 熊猫图片加噪声后被图像分类模型识别为长臂猿其实这是因为对于神经网络来说,输入的图片不过是一系列像素点的数值排列,对这些像素点的数值稍微增加一些噪声,神经网络就会“大失分寸”。而今年七月,一篇由美国东北大学和MIT等研究机构,共同提出的基于对抗样本的T恤衫又火了一把。穿上印有对抗样本图案的T恤,在被AI检测时,无论衣服发生任何褶皱或变形,都能达到“隐身”效果! 即使攻击者不知道攻击对象所用的模型细节,只要其利用在相同数据集上训练的“代理模型”生成对抗攻击样本,作用在其他未知的模型上也同样有很强的攻击成功率。这种“迁移攻击”是实际应用中最可能出现的攻击形式。当然不是,有对抗攻击相应的就有对抗防御(对抗训练)。对抗性训练是一种通用的鲁棒性提升算法,通过迫使模型学习“鲁棒”特征来消除其缺陷。但这一学习过程是很困难的,即使是用更大规模的模型,也会对模型识别准确率带来不可避免的显著降低。而杨幻睿的这篇论文则提出了另一种可行的鲁棒性提升方案:只要集成模型中的每一个子模型在面对同一对抗噪声时给出不同的输出,也就是对抗攻击不能在子模型间迁移,即使每个子模型单独并不鲁棒,其平均得到的集成结果也有望在面对迁移攻击时实现高鲁棒性,且往往只会对模型带来很小的识别准确率损失。然而,前人提出的集成学习算法并不能有效多样化子模型面对攻击时的输出。鉴于此杨幻睿及其论文合作者共同提出了“DVERGE”算法:通过提取集合模型的子模型学到的“非鲁棒特征”确定其缺陷所在,并进一步通过多样化子模型的缺陷使其面对对抗性噪声输出不同的结果。这是因为即使单个模型有缺陷,当我们有多个缺陷各不相同的模型时,其平均的输出就有可能是鲁棒的。因此通过集成学习提升鲁棒性的关键,就在于促使子模型的缺陷多样化。这一过程可以形容为“三人行必有我师焉,择其善者而从之,其不善者而改之。”这一新颖的多样性描述与优化方式使DVERGE得到了超出其他集成学习方法的迁移攻击鲁棒性。之前的集成学习方法将这一成功率降低到了60%上下,而本文的方法将子模型间的迁移成功率降低到了5%上下,几乎杜绝了对抗攻击在子模型间迁移,保证了最终集成结果的鲁棒性。关于本论文的更多介绍请参看AI科技评论今日推文第四条。北京八中,郭沫若题字在八中少儿班的四年感觉是我最意想不到但又最至关重要的经历,也是我14岁就能参加高考的原因。——杨幻睿
1985年经北京市教育局批准,北京八中和中国科学院心理研究所、北京市教育科学研究所合作,创办了北京八中超常教育实验班(简称:少儿班),为北京地区智力超常儿童的健康发展提供了适合他们成长的教育环境。
少儿班的学制为四年左右(为适应课改,少儿班现已改成五年制),招收年龄十岁左右的智力超常儿童,经过四年的培养使他们完成初中(含六年级)和高中的全部课程,即普通学生七年的学业,毕业时成为德智体美全面发展的优秀高中毕业生。最初几届少儿班的毕业生已经成长为所在行业的中坚力量,比少如学术界有尹希和王梦迪等,他们已经在顶级学府担任终身教职,在各自的领域做出来了不小贡献。
我是从清华附小考入八中少儿班的,清华附小的教育方式特别快乐,也不搞奥数什么的。不过现在想起来附小的教育对我的各个学科,尤其是语文英语打下的基础还是相当好的,另外当时附小的老师也很支持我在课外自行学奥数扩展思维,我也正是在学奥数的过程中了解到了八中少儿班的招生。
杨幻睿入学八中少儿班时,先经全市报名,之后进行初试和复试,选拔60个人进入为期一周的试读夏令营,最终录取29人。
杨幻睿于2009年参加八中少儿班复试后留影AI科技评论问杨幻睿在四年的时间里完成七年的学时是否轻松,他谈到:“这肯定不能说轻松,不过就我个人而言压力也不是很大,而且全班都在按照同一个节奏学习,也不会有很快的感觉;虽然全班默认按理科学习,但是文科课程的初中和高一必修部分也都会学,我们只是压缩了时间,初高中所有的知识都是学了的。”八中是最早提倡素质教育的学校之一,少儿班的教学体系也很注重大家综合素质的培养,会组织集体出游,每周有一个下午的自然体育课,春夏秋会组织出去远足爬山等,每年必去香山和八大处,冬天则组织游泳。学期中的假期也会集体组织到北京的远郊或是其他省市进行3-5天的游学。在八中的经历对杨幻睿来说是全方位的提升 ,知识、见识、学习方法、为人处事都是在八中这几年培养出来的。
在少儿班这四年间,每次旅行都给我不一样的心灵震撼。从百里峡到上方山,从五大连池到科罗拉多大峡谷,旅行向我们展示多彩的世界;从云冈石窟到孔林孔庙,从大同煤矿到大庆油田,游学为我们提供了社会实践的机会。一次次的出行,不仅锻炼自理能力,更增强我们面对陌生世界的勇气。从《围城》到《平凡的世界》,从《山居笔记》到《美的历程》,从《唐诗百话》到《人间词话》。从《读者》到《新闻周刊》...... 手捧一卷卷书册,我的心灵自爱阅读中成熟。阅读不仅解释了自然科学的神秘,更展示了丰富的人生,激发我的思考。
14岁那年,少年杨幻睿以高考697分的成绩考入了清华大学。
杨幻睿与清华二校门合影 其实我那年是697+50分加分,30分是清华自招,20分是北京市优秀学生干部,因为我本身够分数线了,所以社会加分就没用了。
但自招的加分选专业还可以用,所以我理论上是可以去绝大多数的统招专业的。——杨幻睿
杨幻睿的父亲是清华老师,所以他在填报志愿前对各专业都有一定的了解。当时正值电子系从2007年开始的本科课程改革趋于稳定的时候。作为清华最大的系之一,电子系的课改梳理出了贯穿两个一级学科的知识体系,并在此基础上构建起新以10门核心课为主体的课程体系。电子系课改“宽口径重基础”的培养方式与八中一直强调的“志向高远,素质全面,基础扎实,特长明显”的育人目标十分契合,再加之电子系研究的电子电路、通信网络、信号处理、信息光电子等领域都走在时代发展的前沿,因此,杨幻睿最终选择了电子系作为第一志愿。谈及在电子系学习带来的最大收获,杨幻睿说:“一是扎实的线性代数、信号处理等数理基础和编程、电路设计等工程能力,这让我在后续上手新知识时始终有似曾相识、有据可依的感觉。二则是庞大的校友网络,即使上下差很多届,一提到电子系,大家也很容易产生共鸣。”大二的时候,杨幻睿才开始真正接触人工智能。当时有一篇文章在网上有很多讨论,这篇文章解释了VGG每一层学到的特征。他看到简单堆砌的网络结构可以自发地从数据中学到多样的有一定实际意义的特征,感觉很神奇,之后就开始陆续关注CNN相关的一些应用。 VGG特征可视化至于说系统入门,他则是看了吴恩达的coursera课程系统了解机器学习的基本概念,随即又看了Hinton的coursera课程了解深度学习的概念。大三时,杨幻睿去加拿大的阿尔伯塔大学交换了一个学期,当时主要是上原有专业的课,没有很多和AI相关的内容,不过最早有关强化学习的概念是他在阿尔伯塔大学接触到的。大三结束的暑假,杨幻睿去了佐治亚理工大学Le Song老师组里做暑研。当时复现了Deepmind DQN玩Atari game的算法,虽然最后没发出论文来,但他表示这是第一次正经做AI相关的科研和实验,学会了很多的coding技能和阅读论文的方法。之后,因为Deepmind的缘故他又关注过一阵儿强化学习,不过后来感觉兴趣不是很大,于是又关注回深度学习上面来了。杨幻睿的本科毕业设计偏硬件,和模型压缩有关,毕设题目是《支持片上训练的全连接神经网络计算架构》,毕设导师是刘勇攀教授。他这篇毕业论文设计了一个加速器的运算架构,在支持高效运行稀疏量化的网络同时,同时支持对权值进行训练。 韩松论文截图韩松本科就读于清华大学电子工程系,博士就读于斯坦福大学,师从NVIDIA 首席科学家 Bill Dally 教授,博士期间曾创建深鉴科技,现为MIT 助理教授。
韩松前辈是我的学习偶像,他当年也是在电子系,算是我的直系学长,他12年就从清华毕业了,而我是13年入学,很遗憾,我和他并未在清华见过。
当时之所以想到要做片上训练,是因为杨幻睿注意到:“在很多物联网的场景下,部署之后的网络可能需要根据输入数据进行微调,而这些微调往往就是在最后的全连接层中进行的,所以设计一个支持训练的全连接层加速器很有意义。
其设计的全连接加速器架构也成为课题组设计的STICKER神经网络处理器的一部分,完成了流片与测试,最终发表在2018年VLSI Symposium 上。 杨幻睿毕业季与日晷留影 杨幻睿与杜克工学院老系馆合影在毕业设计的导师刘勇攀教授的介绍下,我才能认识现在的博士导师陈怡然教授和李海教授,真的非常感谢刘导。——杨幻睿
巧合的是,陈怡然和李海教授两人当年也是在清华电子系同届就读,随后他们二人一起到的普渡大学就读博士,更巧的是,他们二人是98年毕业于清华,杨幻睿则是在98年那个毕业季出生。由于毕业设计和模型压缩相关,偏硬件,而陈老师实验室做的正是软硬件结合的方向,杨幻睿觉得很有前景,于是在2017年两位老师搬来杜克时一起跟着过来了,成为这个组在杜克的第一届学生。
杜克大学校园环境十分优美,周边自然环境和治安都很不错,身为北方人的杨幻睿表示他挺喜欢东海岸杜克的宜人气候。 杜克礼拜堂(杜克大学李石宇供图)秋天的杜克(杜克大学李石宇供图)杜克大学的整体学术氛围比较自由,硬件设施也很不错,杨幻睿谈道:“组里面陈老师和李老师对我们的管理比较自由,科研的选题之类的只要我们设想的有道理有一个比较明确的计划老师一般都是支持的。”CEI“进化智能”研究中心2018年合照,杨幻睿在二排最左,李教授和陈教授在前排正中(CEI实验室主页:http://cei.pratt.duke.edu/ )李老师和陈老师平常出去开会或者social期间会找一些新的项目或者想法,回来再安排给经验相似或者暂时没有项目做的同学来研究。就在今年年初的时候,陈怡然老师还邀请到沈向洋老师来杜克做讲座:而学术之外,在杜克的生活当然也有轻松愉快的一面。当时为欢迎新同学的到来,杨幻睿所在组简单聚餐:
杨幻睿博士刚开始时的工作和硬件关系更大一些,参与了两个深度学习加速器架构的工作。与此同时,也逐渐了解了组里关于深度学习模型压缩与神经网络鲁棒性方面的前期工作。
18年的暑假,杨幻睿曾在微软研究院Redmond总部实习了三个月,工作主要围绕通过数据增广提高模型鲁棒性展开,同时也做了一些关于利用矩阵分解进行神经网络压缩的研究。当时科研刚刚起步,他对这个领域的整体还不完全熟悉,因而最终只完成了一篇发表在AAAI workshop上的小文章。不过这是他第一篇以一作撰写、修改和投稿的文章,对后续的科研积累了很多宝贵经验。另外,微软整体宽松的科研氛围和基础研究与工程实现相辅相成的组织结构也给他留下了深刻的印象。在博士阶段的前一年半左右的时间,杨幻睿的科研之路并不算顺利。“当时我可能处于一个对未来比较迷茫的阶段。来到杜克后,从组里的学长、其他组的同学、学校丰富的课程与讲座以及自己阅读的论文中,一下子接受了太多的新思想、新方法,却没有来得及对自己的研究领域构建起比较完整的了解与梳理。这导致我的科研方向一度飘忽不定。这一段时间我的很多工作都在试图把自己一些不太成熟的“奇思妙想”,或者可能自己还一知半解的新理论新方法套入到我要解决的问题上,同时对实验的设计和预期又不够充分,这让我的科研走了很多弯路。我先后尝试投稿了ECCV 2018、NIPS 2018、AAAI 2019等会议,但文章或因为创新点不足或因为实验设计有缺陷都没能命中。同时也有一些一开始踌躇满志但进行到一半发现做不下去的项目。”这种状态从博士二年级的下学期开始有了改观。这时,杨幻睿学习了信息论与压缩感知的课程,在补齐了自己基础理论知识的同时,也发现很多传统理论可以应用到他正在进行的深度学习研究,这最终促成了他的两篇文章的中稿。其一是对“DeepHoyer”的研究。杨幻睿注意到,压缩感知中的Hoyer正则项在传统问题上取得了很好的性能,却在神经网络压缩的研究中始终被忽视。这后来促使他完成了“DeepHoyer”的研究,投稿NeurIPS 2019。虽然文章第一次投稿并没有命中(最终得分7 6 5 5),但评审偏向正面的评价给了杨幻睿很大的信心。暑假期间,他留在学校进一步完善实验,同时利用帮李老师准备新学期“工程深度学习”课程的契机,从传统方法出发进一步梳理模型压缩与压缩感知理论之间的联系与发展脉络,终于将文章修改完成,中稿ICLR 2020。这之后,他在信息论的学习中了解到了一套用互信息量描述隐私保护的理论框架。当时组里的李昂同学刚好在研究分布式学习的隐私保护问题,他们经过交流将这一框架进行了深度学习背景下的实现,最终完成了一篇KDD 2020的论文,还有幸被评为最佳学生论文(李昂为一作)。在鲁棒性领域,通过系统性的论文阅读和课程讲义的整理,杨幻睿逐渐掌握了常见的研究思路和大家认可的实验评价方法 。再加上与之前模型训练、目标函数设计与优化等的知识与经验相结合,促成了他这次的工作被NeurIPS 2020接收为 Oral。另外,杨幻睿在ICLR 2021也有一篇关于模型压缩的投稿,AI科技评论在此也祝杨幻睿同学中稿。
从小,他父亲就经常和他一起读书,曾用曹丕《典论 · 论文》中的话教导他:
“盖文章,经国之大业,不朽之盛事。年寿有时而尽,荣乐止乎其身,二者必至之常期,未若文章之无穷”。
这培养了他后来对科研工作的坚定志向和笃志决心。
关于自己的学习秘诀,杨幻睿总结了两点分享给大家:
第一,在潜移默化中学习,上课听到的知识、读的论文、听的讲座、和同学日常的讨论,都能很快地总结出几个关键词记住,之后再遇到可能的应用场景时快速地回去学习一下细节。
第二,给别人讲,如果能给别人讲明白,说明自己也明白了。我不喜欢刷题,但喜欢给别人讲题,在当年高三大复习的时候,我经常答疑时间去老师办公室,给暂时排在队尾的同学一对一答疑。每位同学对知识的掌握程度不一样,讲题之前要先解对方知道什么并在此基础上帮对方构建好知识体系,把对方知道的点和新的知识建立起联系,逐渐引到要讲的问题上。
杨幻睿在博士二年级的两个学期给系里的两门研究生基础课做助教,分别是计算机系统基础和模式识别。这些基础课的大部分相关知识是杨幻睿在清华期间学习的,时间过去久了,很多概念的具体细节记不清,但好在他对知识点之间的联系还有印象,有人问起来他就快速地看课件复习一下。“没办法,当助教全靠学的比学生快。”他说。
在博士第三年的秋季和当前这个学期,杨幻睿帮李老师开了一门新课,作为助教,他谈起自己的心得:“在准备课件的时候要假设大家是零基础,要从最基本的东西开始,一步步为大家建立起对深度学习技术来源与发展的理解,讲清楚为何会有这个技术 ,在这个过程中也是对自己知识的一个梳理。”
助教课讲的前三讲,从零开始引出CNN李老师和杨幻睿正在筹划寒假期间把这门课整理上线Coursera,陈老师和其他几个助教也会参与其中。杨幻睿科研只做了三四年,但他对教学工作颇有心得,他表示这都是从他父亲那里耳濡目染学习到的。他父亲是一名清华老师,从小对他的教育就不是说教,而是在日常生活中不断激发他对各种新鲜事物的兴趣,比如说带去图书馆、博物馆或者科技馆。他印象比较深的是从小学开始他父亲每年都会带他去一次中国科技馆,他在里面瞎玩,而他父亲则时不时给他讲一讲各种东西的原理。而等到他学完大学物理之后就再也没去过科技馆了,因为学不到新知识了。除了读书之外,杨幻睿还很喜欢 F1、NBA、冰球等各种体育比赛,也喜欢开车在大山里闲逛,时不时以景咏怀,即兴赋诗。
冰球比赛现场照片
在未来,随着5G、物联网、大健康、智慧城市等等概念的深入探索与落地应用,基于深度学习的方法将在越来越多的应用场景中提供服务,这也从各种方面对模型提出了更高的要求。除模型的运行效率与鲁棒性之外,杨幻睿也会更多关注有关于隐私、可迁移性、可解释性等对实际应用有重大意义的基础方法研究,并将其与新出现的智慧医疗,智能家居等应用场景相结合,为阔步迈入崭新的智能化时代扫清障碍。杨幻睿的偶像,除了之前提到的韩松学长,还有恺明大神,他对其十分敬佩,ResNet是他最喜欢的网络,恺明大神提出的很多东西都给他一种“四两拨千金”的感觉:理论简洁、效果强大、直达本质。
“感觉自己的学术生涯还刚刚起步,发的论文也还不多,我会继续努力,漫漫其修远兮,吾将上下而求索。"
当下22岁的杨幻睿对未来的学术之路充满了探索的决心和信心,显示了一位正当风华正茂之年岁的学术青年的昂扬姿态。
采访结束第二天,AI科技评论又一次联系到杨幻睿同学:还有最后一个问题,您想起来当年高考每科目的具体分数了吗?“哦这个问题啊,没太记起来,但是昨天采访结束我问了我爸,他说是:语文125、数学143、英语138、理综291。”推荐阅读
ACCV 2020国际细粒度网络图像识别竞赛正式开赛!
添加极市小助手微信(ID : cvmart2),备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳),即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群:每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~
觉得有用麻烦给个在看啦~