轮椅上的博士矣晓沅:9 年求学路,我从清华毕业了
共 4370字,需浏览 9分钟
·
2021-09-01 20:08
来源:HyperAI超神经 本文约3700字,建议阅读7分钟 清华的博士矣晓沅分享了一个文本风格自动转换的新方法。
关键词:博士 NLP IJCAI-SAIA YES
矣晓沅现场进行主题分享
微清华大学计算机系马少平教授在微博称赞他
凭实力考上清华,未受任何照顾,同样凭实力读的博士
我评审了他的博士论文,工作很赞
清华校长邱勇为矣晓沅拨穗并颁发证书
但网络的走红似乎并没有对矣晓沅的生活产生影响,在被问到"上微博热搜是什么感觉"时,矣晓沅坦言"我不用微博,没有看"。
实际上这并不是矣晓沅第一次拒绝社交网络的"走红机会",博士期间为了专注科研,他曾多次拒绝文化类或娱乐性节目的邀请。对他而言,把时间留给科研才是最重要的。
师从孙茂松,打造 AI 诗人九歌
人的智能包括诸多方面,如逻辑推理能力、语言智能。前者对应的活动如下围棋,在 AI 领域的应用可见 AlphaGo;语言智能则涉及到人类的创造性,文本生成就是其中的代表行为。
诗词爱好者、本科就经常写诗的矣晓沅,萌生了一个想法,机器能不能像人类一样具有自己的创造力,机器在文本创造性上的极限又是怎样的。这也成为他博士阶段的研究方向。
2017 年,在导师孙茂松教授的指导下,矣晓沅开发了 AI 中文诗歌写作系统"九歌",用户只需输入句子、段落或关键字,即可自动生成绝句、藏头诗、律诗、词等不同体裁的诗歌。
九歌新版 3.0 系统将于 8 月 23 日上线
支持绝句、藏头诗、律诗、词等多种体裁的诗歌写作
访问九歌:
九歌采用了当时最新的深度学习技术,结合多个为诗歌生成专门设计的模型,基于 80 余万首古人诗作进行训练。同时九歌也支持多模态输入、多风格多体裁诗歌生成以及人机交互创作等功能。
虽然九歌在创作速度和数量上不受限制,偶尔也会生成一些很惊艳的作品。但在矣晓沅看来,好作品的出现可能是概率问题,九歌尚处于三流业余诗人的水平。绝大部分创作出的诗歌在篇章结构、前后呼应上,与人类创作的作品尚有差距。
矣晓沅认为,AI 与人类应该是相辅相成、共同促进、共同进步的。
输入"人工智能"九歌自动生成的七言绝句
以九歌为例,虽然时下是人类充当老师,用千百年来创作积淀的优秀文学作品,教导机器,但是随着技术进步、算法更新,机器创作的效果也会越来越好。
机器偶尔产生让人眼前一亮的作品,给人类创作者带来启发和灵感,激励人类创作者创作出更多更优秀的作品,这些作品又可用于提升模型性能。这是一个相互促进的关系。
首篇论文 4 投 4 拒,审稿意见最宝贵
与众多博士生的求学路一样,矣晓沅博士期间的研究也并非一帆风顺。
在投稿第一篇论文的时候,曾连续 4 次被拒,直到第 5 次才被收录,这个过程持续了一年多将近两年的时间,矣晓沅坦言当时承受了极大的心理压力。
从小就饱经病痛折磨的矣晓沅,这次同样没有轻易言败,他愈挫愈勇、越是失败越想去再次挑战,最终在导师和实验室同学的协助下,矣晓沅博士期间的第一篇论文最终被 CoNLL 2018 收录。
矣晓沅博士期间首篇论文被 CoNLL 2018 收录
论文地址:https://arxiv.org/abs/1809.04313
事后矣晓沅在反思这件事的时候,坦言"不要怕论文被拒",他觉得如果一篇论文被连拒多次,则表示文章一定有很多明显的不足。这时要广泛反思吸纳审稿人的宝贵意见。
此外还要有自己的判断,如果一篇论文只是为了凑数而投的灌水文,那么不被收录也很正常。
但是如果对自己的工作非常有信心,那么不要因为多次被拒而迟疑灰心,根据审稿人的意见不断完善论文,再投就是了,不管论文能否被收录,都能有所收获。
给学弟学妹:过来人的快问快答
大一入学时,由于基础薄弱矣晓沅的成绩在年级中仅仅排第 69 名,经过坚持不懈的努力,大二时他的成绩升至第 31 名,大三则达到了第 9 名,并在 2015 年获得了清华本科生特等奖学金(每年仅 10 名)。
但读博和本科是非常不一样的状态。本科遇到的问题和需要学习的课程,都有明确的路径。博士阶段则完全靠自己探索,有时候会迷失,有时候会看不到努力的结果。对此矣晓沅给出了一些过来人的"建议"。
Q1:读博之前需要做好哪些准备?
科研并不像理想中那般潇洒和炫酷,现实中的科研过程往往会面临非常多困难,也会非常枯燥。
因此对于想要读博的学弟学妹们,推荐大家本科就去实验室实习,即使打杂也能体验到真实的科研过程。
读博会遇到各种各样的困难,比如想不出研究方向、论证方法,或者实验效果不理想、论文被拒等。要克服这些学术上的困难,就需要你对自己的研究方向保有深刻的热爱和强大的信念。
既然选择了科研,就要做好心理准备,学术回报更多是精神回报和社会认可,不一定是大富大贵。
Q2:如何确定课题?
读尽可能多的论文,随时跟进行业最新技术。在选题时多思考、多和同学及导师沟通,分享自己的思路。
经验丰富的导师对大方向的判断非常敏锐,从思路上就能对你的选择给出比较可靠的判断。
Q3:如何避免撞题?撞题了如何应对?
在选题或做实验之前,确保你要研究的课题符合以下两种情况之一:
1、别人都想不到,只有你能想到。一拍脑袋就有的想法大概率是别人也会想到的。
2、虽然大家都想到了,但是只有你有能力做出来。
万一出现撞题,可以先仔细研读撞题的论文,确认你想到的细节对方有没有想到,对方的研究方法是否有很多不足。如果答案是肯定的,则课题还可以继续提升。
Q4:投稿时如何筛选顶会?
各个顶会都有自己的特点,要尽量根据不同顶会的喜好,灵活调整论文。
比如 ACL 比较注重分析、思路、效果,而 IJCAI 则比较综合,更多看中效果、方法,方法也要炫酷一些。投稿之前要先自行判断,然后再"投其所好"。
Q5:读博最重要的品质是什么?
青年学者最重要的品质就是探索和坚持。
科研的本质是探索,探索就难免会失败,会短期内没成果。因此不要因为失败而气馁。
这也正是科研的乐趣所在:做很多新尝试,尝试很多新方法。不要因为这项研究前无古人,自己又没接触过,就畏惧它,读博一定要多尝试。
坚持对于写论文发论文也非常重要。在动手之前,一定要想清楚自己选择的方向,多多评估这项研究的意义以及实现方法。
即使期间遇到各种各样的困难、实验效果不好,也不要轻言放弃,因为效果不好可能是多方面的原因,要有针对性地逐个击破,最终一定能做出来。
Q6:希望社会、家庭、学校给予青年学者哪些支持?
从社会角度来讲,希望给步入学术圈的年轻人更多的支持和理解。
他们投入了非常多的时间精力,但是一些基础学科如数学、物理,短期内不一定有成果,这个时候应该给他们更多的机会和时间。
从家庭的角度来讲,希望家人对青年学者多一些理解和包容,博士也不要为了做科研整年不回家。青年人和家人之间应该多沟通。
学校则应该在制度和经费上给青年学者更多支持。
Q7:推荐哪些学习资源?
研读论文可以访问 arXiv,关注行业最新的论文和研究动向;Google Scholar 也会根据个人的研究方向和兴趣自动推荐;还可以关注各个顶会的收录论文列表,根据研究方向或摘要筛选和阅读。
书籍阅读则推荐一些基础类书籍,如 Bengio的《DeepLearning》,中科院宗成庆老师的《统计自然语言处理》,邓力老师与清华 THUNLP 实验室刘洋老师合著的《基于深度学习的自然语言处理》等。
三本书都非常侧重基础知识
是夯实学科知识、了解最新研究的推荐书籍
清华园的无障碍推广者
作为特殊群体的一员,矣晓沅一直希望能够把自己的研究兴趣,和无障碍公益结合起来。
读博期间,他在清华校园中组织参与了众多无障碍公益互动。
2016 年清华成立清华大学学生无障碍发展研究社团,矣晓沅是这个社团的创始人兼第二任会长。
2019 年,清华大学无障碍发展研究院联合其他单位
在京举办"一带一路"框架下无障碍论坛
矣晓沅担任会长期间,组织社团在校内做了多项调研、提案、宣传工作,主要从法律法规、相关制度、人的意识理念等方面,邀请同学们坐轮椅、戴眼罩,传播并推广无障碍理念,强化大家的无障碍意识。
社团成立 6 年以来,吸纳的成员也从最初的 3/4 个人,发展到如今的 150 人,矣晓沅和社团同学们的努力,为清华大学的无障碍设施带来了非常显著的改善。
校方针对校内的无障碍设施,做了诸多修缮,目前清华的主要教学楼都配备了无障碍卫生间,很多老教学楼都做了无障碍改造,增设无障碍电梯和无障碍坡道。
教学楼无障碍卫生间(左)和无障碍标识提示(右)
编辑:于腾凯
校对:林亦霖