年均18篇论文,这位清华博三学生今年已发3篇Narure子刊!网友:为了发文而发文
共 2437字,需浏览 5分钟
·
2022-08-04 07:23
大数据文摘出品
作者:Caleb
终于熬到了毕业,从大学离开的大学生们也终于离开了那个噩梦。
没错,文摘菌说的就是论文。
但是你敢信,这个大部分学生的心头痛,竟然也能“卷”起来?
最近知乎上就被一个清华博士在读期间发表了100多篇论文这件事掀起了又一股讨论热潮。
根据统计,从2017年截止到2022年7月27日,这位清华大学电子工程系的博三同学武楚涵已经发表了108篇论文,平均一年发表论文18篇。
其中不少更是来势汹汹,比如arXiv的一作论文,武同学就手握67篇。CCF A类推荐会议/期刊共计22篇;CCF B类推荐会议/期刊共计9篇;CCF C类推荐会议/期刊共计4篇;还有3篇Nature子刊。
根据谷歌学术统计,武同学的论文引用已经超过了2100次。
2022年武同学也没有停下发论文的步伐,半年时间,武同学就已经发表/投稿了19篇一作论文。
看到这些,文摘菌除了佩服和羡慕,也找不到其他话说了。
博三论文上百篇,真实度到底有几成?
写过论文的同学都清楚,一篇论文从做数据、到写稿、到投稿、到返修、再到发表,1年1篇都已经十分高效了,更何况还有Nature子刊这种级别。
有网友就表示,自己的两个院士级别且已经有终生教职的导师加起来都没有100篇。
一百篇什么概念?前两天爆出来的华科陈汉华,他的大老板jin hai,搞system的,去年Google scholar上发了100篇左右。这大概是举全东五楼之力,谁发文都挂个名,才能有这结果。人家院长这种咖位尚且如此,你一个学生是怎么做到的?
人家第一篇肯定没少投入,然后有前一两篇的原始积累后,就开始以此作基本盘滚雪球了。可以看看,这种研究者一般都是早期那几篇引用量高,然后后面越来越拉,越来越incremental。
链接:
当然也有眼尖的的网友一眼就看到了问题所在:
高引几篇标题很类似,大部分是一些incremental工作,有灌水嫌疑;
自引太多,还有一个稳定的二作,两个作者作风比较类似;
开源存在问题,github有几个空的repo,提供源代码的大都是jupyter。
链接:
https://www.zhihu.com/question/537342945/answer/2595656650
也有网友更是一针见血地指出,有人发论文是为了做研究,武同学发论文只是为了发论文。
打开论文仔细一看,数据集也全部都是同一个(非公开数据集,自从msra开源mind之后这个数据集似乎就弃置了)。最后一个文章和前三个比多了搜索数据。
只要是本领域的人,看论文的idea不难发现无非就是用各种不同的方法利用attention去做news recommendation。基本等同于,发明了4种不同的办法去番茄炒蛋,每一个文章讲故事的侧重点各有不同,解决方法略有区别,但是一个模子的配图,一个模子的行文结构,当得上流水线生产。
链接:
https://www.zhihu.com/question/537342945/answer/2597259999
而之所以会出现这样的情况,更关键的症结还是在于当前的考核机制。如今奖学金、保研申博、评职称什么的都得数文章算IF看分区,既然这样的话那这样的行为是否也是在“对症下药”呢?
水论文也是有套路的
而其实,这样的事情在国内也早有先例。
比如在2021年,浙江大学公众号就写到,浙江大学信息与电子工程学院2018级硕士研究生齐俏在两年内发表了14篇论文,其中一作10篇,包括4篇Top SCI,2篇SCI和4篇EI;持有2项发明专利,出版1部英文专著。
除了硕博外,深谙其道的教授也大有人在。
2020年,有人指出,南京邮电大学教授桂冠在3年半的时间里发表了300篇论文,平均4天多发一篇论文。
而除了庞大的论文数量外,桂冠还存在严重的论文自引情况。比如在2018年11月28日发布于IEEE Access的Deep Learning-Based Unmanned Surveillance Systems for Observing Water Levels一文中,桂冠总共引文32篇,引用自己的文章13篇;在2019年3月5日发布于IEEE Access的Deep Learning-Based Classification Methods for Remote Sensing Images in Urban Built-Up Areas一文中,桂冠总共引文13篇,其中引用自己的文章6篇。
对于近年来不断涌现的此类现象,有网友就表示,水论文也是有套路的,只要找准方向,发起论文来也没有很困难。
例如偏微分方程加一项就是一篇文章,减去一项又是一篇文章,边界条件有一类边界条件,二类边界条件,三类边界条件,每种边界条件又都可以来一篇。搞优化问题也是,加一个约束就是一篇新文章,两个方法结合又是一篇新文章,以前做的是静态优化问题,那么动态情况下又是一篇文章,加个噪音 考虑Uncertainty又可以弄一篇文章,加一个Fuzzy logic搞一下又是一篇文章,以前是机理模型现在我用上数据起个Data driven的名字就又是一篇了。
链接:
https://www.zhihu.com/question/430862162/answer/1670793742
这也让文摘菌想起此前在学术界闹得沸沸扬扬的石墨烯事件,石墨烯掺鸟屎能写一篇文章,换成鸡屎又是一篇,再换还能再发,排列组合下来三种材料就能发6篇文章。
用最小的时间和精力代价来换取短平快的论文产出,这种玄学炼丹式科研大多出现在一些不受大众关注的领域,但是在圈内的人都心知肚明,“灌水”早已成为一种合理利用游戏规则的行为。
也正如有人感叹到,小灌怡情,大灌伤身,恶意灌的话那就多少有点不地道了。