科研新手该如何读文献?

极市平台

共 6853字,需浏览 14分钟

 ·

2020-09-11 22:43

↑ 点击蓝字 关注极市平台

作者丨王威
来源丨返朴
编辑丨极市平台

极市导读

 

对于刚刚踏上科研之路的新生来说,读文献是最先经历的考验。但是,哪篇文献应当精读?如何找准论文精华之处?基于理工类学科特点,哈工大(深圳)的王威教授梳理了文献阅读的方法,相信能对读者大有裨益。

X同学,展信佳。自从你进组已经有两个月了。昨天你来信说你搜了很多文献,但读得头大,没什么进展。为师思考良久,针对咱们课题组新生的常见问题,写下以下一些肺腑之言。衷心希望你能够走过目前的瓶颈期,早日寻找到读文献的窍门和快乐。

1 为什么读文献(paper)?


这个问题很容易回答。因为学术研究,不是从你这里开始的,自然需要查阅前人的研究成果,从而一方面积累知识,一方面解决手头的问题。


在这里,我引用你肖师兄毕业前留下的一段话:

“关于看文献,这其实是一个老生常谈的问题。但是在我刚进组之初时,并不很注重对于文献的阅读,导致走了很多弯路。后来才逐渐认识到文献调研在科研中的重要性,甚至我认为可能是科研中最重要的部分。

为什么阅读文献对于我们如此重要,之前在网上看到University of Zaragoza的Professor Masia的一句话印象很深,她说:“Our job is to push the frontier of what is already known, so we need to be aware of where this frontier is.” 从大的意义上来说,做科研工作需要知道最前沿的知识,当下研究领域在使用的思想和方法,这样我们才能知道目前的差距和挑战在哪里,才能不断创新,做出有价值有意义的工作。而且只有通过阅读文献,我们才能找到我们的工作在当下科研界中所处的位置,这样我们才能明白我们的工作的意义在哪。

从实际的角度来说,阅读文献也许会让我们找到在研究过程中所面临问题的解决方法,可能一个困扰我们几个月的技术难题,别人早就已经解决并且报道,而我们还在苦心琢磨。又或者当我们研究迟迟无法突破,在文献中寻找灵感也是一种办法。”

2 每天学习和工作很忙,应该花多少时间读文献?


按照我的经验,平均每天一小时是比较合理的。这里指的是科研常态化的看文献,而不是在课题的某些阶段,需要大批量文献调研的时候(那个时候可能要远大于一小时)。我不太赞同那种“只有在实验室做实验才叫科研”的论点;同时,也不赞成从早到晚读文献,而忽略了动手去尝试。这和孔子说的“学而不思则罔,思而不学则殆”,有异曲同工之妙。在我们这个实验学科,常态化,也是比较健康的学习方式,应该是大部分时间做实验,剩下的时间思考、读书、读文献、总结、写作。

3 读什么文献?


按和你课题的相关性由强到弱排序,我暂且将论文归为以下七种


第一种,妥妥的就是你研究的课题。举个例子,如果你的课题是《如何避免红烧肉粘在不粘锅内的研究》,然后你看到了一篇讲如何避免红烧肉粘在不粘锅内的文章……我不知道这是幸运,还是不幸。但很显然,这篇文章你要从头到尾精读几遍,几乎要做到每个字都知道人家在说什么,弦外之音是什么,里面的公式、数据、图表、结论要记得门清。在此之上,你还要举一反三,知道他们工作不足是什么,和你工作的相似之处和不同之处是什么。从而回答这个终极问题:工作被人先发了,自己还能不能毕业?


第二种,跟你的课题密切相关。例如,你的课题还是《如何避免红烧肉粘在不粘锅内的研究》,找到的paper做的是回锅肉在不粘锅内的烹饪,或者红烧肉在电饭锅内的烹饪之类的。总之,主题直接相关,肉也很类似。那做法跟第一种一样,你基本上要把这篇paper读透了。阅读过程中,要时刻思考:本文对你的课题的启发是什么?指导是什么?试验方法或是某个理论,是否也可以用在你的课题?还是结论对你有帮助?


第三种,跟你的课题相关,但是有比较明显的区别。例如,你搜到的paper做的是“红烧肉的腌制机理探讨”。虽然你做的并不是这个课题,但既然要理解红烧肉在不粘锅内的粘附,显然需要知道肉的质地、盐浓度、水分等问题;而这篇paper一定会讨论这个问题,因此会给你启发。反过来,你要是不懂红烧肉烹饪的基本要素,自然也不会理解它粘不粘锅。这篇文章不需要每字每句都读透,基本上摘要和结论以及所有的图看懂了就行,但是你需要存下来(最好是能够整理汇总在一个ppt里),因为你的毕业论文或者小论文的文献综述部分很可能会引用到。


第四种,就是泛泛的跟你课题的某个关键词相关的论文。比如,所有关于不粘锅的论文,所有关于红烧肉的论文,等等。这些论文,构成了你课题的背景知识。但是它们非常零散,需要在长期科研的过程中积累,或是通过师兄师姐的推荐,或是导师教授的指点,亦或是自己发现寻找到。这些文献可以粗读,然后分门别类汇总到ppt(你的毕业论文或者小论文的文献综述部分也有可能会用到)


第五种,是所有关于肉的烹制论文。这些论文组成了课题组研究领域的大背景知识,发表频率是平均每天会在网上发表1篇左右。如果你预计自己会在今后比较长的时间内从事这一领域(例如3年以上),那需要利用一些追踪文献的方法(如订阅期刊的rss,或者订阅谷歌学术的邮件提醒),让自己源源不断的获得最新发表的这种论文;并在看到的第一时间,花3-5分钟粗读一下题目、摘要和主要的图。随后,根据对文章的兴趣程度和对你的重要程度,按照权重分类保存,并在某个时间统一阅读那些你标记权重比较高的这些论文。例如,我在阅读新论文时,会把所有的论文保存到一个“肉肉”文件夹,但是只有大约10%的会标记“需要读”(mac电脑有这个文件做标签的功能,windows的话请自己想办法),并在闲暇的时候打开仔细读一下。


第六种,是各个领域的综述。这些review, perspective, account等性质的论文内容庞杂,出现在各类期刊,平时也未必专门去搜集;看到了的话,可以简单看一下标题,是不是自己感兴趣的领域。比如你做肉之余,对素食也很感兴趣,那可以留心一下这个领域的新的综述。而你平时看论文的时候,或者做实验的时候,发现自己某个知识点比较缺乏,或者这个知识点最近很火,那就可以稍微去搜几个相关的高引用的综述(或者发在顶刊上的新综述),来充充电,说不定就是你下一个研究点(比如石墨烯在红烧肉中的应用)。但要注意,综述尽量不看太老的,特别是热门领域,5年就翻天覆地。


最后一种就是各类随机的文献。“浩如烟海”可能都无法形容现在文献的出产量。为了防止自己坐井观天,还是需要常常扩展自己的眼界。我建议选择3-5个顶刊,订阅他们的邮件提醒,出新刊的时候第一时间浏览一下最新的文章标题,感兴趣的话看一下摘要和图,刷新一下自己对于学术圈前沿方向的认识。我在韩国访问时的一位杨师兄,每天都会很精神抖擞地去看CNScellNatureScience,三大顶刊)的新paper,并且跟我说,你平时看什么期刊,就会发什么期刊。他最终发了Nature正刊,青千回国。我惊为天人,并因此深有感触。


我建议你采纳一个好的文件归类或者添加标签的方法。例如如果是mac电脑的话可以用系统自带的标签功能,把每一篇文献添加上关键字,或者按照以上七档来标记星标(一颗星到七颗星)

如何读文献?


根据以上文献的分类,读文献的方法大概有三档:精度;泛读;瞟一眼。


先简单总结一下阅读文献的过程:我们通过关键字搜索找到了很多文献,把它们在浏览器上打开。第一步,是最粗糙的“瞟一眼”级泛读:看标题、关键词和摘要,从而大致确认该论文和自己课题的相关性。对于相关度不高的文章(泛泛的说,对应上面分类中的5-7类),可以在此止步:简单记录后关闭,甚至不需要下载下来(可以把论文题目、doi号等关键信息粘贴到一个总结的ppt里面,需要的时候能回去搜到就行)


对于相关度较高的文章(分类中1-4类),推荐采用以下的阅读策略:


读一篇文章,不管是怎么个读法,都是从标题开始。一个好的标题,应该能够很快抓住读者,读者也很快能意识到这篇文章的细分领域、核心成果,和文章性质(实验、模拟、理论?化学、材料、物理?)


摘要是读所有文献的重中之重。一个典型的摘要,基本上是四个层次。第1-2句,点明研究的背景,通常是xxx很重要,但是xxx还不足。第3句,是核心句,一句话说明本文的亮点,或者说是核心成果,并呼应上面不足。接下来的几句,是展开来介绍本文的详细的成果——发现了什么、证明了什么、测试了什么等等。最后的1-2句是总结升华,往往会说明以上的结果对于小领域、大领域有什么科学和工程上的意义。


举个栗子:


(第一句)红烧肉是群众喜闻乐见的一种美食,口味醇厚,回味无穷。(第二句)但是烹饪红烧肉中常常遇到粘锅的现象,对此人们的理解还比较浅薄,也没有完美的解决办法。(第三句)本文中,我们研究了不同烹饪条件、锅的种类对于红烧肉粘锅的影响,并寻找出了不沾的解决办法。(第四句)我们发现…… (最后一句)本文的研究结果,不仅对于完美的红烧肉烹饪有重要的指导意义,也对于食物的处理和不粘锅的研发有很强的启示。


摘要大多是这个套路。对熟悉相关领域的读者,他们可以直奔主题,大概看摘要中的几句话,就清楚这篇文章的意义和档次了。高手也会非常擅长让读者尽快找到这个主题。当然,武林门派众多,自然有很多种摘要不是这个套路,但是据我观察,尤其是材料、化学领域,八成不会错。而物理类的文章,有的时候没有那么多门道,上来第一句就说我们发现了XYZ,而不给你讲一大堆XYZ多么有意义,也是常见的。


摘要的套路,对自己写作的时候也非常关键,需要尽可能的遵守。或许这样做听上去有些八股,但摘要的作用是让读者尽快的掌握文章主旨,因此牺牲一些文学性和灵活性常常是必要的。高手自然可以兼顾两者。


从摘要往下,就体现出来了精度和泛读的区别。先说泛读,基本上把intro每一段的第一句话看一下,然后看一下intro最后一段,再然后把几个图扫一遍,最后把conclusion看一遍。这样就在摘要的基础上,得到了更丰富、更直观的信息。特别是图,是补充摘要的最得力的手段。正所谓“一画胜千言”,一张好的图,往往抵得过你看半天的一大段话。特别是论文中的“图1”,在材化类的很多期刊中,第一张图都是一个体系示意图。而材化类的文章往往套路性很强,合成xx材料,然后展示xx性能。基本上看懂了示意图,论文的创新之处就掌握的七七八八了。


以上泛读过程,适合于除了精度以外的各类文章。如果英语六级过了,对基本概念大致熟悉,泛读一篇文献最多需要半小时。泛读与精读的区别在于,如果跟课题相关性大一些的,那看的时候更仔细一点,也要求更高一些——需要能够尽可能多的理解文章的内容和新意,应该在重点的地方做一些笔记和摘抄。而如果只是泛泛的了解一个文章,那大可以不用要求这么高。时间够的话,做一点笔记;时间不够的话,留下个印象就行。


精读,顾名思义,非常精细地读。基本上对应着上面一节讲到的第一、二类的文献,也就是和自己目前的课题密切相关的。对我们领域的课题来说,这种文献非常少,大概在你的学生生涯中能碰到一二十篇就已经很不容易了。(如果你发现许多文章都跟你密切相关,这侧面印证了你的课题非常热门,是好事儿;另一方面,也可能表明你的课题已经没啥可做的了,这就悲剧了。)


精度过程中,首先也要读摘要,然后从文章第一句开始,全文读下去。在intro那里,可以忽略一些对于你已经掌握的背景知识的介绍,比如什么是红烧肉,红烧肉怎么好吃之类的(材化类的文章第一段往往是这些)。如果你有心,可以稍微关注一下他们列参考文献的时候,都喜欢用哪几篇,如果没读过可以去看看。

Intro不能都忽略,通常第二段开始就进入了核心:为什么要研究当前的这个问题?学术界存在哪些争议?有哪些悬而未决的问题,或者哪个应用被这个问题卡住了脖子?这个地方往往能体现出作者的功力和层次,也决定了这个工作的意义和价值。高屋建瓴的作者,往往能看到很宏大的命题。他们能在很多在你看来匪夷所思、风马牛的地方把问题联系起来,而又让你觉得醍醐灌顶。在我们这种学科交叉的领域,特别是你的课题和实际应用联系不紧密的时候,这是一种特别有用的能力。因为如果一个问题对许多领域都有意义和启发,那关注的人也会多,你的工作才有意义。(另一种说法,就是很多大佬很会“讲故事”。)


因此,读intro的时候,要特别关注作者是怎么引出他的工作的:逻辑是否通顺;是否层层递进,把这个问题越写越具体;是否让读者觉得这是个真问题,而不是他为了写这个paper而凭空编造出来的假命题。(当然,这种假命题也不少,甚至顶刊也存在。从某种意义上来说,这世上本没有路,走的人多了……鲁迅说得好啊。)


Intro看完了,你应该能够明白这个工作的出发点,想解决的问题是什么,以及他们的主要发现和意义在哪里。换句话说,intro看完了,这个文章基本就懂了大半。剩下的一小半,更多的是一些技术和细节问题,以及作者如何用实打实的结果支撑他们intro中画下的大饼。


在泛读中忽略的技术和细节问题,在精读中就变成了关键!既然这篇文章跟你的课题如此相关,那么具体的细节,比如他们红烧肉是哪个部位的,锅什么牌子,盐放了多少,照片能不能看清,这些看起来很琐碎的问题,也都变得至关重要!而且这些往往能够给你很大的启发(这个图原来能这样量化!),或者解答你实验中某个困扰许久的问题(原来他们的样品是这么做的!),甚至让你沾沾自喜(我的数据比他们的好看太多了!)。所以切莫忽略文章的每一个细节。


一篇好的文章,都是在讲一个故事,仿佛有一个画面在你面前徐徐展开。随着阅读的深入,这个工作的很多细节也逐渐丰满了起来。你或许能感觉到坐到了作者对面,他在用一张张ppt给你讲他们的故事,给你解释他们发现的现象,向你娓娓道来背后的原因。


精彩的文章,在你的问题刚刚冒出来的时候,作者会恰到好处的用一个设计优美的对照实验让你酣畅淋漓。而在你刚刚被挑起了兴趣时候,就用高潮迭起的剧情让你欲罢不能。最后的结论清晰有力,又不失分寸和风度;能够睥睨天下般让你拍案叫绝,又能够虚怀若谷地坦承文中的不足和下一步需要改进的方向。这样的文章并不很常见,但是每一次看到,都让人心旷神怡,感慨这才是论文的最高水平。

5 文献读完之后


Paper读完了,面对着几页pdf上面的黄色高亮,和旁边或多或少的一些单词中文翻译,如同踢了一场精彩的足球比赛,有高潮迭起,也有悲欢离合。终场哨音吹响,你回到更衣室,这时不是庆祝,也不是休息,厉害的教练和运动员知道需要及时复盘,总结经验。因此,我建议你,眯起眼睛,掩卷沉思,回想一下这个文章,自己学到了什么?如果让你给实验室的同学用30秒钟讲完,你会说出一个什么故事?然后再从头过一遍你做下的笔记,摘录到你的文献阅读本/ppt/word里面。写下你的心得体会。这样才是一次完整的精读。


我再次强调,你的学术生涯,精读的文献非常有限(也不应该每篇文章都精读)。每一篇,都像是一次晚宴或者音乐会,你盛装出席,为之欢呼落泪,也因此成为了你学术生命中的一次难得阅历。切莫读过就忘记了,要珍藏起来,常常回想,并且建立起和自己学习工作的牢不可破的纽带,这样才不会枉费你花费的大量无价的时间和心血。


作为一名作者,若能够有一位读者精读了我的文章,甚至还给予很高评价,那简直是无与伦比的体验。假如你有机会遇到了你精读过文章的作者,不妨和她/他仔细聊聊这篇文章,告诉她/他你的收获和体会,让对方知道,她/他的努力受到了别人的关注和认可。学海无涯,破浪前行的我们,能够遇到一同泛舟的同道,是何等的幸运。


X同学,如果还有问题请继续来信。下一篇我们可以讨论如何找到合适的文献。


王威
x年x月x日

作者介绍:王威,哈尔滨工业大学(深圳)教授


推荐阅读



添加极市小助手微信(ID : cvmart2),备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳),即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群:每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~

△长按添加极市小助手

△长按关注极市平台,获取最新CV干货

觉得有用麻烦给个在看啦~  


浏览 23
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报