计算机视觉研究生文献和复现哪个更重要?
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
本文转自|计算机视觉联盟
计算机视觉研究生文献和复现哪个更重要?
作者:鑫鑫淼淼焱焱
https://www.zhihu.com/question/381154035/answer/1285356371
首先,论文阅读和复现代码同等重要。
从楼主的描述可以知道,楼主目前是编程和算法的初学者,两方面都是刚刚入门,对你来说,你的导师对你很 push,给你的压力很大,所以你可能希望能先解决其中一个问题,比如先系统学好 python,或者先好好看论文,了解对应领域的基础知识理论等等。
但是阅读论文和复现代码都是同样重要的。
论文阅读
阅读论文让你能了解研究领域的基础理论、经典算法以及领域最新研究成果,更重要的是通过看论文,给你提供思想和方法论,你觉得自己想不出新的算法,对初学者很正常,这种时候确实就需要多看论文,特别是看作者的动机,Motivation,建议楼主可以带着下面这些问题来阅读一篇论文:
作者想解决什么问题?
作者通过什么理论/模型来解决这个问题?
作者给出的答案是什么?
作者为什么研究这个课题?
目前这个课题的研究进行到了哪一阶段
作者使用的理论是基于哪些假设?
这篇文章存在哪些缺陷?
作者关于这个课题的构思有哪几点?
楼主说到看一篇论文需要 1 天半的时间,这个速度其实是很正常的,当初我读研的时候,看论文的速度可能更慢,一方面是存在很多专有名词,很多单词分开你都懂,但是组成一个句子就不知道是什么意思;另一方面,不少算法涉及很多数学公式,要读懂这些数学公式也需要花一些时间,特别是数学基础薄弱。
代码复现
关于代码复现部分,楼主希望有时间系统学习 pytorch 的内容,而不是把时间花在 debug 别人代码。
其实很多编程初学者都会有这样的想法,等我好好系统学完编程的课程了,我再来进行编程实战项目,但更好的做法应该是边学边做,学以致用。
事实上,楼主你看别人的代码就是一个很好学习编程,学习 pytorch 这个框架的过程,你可以看看别人是如何用 pytorch 来实现他的算法,然后记录一些有用的代码,这些你后续要实现自己代码的时候,都是非常有用的。
当然还有看看别人的整个代码结构,怎么组织整个算法的项目代码,当然有的论文作者的代码其实写得一般,也没有好好重构,但是一些大公司出品的代码,那就是非常值得学习,比如 pytorch的预训练模型 github 项目:
https://github.com/Cadene/pretrained-models.pytorch
https://www.zhihu.com/question/381154035/answer/1094056196
https://www.zhihu.com/question/381154035/answer/1095912052
交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~