当我们谈科学研究的创新性时，我们在谈些什么？—

↑ 点击蓝字关注极市平台

作者丨Michael J. Black

来源丨AI科技评论

编辑丨极市平台

极市导读

我们该怎么定义这个“真有两把刷子”？可能会有很多审稿人说，“当然是看这个工作够不够创新喽。” 这没毛病，但我想追问下去：什么是创新的科学研究？>>加入极市CV技术交流群，走在计算机视觉的最前沿

对于CVPR这样的顶会，一篇投稿到底该不该中，审稿人往往是有很强烈的主观意愿的。好似心中有一条金线，达到了就是达到了，没达到就是没达到。这条金线标准蛮高的，最终能顺利过线的工作，真得有两把刷子才行。那么问题来了，我们该怎么定义这个“真有两把刷子”？可能会有很多审稿人说，“当然是看这个工作够不够创新喽。” 这没毛病，但我想追问下去：

你给我翻译翻译，什么是创新的科学研究？

对于各式各样的审稿人，我是身经百战见的多了。当他们谈“创新”的时候，其实谈的是“复杂”，“难度”，以及“技术含量”。似乎必须得有这些元素，一篇工作才能算创新。所以呢，我想我们或许可以换个词

“新不新” “妙不妙” √

“妙”或者说“美感”这样的表述，可以帮我们摒弃掉那些关于方法复杂性和技术含量的讨论，直达科学创新的本质。哪怕其创作技法很简单，一幅画依然可以是美的，学术论文也是一样的道理。伦勃朗丰富的细节和色彩是一种美，毕加索看似简单的曲线构图，也是另一种美。

现在，有了“妙不妙”这个指标，我们可以重新审视一下，那些审稿人对创新性的典型误解:

复杂就是新

审稿人常把“简单的思路”和“没有创新性”混为一谈，但事实往往并非如此。有一种常见的审稿意见:

这个思路太简单了，只在目标优化方程的一项上动了动手脚，其他地方和之前的工作一模一样。

如果之前的确没人打过这一项的主意，那么这个改动就是事实上的创新。这个创见的真正价值在于，通过主动的思索找到了这个命门 ——— 一个稍微改动就可以带来明显效果提升的命门。最终基于此，构建出了简约的解决方案。（译者按：福特斯坦门茨的故事，“画一条线，1美元，知道在哪里画线，9999美元。”）

这类审稿意见的存在，让我的学生们觉得，他们得把方法弄的复杂一点才能博得审稿人的青睐。但我觉得简约比没必要的繁冗更有价值。越简单越好。比起咔咔整一个“为了复杂而复杂”的模型，在一个已有模型上略加改动就有所提升，更妙一些。

难就是新

中顶会可太难了。所以审稿人就常觉得，一个工作，无论是思路还是技术方案，得看起来有点难度有点门槛才好。仿佛文章作者必须得呕心沥血鞠躬尽瘁，这文章才配被录用。尤其是那些小白审稿人，特偏爱那种看起来颇费周折才能做出来的文章。

但一个简约的思路，往往意味着删繁就简，去糟取精，直捣黄龙。这才是科学家该干的事儿。

一个简单的思路，可以意义重大，当然，也有一定几率确是一个无足轻重的改进。这就考验审稿人的水平了，如果一篇论文提了一个很小的点，但这个点直击症结，取得了其他类似方法都难以望其项背的效果。那么这个微创新，就很有可能不是无足轻重的那种，这工作录用了，整个领域都会受此启发。

离谱就是新

不走寻常路往往就是创新之路。甚至从定义上来说，创新就是离经叛道，一条未曾有人涉足的道。但这种惊喜的感觉，往往是转瞬即逝的，当听到一个很棒的主意，你觉得格局大开，但慢慢地，你会认为这个主意“理所当然”，而且往往是，想法越屌，大家就越容易认为它“理所当然”。比如这个很典型的审稿意见：

这不是很显而易见嘛，这不就是A+B?

理所当然是创新的反义词，所以，如果听完后觉得一个思路理所当然，审稿人往往就会草草下“创新性不够”的结论。但你应该站在一个过去式的视角来看待这个问题，没审这篇文章之前，你能“理所当然”地想到要这么干嘛？能第一个想到应该这么干，然后干出来了，这本身就是创新。所以，无论是解释起来很容易，还是一切看起来理所当然，都无损于想法本身的创新性。

技术含量就是新

审稿人最常见的错误观念，就是觉得创新性和技术细节是绑定在一块的。创新性不光指方法论，它可以有很多表现形式，如果一个数据集有一些已有数据集没有的新特性，哪怕采集制作这个数据集用到的方法没新意，这个数据集本身也是创新的。方法论也一样，旧瓶装新酒也可以啊，只要别人没想过原来你可以这么装。就是单纯把一个复杂的模块简单化，也可以给人启发。

创新性就像刚才说的“妙”这个词一样，是可以横看成岭侧成峰，远近高低各不同的。在你批评一个工作没有技术创新的时候，扪心自问一句，是不是管中窥豹，格局小了。

有用就是新

不是所有创新都有用处的。它们只是新而已，并不一定真有什么实用价值。但这些可能没什么卵用，但又着实新奇的脑洞，可能会把我们引到一些未曾设想的道路上。所以，审稿人得格外小心一点。我们很难洞悉这些所谓的“歧途”会把领域引向未知的何处，得承认自己的局限性，我们现在做的各种预测，说白了，也还是跳不出当下现状的窠臼。比如，我常常会看到这样的审稿意见：

作者提了一个方法，然而这一切并没有任何卵用

“没有卵用”确实是一个问题，但如果要用这个词来评价一个新脑洞，还是有点操之过急了。审稿人心里要有X数，要有敬畏心理，不要对自己的想象力有过高的估计。

一点人生经验

我早期的研究，主要是把鲁棒性统计 (Robust Statistics) 和马尔科夫随机场 (Markov Random Field) 联系了起来，如果说有点创新性，那就是之前确实没人想过可以这么干。但这套A+B的打法可以搞出来很多有意思的玩意儿，做大了学术的蛋糕，基于此，也延伸出一些新的理论。我很幸运，尽管开始做的时候没太考虑实用性的事，但现在重新回看这些工作，它们的价值已然显现，之后诸多效果拔群的实用算法都受此启发。

站在事后诸葛亮的角度，你当然可以说，鲁棒性检测和计算机视觉科学的关联是“显而易见的”。现在，在计算机视觉任务中使用鲁棒检测器，已然是标配，并不比呼吸新鲜到哪里去。但站在当年那个的时间点，当那个第一个吃螃蟹的人，却是小婴儿喘的第一口气。

人一辈子，会有很多次让你兴奋的时刻，但没有哪一种兴奋，可以比得上智性的火花划破科学长空的那一霎。一切如惊鸿般短暂，却像夏花一般绚烂。

“众里寻她千百度，蓦然回首，那人却在灯火阑珊处”。

灵光一现，你仿佛有了二郎神的第三只眼，获得了一种全新的洞察世界的角度。你独自屹立在世界尽头的山巅，领略了前人从未曾欣赏过的风景，这就是创见的力量。闪念的火花，转瞬即逝，但为了一次又一次追逐这一刹那的火花，我已然在科学的路上颠沛流离了一生。

最后需要做的，只不过是把这个抽象的闪念，翻译成具象的代码，实验以及文字。在这个过程中，美妙的思维火花可能只是隐隐约约地闪烁在脑海。而我对诸位审稿人的请求，即是共情，想象你就是撰稿人，正处在火花飞扬前的黑夜。

公众号后台回复“数据集”获取30+深度学习数据集下载～

△点击卡片关注极市平台，获取最新CV干货

极市干货

数据集资源汇总：10个开源工业检测数据集汇总｜21个深度学习开源数据集分类汇总

算法trick：目标检测比赛中的tricks集锦｜从39个kaggle竞赛中总结出来的图像分割的Tips和Tricks

技术综述：一文弄懂各种loss function｜工业图像异常检测最新研究总结（2019-2020）

# CV技术社群邀请函 #

△长按添加极市小助手

添加极市小助手微信（ID : cvmart4）

备注：姓名-学校/公司-研究方向-城市（如：小极-北大-目标检测-深圳）

即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群

每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~

觉得有用麻烦给个在看啦~

当我们谈科学研究的创新性时，我们在谈些什么？——给审稿人的一封信