CVPR 2022缅怀孙剑！同济、阿里获最佳学生论文奖，何恺明入围-技术圈

新智元报道

编辑：编辑部

【新智元导读】2年没见，CVPR 2022终于来线下了，6000人参会火爆。最佳论文花落苏黎世理工，同济、阿里摘最佳学生论文桂冠。斯坦福大学教授李飞飞荣获「黄煦涛纪念奖」。此外，大会现场还播放了一段视频，缅怀孙剑博士。

6月21日，CVPR 2022正式拉开帷幕。

受疫情影响开了两年的虚拟会议之后，本届大会终于恢复了线下出席的方式。

于是，线下注册参会的人数一下子就达到了5641人，比2017年还多。

从现场发来的图片看，真可谓是人山人海。

CVPR 2022收到了来自23389名作者共8161篇投稿，相比2021年的7093篇增长15%。

其中，投稿数最多的是来自中国大陆的作者，占到了44.59%；美国则以20.65%的比例位列第二。

经过组委会3个多月细致的评审工作，大会最终接收了2064篇论文，接收率约为25.3%，高于去年的23.6%。

其中，有342篇论文被选为Oral论文，1721篇被选为Poster论文。

说到这，就不得不提一下审稿质量了。最近几年，但凡学术会议放榜，各路吐槽便会如潮水一般接踵而至。

比如，前段时间被推上风口浪尖的ICML 2022，就是LeCun投了三篇然后被拒了3篇的那个，大会的一通操作之后气得马毅教授都表示自己不会再投稿了。

对此，CVPR着重地讲解了自己的审稿机制和成果。

在审稿人的经验分布上，本届CVPR学生审稿人占比31%，教职/研究人员审稿人占比为69%。

其中，23%的审稿人参加审稿经历少于两次。参与审稿大于10次的资深审稿人占比为19%。

可以说完美践行了「老中青三结合」。

在审稿人的任务分配上，基本上年资越深的审稿人，审稿数量越多，任务越重，审稿经验大于10次的资深研究人员平均要审5.7篇，审稿经验不足两次的学生审稿人，平均只要审2篇。

学术会议的审稿人是无报酬的，为了感谢他们的无私奉献，本届CVPR评出了100多位杰出审稿人，并为他们颁发了价值100美元的礼券。

（此处有掌声）

此外，大会特别对「Rebuttal有多大用」做了统计。

数据显示，有将近3000篇的论文在Rebuttal之后，评分最高降低了0.5分，有660篇最多降低了1分。

由于分数越低，评价越高，所以总体上看，Rebuttal对于论文被接受还是起到了正面作用的，当然凡事有风险，Rebuttal之后评价变得更差的也有2000多篇。

本届CVPR大会的审稿流程如下：

每篇论文会由3位AC一起处理，包括至少一位资深AC和至少两位领域内专家，AC的分配由自动匹配产生。

每篇论文至少分配3位审稿人，其中至少两位为主AC推荐，主AC负责主持审稿人会议讨论。

AC之间召开线上会议详细讨论审稿人的意见，并相互审核报告，核查错误，向作者发出通知。

另外，会议还为所有AC和审稿人准备了关于审稿的培训材料。

CVPR 2022 Awards

最佳论文奖：

「Learning to Solve Hard Minimal Problems」

论文地址：https://openaccess.thecvf.com/content/CVPR2022/papers/Hruby_Learning_To_Solve_Hard_Minimal_Problems_CVPR_2022_paper.pdf

机构：苏黎世联邦理工学院、华盛顿大学、佐治亚理工学院、捷克理工大学

本文提出了一种在RANSAC框架内解决困难几何优化问题的方法。这类问题涉及将原始的几何优化问题放宽为具有许多假解的最小问题。本文提出的方法避免了计算大量的假解。本文提出了一个学习策略，用于选择可以在数值上延续原始问题，以及感兴趣的解决方案的起始问题-解决方案对。

本文通过RANSAC求解器来证明了这一方法，该求解器用于计算三个经过校准的相机的相对位置，通过每个视图中的四个点进行最小松弛化。平均可在70微秒内解决一个问题。

最佳论文荣誉提名：

「Dual-Shutter Optical Vibration Sensing」

论文地址：

https://openaccess.thecvf.com/content/CVPR2022/papers/Sheinin_Dual-Shutter_Optical_Vibration_Sensing_CVPR_2022_paper.pdf

机构：卡内基梅隆大学

视觉振动测量是一种非常有用的工具，可用于远程捕捉音频、材料物理属性、人体心率等。虽然视觉上可观察的振动可以通过高速相机直接捕捉，但通过将激光束照射振动表面所产生的散斑图案的位移成像，可以从光学上放大微小且不易察觉的物体振动。

本文提出了一种新的方法，用于感知高速（高达63kHz）的振动，可以同时感知多个场景源，使用的传感器额定工作频率仅为130Hz。

该方法依赖于同时用两个分别装有滚动和全局快门传感器的相机来捕捉场景。滚动快门相机捕捉扭曲的斑点图像，对高速物体的振动进行编码。全局快门相机捕捉斑点图案的未扭曲图像作为参考。研究人员通过捕捉由音源（如扬声器、人声和乐器）引起的振动，分析音叉的振动模式，展示了这种新方法。

最佳学生论文奖：

「EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation」

论文地址：

https://openaccess.thecvf.com/content/CVPR2022/papers/Chen_EPro-PnP_Generalized_End-to-End_Probabilistic_Perspective-N-Points_for_Monocular_Object_Pose_Estimation_CVPR_2022_paper.pdf

机构：同济大学、阿里巴巴集团

通过Perspective-n-Points（PnP）从单一的RGB图像中定位3D物体是计算机视觉中一个长期存在的问题。在端到端深度学习的驱动下，最近的研究建议将PnP解释为一个可微分层，可以通过反向传播物体姿势的梯度，来部分学习2D图像和3D空间点的对应关系。然而，如果从头开始学习整个无限制的2D-3D点集，在现行方法中无法收敛，因为确定的姿势本身就是不可微的。

本文提出了Pro-PnP，一个用于一般端到端姿势估计的概率PnP层，它可以输出SE(3)流形上的姿势分布，实际上将分类Softmax带入连续域。2D-3D坐标和相应的权重被视为中间变量，通过最小化预测和目标姿势分布之间的KL散度来学习。其基本原理统一了现有的方法，类似于注意力机制。

EPro-PnP的效果明显优于现有基准，在LineMOD 6DoF姿势估计和nuScenes三维物体检测基准上，缩小了基于PnP的方法与特定任务最佳性能之间的差距。

最佳学生论文荣誉提名：

「Ref-NeRF: Structured View-Dependent Appearance for Neural Radiance Fields」

论文地址：https://arxiv.org/pdf/2112.03907.pdf

机构：哈佛大学、谷歌研究院

神经辐射场（NeRF）是一种流行的视图合成技术，它将场景表示为一个连续的体积函数，由多层感知器来提供每个位置的体积密度和随视线变化的发射辐射的参数。虽然基于NeRF的技术擅长表现具有平滑变化的视线依赖性外观的精细几何结构，但往往不能准确捕捉和再现有光泽表面的外观。

本文通过引入Ref-NeRF来解决这个问题。Ref-NeRF用反射辐射的表示方法取代了NeRF的视线依赖性出射辐射的参数化，并使用一系列空间变化的场景属性来构造这一函数。

结果表明，与法线向量的正则器相结合，新模型大大提升了镜面反射的真实性和准确性。此外，本文的模型对出射光度的内部表示是可解释的，对场景编辑很有用。

33篇最佳论文入围名单

入围名单里的第一篇就是何恺明的MAE，但很遗憾，没最后并没有被评上。

早在2021年MAE横空出世之时，何恺明就被大家寄予厚望。

全国物理、化学竞赛一等奖，保送清华，高考满分，微软亚洲研究院实习，CVPR最佳论文奖首位华人得主...

可以说，这些傲人的履历随便拿出来一个都能秒杀大部分同龄人。

虽然这次何恺明没有拿下本届CVPR最佳论文，但他在未来一定会取得更大的成绩。

Longuet-Higgins奖

Longuet-Higgins奖由IEEE的PAMI（模式分析和机器智能，pattern analysis and machine intelligence）技术委员会，每年在CVPR论坛上发布，旨在表彰对CV（计算机视觉）领域的研究产生重大影响的CVPR论文。

该奖以理论化学家和认知科学家H. Christopher Longuet-Higgins的名字来命名，获奖者由TCPAMI奖项委员会指定的另一个委员会来决定。

今年，Longuet-Higgins奖由Andreas Geiger等三位作者写的论文「我们准备好迎接自动驾驶了吗？——KITTI视觉基准组件」获得。三位作者中，Geiger和Lenz来自卡尔斯鲁厄理工学院，而Urtasun则来自丰田工业大学芝加哥分校。

在这篇论文中，三位研究者使用自己开发的自动驾驶平台为为立体、光流、视觉测程 / SLAM 和 3D 目标检测等任务开发了一个新基准。

其中，研究人员的记录平台配备有四个高分辨率视频相机、Velodyne激光扫描仪，以及SOTA级别的本地化系统。

青年研究者奖

青年研究者奖同样由PAMI技术委员会颁发，评选过程由PAMI-TC奖项委员会进行管理。获奖者也会在CVPR会议上公布。

今年的获奖者有两位，分别是Bharath Hariharan和Olga Russakovsky。

Hariharan是康奈尔大学计算机科学系的助理教授，主要从事CV和ML方面的工作，尤其是那些无视「大数据」标签的重要问题。

他喜欢解决将机器学习的进步与计算机视觉、几何和特定领域知识相结合的问题。

目前，Hariharan的团队正在构建一个可以在很少或没有监督的情况下学习数以万计的视觉概念的系统，并产生详尽的输出，例如精确的3D形状等等。

Russakovsky是普林斯顿大学计算机科学系的助理教授，研究方向也聚焦在CV领域。

黄煦涛（Thomas S. Huang ）纪念奖

黄煦涛纪念奖于2020年开始设立，从2021年开始，每年在CVPR大会上颁发一次，旨在表彰在研究、教学与指导和为CV社区服务方面公认为典范的研究人员。

该奖项是为了纪念已故的黄煦涛教授而设立的，他是一位在CV和图像处理等多个领域做出大量贡献的先驱学者。同时，他也是为几代人的成长做出贡献的榜样。

该奖项每年颁发给博士毕业后至少7年的研究人员，最好是职业生涯中期（博士毕业不能超过25年）。

该奖的候选人考虑CV领域的所有研究人员。最终奖励包括3,000美元现金奖励和一块奖牌。

本次黄煦涛纪念奖的获奖者是斯坦福大学计算机科学系首任红杉教授李飞飞。

2013~2018年，她担任了斯坦福大学人工智能实验室主任。2017年1月至2018年9月这段时间，她还担任了谷歌副总裁，在谷歌云担任人工智能与机器学习的首席科学家。

李飞飞博士致力于研究启发式AI、机器学习、深度学习、计算机视觉，以及AI+医疗保健。

此外，她还研究过认知和计算神经科学。

她曾在Nature、PNAS、CVPR、ICCV、ECCV、ICRA等大量顶刊和顶会上发表了200多篇论文。

她还是ImageNet和ImageNet Challenge的发明者，这是一种大规模数据集和基准测试工作，为深度学习和人工智能的最新发展做出了巨大贡献。

除了她在技术上的成就，她还是STEM的倡导者，AI多样性的全国代言人。她致力于提高人工智能教育的包容性和多样性。

缅怀孙剑博士

2022年6月14日凌晨，旷视首席科学家孙剑离世。

CVPR 2022大会现场，在公布最佳论文之前，缅怀了孙剑博士。

现场一段视频带领大家一起回忆了孙剑博士科研成长之路。

最后，人工智能社区的大牛、以及孙剑的亲朋好友纷纷写下了对孙剑博士的悼念信。

参考资料：

https://twitter.com/CVPR