CVPR2022:华人学生斩获最佳学生论文,特设缅怀孙剑博士环节
大数据文摘授权转载自AI科技评论
作者:王玥
编辑:陈彩娴
新奥尔良当地时间6月21日上午8:30,计算机视觉领域公认三大顶级会议之一CVPR 2022开幕。
CVPR开幕式伊始,由大会主席Jiri Matas致辞,并介绍了本次大会的4位主席及5位程序主席。
值得一提的是,本次大会有两位华人主席,分别是主席权龙(Long Quan,上排右二)与程序主席华刚(Gang Hua,下排左二)。
接下来主席Jiri Matas介绍了CVPR 2022的投稿情况:
本届CVPR一共收到8161份论文投稿,接受论文2064份,截止2022年6月20日有9981位出席者注册,且实地出席与网络出席几乎各占50%。
接下来程序主席华刚介绍道,CVPR的投稿和接收的论文呈现出每年15%的涨势。华刚博士畅想道,随着这样的涨势,也许有朝一日地球上每个人都会投稿一篇论文(笑)。
本届CVPR投稿的8161篇论文由23389位作者投递,其中44.59%的作者来自中国,20.75% 的作者来自美国。
华刚博士继续介绍道,本届接收了2064篇论文,接收率为25.3%。
考虑到网络出席与实体出席参半的情况,本届CVPR将以混合方式举行。其中将实体会议将举行344场5分钟时长的口头报告以及2064个海报研讨。
本届CVPR的300位AC(Area Chair)来自于北美、欧洲、亚洲、澳大利亚及南美。其中有55位女性,101位首次担任AC一职。
缅怀孙剑博士
由于此前孙剑博士因病去世,本次CVPR特地设置了怀念孙剑博士环节,由程序主席华刚带领全场缅怀这位杰出学者。
图注:大会缅怀孙剑博士页面
孙剑博士于1976年10月出生,曾任微软亚研院首席研究员,此前他曾两次获CVPR最佳论文奖。
2016年7月,孙剑正式加入旷视,任首席科学家、旷视研究院院长,主导旷视技术研发。在他的带领下,旷视研究院推出了多项具有代表性的工作。
Google Scholar数据显示,孙剑博士论文引用量达到286002次,h-index为121。
图注:孙剑博士的Google Scholar页面
程序主席华刚博士介绍道,作为CV领域的知名学者,孙剑博士研究成果硕果累累。如果要说出孙剑博士的三篇论文代表作,那么第一篇他认为应该是"Stereo matching using belief propagation"。
论文链接:
https://ieeexplore.ieee.org/abstract/document/1206509
第二篇则是他带领团队完成的“去雾”论文“Single Image Haze Removal Using Dark Channel Prior",也正是这篇论文获得了亚洲第一个CVPR最佳论文奖。
论文链接:
https://pubmed.ncbi.nlm.nih.gov/20820075/
第三篇则是“Deep Residual Learning for Image Recognition”。正是这篇论文提出了他最为人所熟知的成就——与何恺明等团队成员携手创造出的残差网络ResNet。ResNet在2015年提出之后,拿下过ImageNet冠军,并斩获了CVPR 2016最佳论文奖。
残差神经网络的主要贡献是发现了“退化现象(Degradation)”,并针对退化现象发明了 “快捷连接(Shortcut connection)”,极大的消除了深度过大的神经网络训练困难问题。正是由于ResNet,神经网络的深度首次突破了100层、最大的神经网络甚至超过了1000层。
论文链接:
https://arxiv.org/abs/1512.03385
在华刚博士介绍后,大会上播放了孙剑博士的亲友及同事们所制作的纪念视频,借以怀念这位良师与益友。
颁奖环节
本届黄煦涛纪念奖(Thomas Huang Memorial Award)由 李飞飞获得。
黄煦涛纪念奖以计算机视觉领域泰斗黄煦涛命名,其设立是为了表彰在计算机视觉领域长期提供服务、研究和指导的杰出人士。
论文链接:
https://arxiv.org/abs/2112.03907
最佳学生论文荣誉提名的是《Ref-NeRF:Structured View-Dependent Appearance for Neural Radiance Fields》。
神经辐射场(NeRF)是一种流行的视图合成技术,其能够将场景表示为一个连续的体积函数,由多层感知机参数化,提供每个位置的体积密度和视相关的辐射亮度。虽然基于NeRF的技术擅长于表示具有平滑变化的视相关外观的精细几何结构,但它们往往不能准确地捕捉和再现光滑表面的外观。而这篇论文通过引入Ref-NeRF来解决这个限制问题,Ref-NeRF取代了NeRF的参数化视相关的出射辐亮度与反射辐亮度的表示,并使用一组空间变化的场景属性来构造这个函数。
论文链接:
https://arxiv.org/abs/2203.13254
代码地址:
https://github.com/tjiiv-cprg/epro-pnp
获得最佳学生论文的是《EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation》,可以见到这篇论文全部由华人作者合作完成。
其中,第一作者Hansheng Chen来自同济大学。
这篇论文称,通过n点透视(Perspective-n-Points, PnP)从单个RGB图像中定位3D物体是计算机视觉中一个长期存在的问题。在这篇论文中,作者提出了EPro-PnP,这是一种用于广义的端到端姿态估计的概率PnP层,这种PnP层输出在SE(3)流形上的姿态分布,本质上将分类Softmax引入连续域。
论文链接:
https://openaccess.thecvf.com/content/CVPR2022/papers/Sheinin_Dual-Shutter_Optical_Vibration_Sensing_CVPR_2022_paper.pdf
而最佳论文荣誉提名的是《Dual-Shutter Optical Vibration Sensing》。
在这篇论文中,作者团队提出了一种新颖的方法,可以使用额定仅为130Hz的传感器感知多场景中的高速震动(高达63kHz)。
论文链接:
https://arxiv.org/abs/2112.03424
代码地址:
https://github.com/petrhruby97/learning_minimal
本届CVPR获得最佳论文奖的是《Learning to Solve Hard Minimal Problems》。
这篇论文提出了一种在RANSAC框架下求解困难几何优化问题的方法。原来的几何优化问题放宽会产生具有许多伪解的最小问题,而这篇论文提出的方法避免了计算大量的伪解。
视频链接: