7 Papers & Radios | CVPR 2022最佳/最佳学生论文;大型语言模型教会智能体进化
数据派THU
共 7850字,需浏览 16分钟
·
2022-07-16 20:37
来源:机器之心 本文约3700字,建议阅读5分钟 本周重要论文包括:CVPR 2022各种获奖论文。
Learning to Solve Hard Minimal Problems Dual-Shutter Optical Vibration Sensing EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation Ref-NeRF: Structured View-Dependent Appearance for Neural Radiance Fields Self-supervised Transparent Liquid Segmentation for Robotic Pouring Neural Label Search for Zero-Shot Multi-Lingual Extractive Summarization Evolution through Large Models ArXiv Weekly Radiostation:NLP、CV、ML 更多精选论文(附音频)
作者:Petr Hruby等 论文链接:https://arxiv.org/abs/2112.03424
推荐:CVPR 2022 最佳论文。
论文 2:Dual-Shutter Optical Vibration Sensing
作者:Mark Sheinin 等
论文链接:https://openaccess.thecvf.com/content/CVPR2022/papers/Sheinin_Dual-Shutter_Optical_Vibration_Sensing_CVPR_2022_paper.pdf
摘要:视觉振动测量是一种非常有用的工具,可用于远程捕捉音频、材料物理属性、人体心率等。虽然视觉上可观察的振动可以通过高速相机直接捕捉,通过将激光束照射振动表面所产生的散斑图案的位移成像,可以从光学上放大微小且不易察觉的物体振动。
在本文中,研究者提出了一种在高速(高达 63 kHz)下同时检测多个场景源振动的新方法,该方法使用额定工作频率仅为 130Hz 的传感器。他们的方法使用两个分别配备滚动和全局快门传感器的相机来同时捕捉场景,其中滚动快门相机捕捉到对高速物体振动进行编码的失真散斑图像,全局快门相机捕捉散斑图案的未失真参考图像,从而有助于对源振动进行解码。最后,研究者通过捕捉音频源(如扬声器、人声和乐器)引起的振动并分析音叉的振动模式,展示了他们的方法。
作者:Hansheng Chen 等 论文链接: https://arxiv.org/pdf/2203.13254.pdf
作者:Dor Verbin 等 论文链接: https://arxiv.org/pdf/2112.03907.pdf
作者:Gautham Narasimhan 等 论文链接: https://arxiv.org/pdf/2203.01538.pdf
作者:Ruipeng Jia 等 论文链接: https://aclanthology.org/2022.acl-long.42.pdf
作者:Joel Lehman 等 论文链接:https://arxiv.org/abs/2206.08896
评论