22年CV顶会前沿论文带读，安排妥妥的！🤼-技术圈

导读：在炼丹界中，快速刷论文了解一下最前沿研究已经是每个炼丹师的必备技能了

随着计算机视觉近年来的爆发性成长，相关的论文著作更是层出不穷。尤其是CV下的各大顶会新出的论文，往往更是当年Al发展的风向标。

为了让自己的知识不过时，随时跟进顶会论文，洞悉计算机视觉领域大牛们的最新动态，也是从业者们也都要保持学术思维和习惯。

可是，对许多初学者来说，读论文是件痛苦的事儿。他们可以很容易地通过网络下载到最前沿的研究论文，但学术论文有自己的一套规范，没有经过一定的训练，很可能会浪费很多时间在琢磨怎么读懂一篇篇的论文上，因为论文作者们都默认你自己就会了。如果读起来都吃力的话，那就更谈不上自己编写了。

▋那么该读什么样的论文，以及如何阅读论文才能真正吸收精华？

考虑到很多学员在读CV顶会前沿论文都会有一些难题，比如难以紧随最新发展方向、系统学习，在发表论文之前，资料匮乏或者觉得顶会论文写法晦涩深奥，百思莫解等等问题。

七月在线特推出本中级的《CV顶会前沿paper带读班》，名师引领，深入剖析：21/22年顶会24篇前沿论文。

开课时间：7月31日

详情请扫码加(或七月在线任一老师)咨询

带

读

论

文

➤ 第一篇谷歌大脑：开启Transformer在计算机视觉独霸一方的鼻祖：ViT

Vision Transformer：An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

➤ 第二篇苹果公司：轻量级移动网络霸主的自我更新：MobileViT

MobileViT: Light-weight, General-purpose, and Mobile-friendly Vision Transformer

➤ 第三篇 FAIR(Facebook AI研究院)：何恺明大神最新佳作，75%损失的图像重构：MAE

MAE：Masked Autoencoders Are Scalable Vision Learners

➤ 第四篇 NLP大佬BERT的跨界视觉下预训练模型

BEiT: BERT Pre-Training of Image Transformers

➤ 第五篇字节跳动首发：视觉任务的大规模预训练方法

iBOT: Image BERT Pre-Training with Online Tokenizer

➤ 第六篇微软亚洲研究院：2021 ICCV Best Paper

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

➤ 第七篇微软亚洲研究院：野心膨胀后的swin，目标一统CV江湖：识别、检测、分割

Swin Transformer V2: Scaling Up Capacity and Resolution

➤ 第八篇 OpenAI：多模态学习，超大规模模型预训练提取视觉特征

CLIP: Connecting Text and Images - OpenAI

➤ 第九篇 SaleForce：超越CLIP，统一视觉语言理解和生成

BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation

➤ 第十篇香港大学：卷积网络与Transfomer在计算机视觉领域大碰撞

ConvNets vs. Transformers: Whose Visual Representations are More Transferable?

➤ 第十一篇 FAIR(Facebook AI研究院)：20世纪20年代大爆发的卷积神经网络

ConvNeXt: A ConvNet for the 2020s

➤ 第十二篇卡内基梅隆大学：拒绝Transformer，卷积还是王道

Patches Are All You Need?

➤ 第十三篇新加坡国立大学：横扫CV多项记录(识别、检测、分割)，首个超越87%的模型

VOLO: Vision Outlooker for Visual Recognition

➤ ‍第十四篇清华大学：细粒度手势重构

Intaghand: Interacting Attention Graph for Single Image Two-Hand Reconstruction

➤ 第十五篇都灵理工大学：充分利用时空Transformer的基于骨骼数据集的行为识别与分析

Skeleton-based Action Recognition via Spatial and Temporal Transformer Networks

➤ 第十六篇至第二十四篇待报名学员一一提供，已报名学员想读哪篇，则精读哪篇

超

强

讲

师

课

程

优

势

优势1：算法与论文齐头并进

授课教师会预先根据计算机视觉领域的最新科研发展在当下各顶会中筛选出一系列论文，深入发掘各算法内在创新点与知识点，且更进一步逐句分析论文中各段落、语句之间的关系，算法创新模型与科研论文创作技巧并学，以深厚的SCI英文论文写作功力和深耕多年的科研经验带领大家层层闯关。

优势2：精度哪篇?学员决定!

第十五篇之外，学员可向授课教师反馈下一阶段感兴趣但晦涩艰深的顶会论文，邀请授课教授对其精细带读讲解。在这种前所未有的顶会论文的双向选择模式下，学员敢挑战，我们敢迎接，共同把握当下、抓住前沿、与时俱进!

优势3：领读人和论文同样精挑细选

由在计算机视觉领域耕耘多年的研究员(博士)带着精读，同时具备工业界和学术界双重资历，并有着SCl论文审稿经历，可充分把握计算机视觉发展的风向标。

优势4：全方位剖析，拒绝泛泛而读

针对每篇论文，除了最基本的算法模型讲解外，更将从这些方面来深入剖析:论文价值、泛读/精度的方法策略、写作方法策略、经典架构再现、复现思路、代码分析、未来改进计划。

适

合

人

群

1、硕博生/高校老师/科研人员想发高质量论文甚至顶会，但还不具备发表能力的(当然，如果已经具备发表能力的，则可以看下高级的1Vl发表辅导班)

2、自行读顶会论文效率不高的，比如觉得顶会涉及理论盘根错节，难以理清，或者创新优化方案神乎其神、匪夷所思，再或者平台新增论文种类繁多，不好辨别

3、大厂算法/研究型人才，经常需要读顶会前沿paper

上

课

方

式

「添加助教老师

即可咨询带读课详情」

同时针对于已发表过相关论文或想要发表更高层次(如:顶会)论文的同学建议大家可以参加一下七月在线的七月在高级的『AI学术论文1Vl发表辅导(名师全程辅导El/ei/SCl/各顶会)』。

一对一管家式服务，全程辅导，围绕“国内期刊、EI会议/ei期刊、SCI四区到SCl一区/CCF ABC三类、AI各顶会”做全程辅导，包括且不限于课题确定、创作、修改、投递、发布等等，从而在导师辅导下学员独立自主创作至成功发表；

且老师都是国内外知名高校博士毕业且具备强大学术背景的师资团队，针对不同群体不同的诉求提供整体解决方案。

上下滑动查看更多↑↑↑

同时在学员在发表第一篇的过程中，让学员掌握—套成体系的论文发表方法/策略/流程，为后续成为会议/paper收割机打下坚实基础。

22年CV顶会前沿论文带读，安排妥妥的！🤼

▋那么该读什么样的论文，以及如何阅读论文才能真正吸收精华？

Vision Transformer：An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

➤ 第二篇 苹果公司：轻量级移动网络霸主的自我更新：MobileViT

➤ 第十六篇至第二十四篇 待报名学员一一提供，已报名学员想读哪篇，则精读哪篇

➤ 第二篇苹果公司：轻量级移动网络霸主的自我更新：MobileViT

➤ 第十六篇至第二十四篇待报名学员一一提供，已报名学员想读哪篇，则精读哪篇