图神经网络也能用作CV骨干模型,华为诺亚ViG架构媲美CNN、Transformer
视学算法
共 3353字,需浏览 7分钟
·
2022-06-27 16:51
机器之心编辑部
华为诺亚实验室的研究员发现图神经网络(GNN)也能做视觉骨干网络。将图像表示为图结构,通过简洁高效的适配,提出一种新型视觉网络架构 ViG,表现优于传统的卷积网络和 Transformer。在 ImageNet 图像识别任务,ViG 在相似计算量情况下 Top-1 正确率达 82.1%,高于 ResNet 和 Swin Transformer。
论文链接:https://arxiv.org/abs/2206.00272 PyTorch 代码:https://github.com/huawei-noah/CV-Backbones MindSpore 代码:https://gitee.com/mindspore/models/tree/master/research/cv/ViG
点个在看 paper不断!
评论