Multi-modal Multi-task Masked Autoencoder:一种简单、灵活且有效的 ViT 预训练策略
数据派THU
共 1195字,需浏览 3分钟
·
2022-05-14 17:56
来源:Deephub Imba 本文约1000字,建议阅读4分钟
本文介绍了一种简单、灵活且有效的Vit预训练策略。
评论
共 1195字,需浏览 3分钟
·
2022-05-14 17:56
来源:Deephub Imba 本文约1000字,建议阅读4分钟
本文介绍了一种简单、灵活且有效的Vit预训练策略。