认识人和鱼的AI,能识别美人鱼吗?阿里CVPR论文试用因果推理方法解答
来源:机器之心 本文约5000字,建议阅读10分钟
近期,阿里巴巴达摩院将因果推理方法引入计算机视觉领域,尝试克服机器学习方法的缺陷。
我们提出的 GCM-CF 是一个见过 / 未见过类别的二元分类器,二元分类后可以适用任何监督学习(在见过类别上)和零次学习算法(在未见过类别上); 我们提出的反事实生成框架适用于各种生成模型,例如基于 VAE、GAN 或是 Flow 的; 我们提供了一种易于实现的两组概念间解耦的算法。
β-VAE loss:这个 loss 要求 encode 得到的 Z=z(x),和样本自己的 Y=y,可以重构样本 X=x,并且 encode 出来的 Z 要非常符合 isotropic Gaussian 分布。这样通过使 Z 的分布和 Y 无关实现解耦; Contrastive loss:反事实生成的样本中,x 只和自己类别特征生成的样本像,和其他类别特征生成的样本都远。这个避免了生成模型只用 Z 里面的信息进行生成而忽略了 Y,从而进一步把 Y 的信息从 Z 里解耦; GAN loss:这个 loss 直接要求反事实生成的样本被 discriminator 认为是真实的,通过充要条件,用保真来进一步解耦。
@inproceedings{yue2021counterfactual, title={Counterfactual Zero-Shot and Open-Set Visual Recognition}, author={Yue, Zhongqi and Wang, Tan and Zhang, Hanwang and Sun, Qianru and Hua, Xian-Sheng}, booktitle= {CVPR}, year={2021}}
评论