【论文解读】多视图多示例多标签的协同矩阵分解
共 3457字,需浏览 7分钟
·
2021-04-06 09:56
题目: Multi-View Multi-Instance Multi-Label Learning based on Collaborative Matrix Factorization
会议: AAAI 2019
论文: https://arxiv.org/pdf/1905.05061.pdf
1 Motivation
1、现有的M3L方法仅仅探索了部分实体(包,实例和标签)之间的关系,而这些实体之间的关系可以给M3L方法提供丰富的上下文信息,因此,现有的M3L方法性能次优;
2、大部分的MIML算法仅关注单视图数据,但是,在实际应用中,通常可以通过不同的视图来表示多实例多标签对象。
2 Related work
由于包之间以及实例之间存在多种类型的关系,与最近大量研究的MIML任务相比,从多视图包中学习更加困难和挑战。当前已有不少研究工作致力于解决这样一种挑战。如表1所示:
尽管这些方法在努力解决多视图MIML学习问题,但是这些方法仅考虑了包之间和实例之间有限的关系类型。
3 Methodology
所提模型主要包括两部分,一部分是异质网络的构建,另一部分是协同关系矩阵分解。
3.1 Heterogeneous Network Construction
1、construct a subnetwork of instances for each feature view
利用高斯热核为每个特征视图中的实例构建子网,其中为第v个视图中m个实例的平均欧氏距离。
2、construct a bag subnetwork for each feature view
利用豪斯多夫距离为每个试图中的包构建子网
3、construct a subnetwork of labels
利用cosine相似度来量化标签相关性,其中和为两个标签,是标签c在所有包中的分布。
以上三部分便构建完了实例-实例,包-包,标签-标签的子网,另外,通过数据集的信息,作者继续构建包-实例,包-标签,实例-标签之间的数据矩阵。
4、The bag-instance inter-relational data matrix .
5、The bag-label relational matrix .
6、The instance-label relational data matrix . 初始,实例-标签的数据矩阵未知,设为0.
3.2 Collaborative Matrix Factorization
论文所提方法M3Lcmf的目标函数所下所示:
M3Lcmf有两个预测项:实例-标签的联系和包-标签的联系。除了直接利用趋近,作者增加了一个整合项。这个整合项受多实例学习原理的驱动,即包的标签取决于其实例的标签。另外,此整合项可以反向指导和的学习。
由目标函数的前三项可以看出,M3Lcmf构建了包-实例,包-标签,实例-标签之间的关系。按照流行正则的思想,促使有着高相似性的数据点在低维空间内相似,构成MR(G),利用图拉普拉斯矩阵来构建包-包,实例-实例,标签-标签之间的关系。
最后,可以利用优化好的和来获取实例-标签的相关性矩阵:,同样,要将实例的标签进一步映射到相应的包上,作者利用来趋近包-标签相关性矩阵。因此,M3Lcmf既可以实现包级预测也可以实现实例级预测。
Experiments
Datasets
Metric
1、Ranking Loss (RankLoss),
2、macro AUC (Area Under receiver operating Curve)
3、Average Recall (AvgRecall),
4、Average F1-score (AvgF1).
Results
1、Prediction Results at the Bag-Level
M3Lcmf优于MIMLmix和M2IL:M3Lcmf利用了更多对象之间的关系; M3Lcmf优于MIML方法(MIMLNN, MIMLfast 和 MIMLSVM):MIML相比于M3Lcmf利用了更少的实体之间的关系; MIMLRBF性能逼近M3Lcmf:尽管MIMLRBF利用了更少的实体关系,但是MIMLRBF利用神经网络来获取特征表示。
参数敏感实验详情请见原论文。
参考文献
[Nguyen, Zhan, and Zhou 2013] Nguyen, C. T.; Zhan, D. C.; and Zhou, Z. H. 2013. Multi-modal image annotation with multi-instance multi-label lda. In IJCAI, 1558–1564.
[Nguyen et al. 2014] Nguyen, C. T.; Wang, X.; Liu, J.; and Zhou, Z. H. 2014. Labeling complicated objects: multi-view multi-instance multi-label learning. In AAAI, 2013–2019.
[Yang et al. 2018] Yang, Y.; Wu, Y.-F.; Zhan, D.-C.; Liu, Z.- B.; and Jiang, Y. 2018. Complex object classification: A multi-modal multi-instance multi-label deep network with optimal transport. In KDD, 2594–2603.
[Li et al. 2017] Li, B.; Yuan, C.; Xiong, W.; Hu, W.; Peng, H.; Ding, X.; and Maybank, S. 2017. Multi-view multi-instance learning based on joint sparse representation and multi-view dictionary learning. TPAMI 39(12):2554–2560.
[Zhou et al. 2008] Zhou, Z. H.; Zhang, M. L.; Huang, S. J.; and Li, Y. F. 2008. Miml: A framework for learning with ambiguous objects. Corr Abs 2012.
[Huang, Gao, and Zhou 2018] Huang, S.-J.; Gao, W.; and Zhou, Z.-H. 2018. Fast multi-instance multi-label learning. TPAMI 99(1):1–14.
[Zhang and Wang 2009] Zhang, M. L., and Wang, Z. J. 2009. Mimlrbf: Rbf neural networks for multi-instance multi-label learning. Neurocomputing 72(16-18):3951–3956.
往期精彩回顾
本站qq群851320808,加入微信群请扫码: