【论文解读】多视图多示例多标签的协同矩阵分解-技术圈

题目: Multi-View Multi-Instance Multi-Label Learning based on Collaborative Matrix Factorization

会议: AAAI 2019

论文: https://arxiv.org/pdf/1905.05061.pdf

1 Motivation

1、现有的M3L方法仅仅探索了部分实体（包，实例和标签）之间的关系，而这些实体之间的关系可以给M3L方法提供丰富的上下文信息，因此，现有的M3L方法性能次优；

2、大部分的MIML算法仅关注单视图数据，但是，在实际应用中，通常可以通过不同的视图来表示多实例多标签对象。

2 Related work

由于包之间以及实例之间存在多种类型的关系,与最近大量研究的MIML任务相比，从多视图包中学习更加困难和挑战。当前已有不少研究工作致力于解决这样一种挑战。如表1所示：

尽管这些方法在努力解决多视图MIML学习问题，但是这些方法仅考虑了包之间和实例之间有限的关系类型。

3 Methodology

所提模型主要包括两部分，一部分是异质网络的构建，另一部分是协同关系矩阵分解。

3.1 Heterogeneous Network Construction

1、construct a subnetwork of instances for each feature view

利用高斯热核为每个特征视图中的实例构建子网，其中为第v个视图中m个实例的平均欧氏距离。

2、construct a bag subnetwork for each feature view

利用豪斯多夫距离为每个试图中的包构建子网

3、construct a subnetwork of labels

利用cosine相似度来量化标签相关性，其中和为两个标签，是标签c在所有包中的分布。

以上三部分便构建完了实例-实例，包-包，标签-标签的子网，另外，通过数据集的信息，作者继续构建包-实例，包-标签，实例-标签之间的数据矩阵。

4、The bag-instance inter-relational data matrix .

5、The bag-label relational matrix .

6、The instance-label relational data matrix . 初始，实例-标签的数据矩阵未知，设为0.

3.2 Collaborative Matrix Factorization

论文所提方法M3Lcmf的目标函数所下所示：

M3Lcmf有两个预测项：实例-标签的联系和包-标签的联系。除了直接利用趋近，作者增加了一个整合项。这个整合项受多实例学习原理的驱动，即包的标签取决于其实例的标签。另外，此整合项可以反向指导和的学习。

由目标函数的前三项可以看出，M3Lcmf构建了包-实例，包-标签，实例-标签之间的关系。按照流行正则的思想，促使有着高相似性的数据点在低维空间内相似，构成MR(G)，利用图拉普拉斯矩阵来构建包-包，实例-实例，标签-标签之间的关系。

最后，可以利用优化好的和来获取实例-标签的相关性矩阵：，同样，要将实例的标签进一步映射到相应的包上，作者利用来趋近包-标签相关性矩阵。因此，M3Lcmf既可以实现包级预测也可以实现实例级预测。

Experiments

Datasets

前五个数据集为包级的数据集，后四个为实例级的数据集。

Metric

1、Ranking Loss (RankLoss),

2、macro AUC (Area Under receiver operating Curve)

3、Average Recall (AvgRecall),

4、Average F1-score (AvgF1).

Results

1、Prediction Results at the Bag-Level

M3Lcmf优于MIMLmix和M2IL：M3Lcmf利用了更多对象之间的关系；
M3Lcmf优于MIML方法（MIMLNN, MIMLfast 和 MIMLSVM）：MIML相比于M3Lcmf利用了更少的实体之间的关系；
MIMLRBF性能逼近M3Lcmf：尽管MIMLRBF利用了更少的实体关系，但是MIMLRBF利用神经网络来获取特征表示。

2、Prediction Results at the Instance-Level

M3Lcmf性能最优，MIMLmix第二，MIMLfast第三是因为MIMLmix没有利用包-包联系和实例-实例之间的关系，MIMLfast在此基础上，还没有利用实例-标签的关系。

3、Contribution of Different Types of Relations

说明实体之间的各种关系都有助于M3L方法的学习。

参数敏感实验详情请见原论文。

参考文献

[Nguyen, Zhan, and Zhou 2013] Nguyen, C. T.; Zhan, D. C.; and Zhou, Z. H. 2013. Multi-modal image annotation with multi-instance multi-label lda. In IJCAI, 1558–1564.

[Nguyen et al. 2014] Nguyen, C. T.; Wang, X.; Liu, J.; and Zhou, Z. H. 2014. Labeling complicated objects: multi-view multi-instance multi-label learning. In AAAI, 2013–2019.

[Yang et al. 2018] Yang, Y.; Wu, Y.-F.; Zhan, D.-C.; Liu, Z.- B.; and Jiang, Y. 2018. Complex object classification: A multi-modal multi-instance multi-label deep network with optimal transport. In KDD, 2594–2603.

[Li et al. 2017] Li, B.; Yuan, C.; Xiong, W.; Hu, W.; Peng, H.; Ding, X.; and Maybank, S. 2017. Multi-view multi-instance learning based on joint sparse representation and multi-view dictionary learning. TPAMI 39(12):2554–2560.

[Zhou et al. 2008] Zhou, Z. H.; Zhang, M. L.; Huang, S. J.; and Li, Y. F. 2008. Miml: A framework for learning with ambiguous objects. Corr Abs 2012.

[Huang, Gao, and Zhou 2018] Huang, S.-J.; Gao, W.; and Zhou, Z.-H. 2018. Fast multi-instance multi-label learning. TPAMI 99(1):1–14.

[Zhang and Wang 2009] Zhang, M. L., and Wang, Z. J. 2009. Mimlrbf: Rbf neural networks for multi-instance multi-label learning. Neurocomputing 72(16-18):3951–3956.


往期精彩回顾




适合初学者入门人工智能的路线及资料下载
机器学习及深度学习笔记等资料打印
机器学习在线手册
深度学习笔记专辑
《统计学习方法》的代码复现专辑
AI基础下载
机器学习的数学基础专辑
温州大学《机器学习课程》视频
本站qq群851320808，加入微信群请扫码：