关键词:
多视图数据
数据不确定性
鲁棒多视图学习
多视图分类
多视图聚类
不完全多视图学习
多视图聚类可靠性
摘要:
信息技术与计算机技术的发展,使得在很多实际应用中产生了具有多种特征表示的多视图数据。以多视图数据为研究对象的多视图学习,旨在通过有效地利用多个视图来实现优于传统单视图学习的性能。在实际应用中,多视图数据在采集和传输过程中不可避免地会存在不确定性,例如包含白噪声与离群点等视图内不确定性和各个视图含噪程度不一致等视图间不确定性。针对多视图数据不确定性,本文主要研究鲁棒多视图学习方法,即研究如何有效应对多视图数据不确定性引起的学习性能退化问题。这不仅能丰富多视图学习的研究理论,而且能够缩短多视图方法研究与实际有效应用之间的距离。本文的主要工作总结如下:1.归纳提出了层次化鲁棒多视图学习框架。通过对多视图数据的不确定性进行分析,发现多视图数据具有视图内和视图间两个层次的不确定性。针对多视图数据不确定性具有层次化的特点,探讨了鲁棒多视图学习应涵盖的内容,建立起层次化鲁棒多视图学习框架,分别给出了两个层次上不确定性的处理方法。此框架的建立,为下文设计鲁棒多视图学习方法提供了指导。2.在层次化鲁棒多视图学习框架下,分别采用鲁棒l2,1损失和自适应权重方法来处理视图内和视图间的不确定性,提出了基于l2,1范数回归的监督和半监督鲁棒多视图分类方法。监督情况下,通过引入标签调节向量增大回归后类间判别性和类内凝聚性,增强对噪声和离群点的鲁棒性,提出了基于判别回归的鲁棒多视图分类方法,同时显式地促使不同视图上分类器差异化以捕捉更多互补信息,在保证鲁棒性的基础上提升分类性能。在半监督情况下,在回归模型中采用样本权重来减弱由无标签样本不确定性带来的负面影响,通过自适应地视图权重学习来减轻低质量视图的作用,提出了基于自适应回归的鲁棒多视图半监督分类方法。实验结果表明,上述两个方法分别在手写数字识别和场景识别中较对比方法具有优势,实用性更强。3.针对多视图数据可能含有随机稀疏损坏的情况,基于潜在表示假设和子空间聚类假设,采用层次化鲁棒多视图学习框架中的低秩恢复技术,提出了多视图潜在行空间追踪算法,恢复表征多视图数据聚类结构的潜在行空间、识别随机稀疏损坏。在多视图数据不含损坏的情况下,可以从理论上证明潜在行空间追踪算法能够准确恢复出多视图数据的潜在行空间。所提方法具有优良的行空间恢复能力和聚类性能,而且可以应用于多摄像头视频影像实现背景环境与运动目标的有效分离。4.针对多视图数据存在相对集中缺失值的情况,尤其是视图缺失与变量缺失相混合的情况,提出了基于低秩嵌入的不完全多视图学习框架。此框架包含若干现有不完全视图学习方法为特例,且可用于改造完全视图方法以适用于不完全多视图数据,不仅提高了处理不完全多视图数据的效率,而且建立起传统完全视图学习与不完全视图学习之间的联系。在此框架内,基于子空间聚类假设,采用块对角正则增强对数据缺失的鲁棒性,提出了基于块对角表示的不完全多视图学习方法,提高了不完全多视图学习的效果。5.注意到多视图学习的初衷是获得比单视图学习更优的学习效果,因而多视图学习相对于单视图学习的可靠性被认为是鲁棒多视图学习的基本内涵。针对聚类没有标签信息用于判断多视图聚类相对于单视图聚类的优劣的情况,利用层次化鲁棒多视图学习框架中的采用后期融合策略,着重处理视图间层次的不确定性,提出了可靠多视图聚类方法。对于给定的各个视图上的基准单视图聚类结果和若干备选多视图聚类结果,学习一个新的聚类结果,使其相对于最好基准单视图聚类结果的性能增益尽量大。在一定条件下,所提方法相对于单视图聚类的可靠性具有理论保证。这是首个考虑多视图学习相对于单视图学习可靠性的工作。