关键词:
标记分布学习
图像集分类
哈希学习
深度学习
摘要:
标记学习的任务就是为未知样本预测出其标记信息。它是人工智能中的一项重要任务,广泛应用于图像检索、人脸识别、图像分割、物体跟踪等领域。许多研究者对标记学习进行了研究并提出了很多优秀的算法。标记学习主要存在两种学习范式:(1)将样本通过一个映射函数直接映射到标记空间,虽然这种方式能够很好地建模标记学习,但这些方法通常都有着非常高的计算复杂度;(2)基于哈希的标记学习。哈希技术因其具有低存储、高检索效率的优势,目前广泛应用于大规模检索系统。将哈希技术应用于标记学习,可增加标记学习的可扩展性。另外,基于哈希的标记学习在预测阶段均是由已知数据的标记预测所得,因此,基于哈希的标记学习方式相对于传统的由模型独立生成标记的方式所生成的标记信息更加符合真实的数据分布。在标记学习中,标记分布学习(Label Distribution Learning,LDL)作为一种新型学习范式,目前已经取得了比较高的精度和效率。然而仍然存在一些亟待解决的重要问题导致现有的基于哈希的标记分布学习方法只达到次优的性能:(1)浅层的语义建模导致学习过程中无法有效捕获隐式语义;(2)已有方法简单地构造了一个带有标记相似性的矩阵来保存实例的语义关系,这不能完全建模实例的内在语义关系;(3)已有方法没有很好地解决哈希中存在量化误差问题,这将导致较大的信息损失。针对这些问题,本文提出了基于深度离散哈希的标记分布学习(Deep Discrete Hashing for Label Distribution Learning,DDH-LDL),该方法构建了第一个基于哈希的标记分布学习的深度学习框架。具体来说,DDH-LDL通过多层非线性变换捕获隐式语义信息,同时通过图卷积神经网络的语义信息聚合作用,将实例的语义关系保留到哈希码中。此外,本文精心设计了一个离散优化模块,该模块无缝集成到所提出的深度哈希框架中,以减少二值量化误差。在几个被广泛测试的数据集上的实验验证了该方法在精度和效率方面的优越性。此外,本文研究了图像集标记学习。图像集标记学习在近些年受到了广泛关注,其任务是学习图像集合的标记信息。虽然目前的方法有着较高的精度,但仍然有一些没有解决的问题:(1)集合内部的图像间存在一定的相似和互补性,但是已有的方法没有较好的考虑图像集中图像间的关系;(2)没有对集合内各个图像采取有效的集合内部的聚合约束,因此不能很好地建模集合内图像的内在关系。为了解决这些问题,本文提出了基于自注意力聚合哈希的图像集标记学习(Self-Attention Aggregation Hashing for Image Set Label Learning,SAAH-ISLL)。该方法基于哈希检索技术,能够快速进行检索,根据检索结果的标记来预测未知样本,减小了标记学习的不确定性,因此更加可靠。该方法充分考虑了图像集合内各个图像之间的联系,根据标记对集合中心进行约束,将样本相似性关系保留至哈希码中,这种做法更加符合图像集标记学习的独有特性。本文在多个数据集上进行了验证,证明了该方法的有效性。