关键词:
跨模态检索
在线哈希学习
高维哈希学习
离散哈希学习
近邻搜索
摘要:
目前越来越多的成像设备应用到我们的日常生活中,每分钟都会产生大量的图像。随着互联网的快速发展,不仅仅是图像数据库规模迎来了爆炸式增长,有关的文本、视频等数据库规模也呈现快速增长趋势。数据呈现的方式越来越多样化,数据的模态也随之不断增多,相关的跨模态检索成为研究人员面临的一个挑战性问题。当数据样本特征描述的维数很高(即维数灾难)或数据规模很大时,如何实现更高效的跨模态检索成为研究的难点也是热点。哈希方法由于其较低的时间复杂度和存储成本,近年来受到了研究者的广泛关注。然而,现有的跨模态哈希学习方法大多是基于批处理模式,无法很好的满足数据以流式动态到达的实际需求。当新数据被动态获取时,基于批处理的哈希方法需要重新更新整个哈希函数以确保检索精度,这就导致了较高的存储和计算成本。在这种情况下,在线哈希研究应运而生。在线哈希是通过对连续到达的数据实例在线更新哈希函数来解决在线检索任务。本文以多模态数据为主要研究对象,针对现有的在线哈希方法未考虑问题,进一步探索在线跨模态哈希学习方法,创造性地提出了两种新的在线哈希算法和一种高效的在线优化算法。本文的主要研究内容和贡献概括如下:1)针对在线情形下流式数据动态更新导致旧数据缺失而无法有效保持新旧数据间相关语义信息的问题,创造性的提出了一种在线无监督跨模态离散哈希(OUCDH)方法。该方法巧妙地借助锚点来捕捉新旧数据间地相似性结构,从而学习更高质量的哈希码。当获取到新的数据样本时,矩阵分解数据样本的特征去学习不同模态间的语义公共子空间,计算新数据样本和锚点间的相似性,得到图拉普拉斯矩阵,进而更好的进行哈希编码。同时为了减少量化误差,考虑使用旋转矩阵保证哈希编码质量并设计了一种在线优化算法。为了验证所提出的在线无监督跨模态离散哈希(OUCDH)方法的检索性能,在三个基准数据集上进行了大量实验。实验结果表明,与现有的在线跨模态哈希方法相比,该方法具有较高的检索精度,是高效的在线跨模态检索方法。2)面对高维数据,即使是哈希技术也避免不了需要承受较高的计算和存储压力,而现有的关于处理高维数据的在线哈希研究较少。为弥补高维在线哈希的研究空白,解决处理高维流式数据问题,本文提出了一种在线高维跨模态哈希(OHDCH)方法,旨在对高维数据进行降维处理,减轻计算和存储压力。结合双边投影降维的思路,首先对新到达的数据特征矩阵实现向量化,再重构得到的高维特征向量,完成高维特征矩阵到低维特征矩阵的降维转化,最后利用两个正交投影矩阵对低维特征矩阵进行双边投影学习哈希码。同时,还设计了一种交替迭代的在线优化算法,对哈希码进行更新优化,确保哈希编码质量。通过在三个大规模基准数据集上的大量实验,可以证实OHDCH相对于其他在线哈希方法具有更高的优越性。3)针对上述两种跨模态在线哈希方法,本文提出了一种基于牛顿法的高效优化改进算法。所提出的两种在线优化算法都是基于梯度下降的交替迭代更新算法,存在的共同问题是每轮迭代次数较多。当优化更新的迭代次数超出给定范围,则会降低在线更新效率,影响模型的性能。为解决这一问题,运用牛顿法对原有优化算法进行改进,形成更为高效的在线优化算法。由于牛顿法二次收敛的优越性,相较于一次收敛的梯度下降法能够更快进行收敛,减少迭代收敛的次数。考虑到牛顿法中求解Hessian矩阵逆矩阵的复杂度,采用对角近似来求解逆矩阵的近似值,简化求逆步骤,降低求解复杂度。应用该优化方法于所提出的OUCDH和OHDCH上,并分别在各自的标准数据集上进行实验对比,可以证实该优化算法的高效性。