关键词:
元学习
图像识别
小样本学习
深度学习
人脸防伪
摘要:
基于深度学习的图像识别方法一般训练一个深度学习模型来完成图像识别任务。近年来,这类方法在众多图像识别数据库上都取得了远超传统图像识别方法的识别准确率。然而,这类方法在实际应用中仍然存在较多的问题。其中一个主要问题为过拟合,即深度学习模型拟合了训练数据但是无法在测试数据上取得令人满意的识别准确率。主要表现为以下两种形式:第一,当训练图像数据量过少时,深度学习模型虽然很好地拟合了训练数据,但是却难以在训练数据上学到具有泛化性的数据特征,从而导致其无法准确地识别测试图像。第二,深度学习模型拟合了训练数据的分布,然而当测试数据与训练数据的分布之间存在差异时,深度学习模型往往无法很好地适配测试数据的数据分布,从而使它的测试性能受到一定的影响。不同的数据分布一般被叫做不同的域。
为了避免第一种过拟合形式,研究人员通常会搜集并精心标注大量图像数据以增加训练数据量。然而这种解决方案极其耗时耗力。因此,如何使深度学习模型在少量图像数据上学到泛化性强的图像识别特征是一个重要问题,学术界将这个问题叫做小样本图像识别问题。为了避免第二种过拟合形式以及为了提高深度学习模型在测试数据的数据分布(目标域)上的性能表现,研究人员提出了多种域泛化方法以及域自适应方法。域泛化是指如何使深度学习模型在有限域的训练数据上学到可以泛化到其他域的特征。域自适应是指在利用训练数据的基础上,如何使深度学习模型能高效地利用目标域的有限数据来适配该目标域。
最近几年,研究学者提出大量方法来解决基于深度学习的图像识别存在的包括过拟合在内的各种问题。在众多方法中,基于元学习的方法展现了巨大的潜力。因此,本文将研究元学习并通过创新性地改进和扩展元学习来解决小样本图像识别、域泛化以及域自适应相关的问题。具体来讲,本文的研究创新点以及研究内容主要有以下几点:
1.本文向学术界展示了基于元学习的小样本图像识别方法的一种独特实验现象,即在小样本图像识别过程中,与常规深度学习模型相比,元学习器(元学习模型)通常将更多的注意力集中在顶部神经层(接近于输出端的神经层)的更新上。本文巧妙地利用了这一实验现象并提出了一种新颖的逐层自适应更新(Layer-Wise Adaptive Updating,LWAU)的元学习方法。实验证明了LWAU比现有方法的小样本图像识别性能更好。另外,LWAU的元学习器学到了更加通用同时更加稀疏的图像识别特征,而这为LWAU带来了另一个优势,即更快地小样本图像识别测试速度。相比于现有基于元学习的方法,LWAU可以使元学习器的小样本图像识别速度提升至少5倍。
2.本文借鉴了一些人类认知方面的研究工作,并认为小样本图像识别的两个关键因素为先验知识以及视觉注意力,然而现有基于元学习的小样本图像识别方法很少重视这两个关键因素。本文设计了一种新的元学习框架,并提出了三种方法利用先验知识和视觉注意力来提升小样本图像识别性能。另外,本文还向学术界展示了基于元学习的小样本图像识别方法中的另一个问题:任务过拟合,并提出了一个基准来量化元学习方法的任务过拟合程度。实验证明,先验知识和注意力机制不仅可以显著改善基于元学习的小样本图像识别的性能,同时也可以很好地缓解元学习方法的任务过拟合程度,表明了先验知识和视觉注意力机制对于元学习的重要意义。
3.人脸防伪是比较典型的训练数据与测试数据之间存在域差异的任务,这是因为在新的人脸防伪实际应用中,人们通常会使用新的人脸拍摄条件(摄像头、光线、背景等)拍摄人脸图像。不同拍摄条件下的真假人脸图像会有一定的分布差异,从而形成了不同的域。本文尝试通过元学习来解决人脸防伪的域泛化与小样本域自适应问题。本文将人脸防伪的这两个问题转化为零样本与小样本学习问题,并提出了一种自适应内部更新的元人脸防伪(AIM-FAS)方法来解决该问题。另外,本文还创新性地利用元学习思想提出了一种叫做Auto-Label的标签搜索方法来搜索更适用于人脸防伪的回归标签。实验证明,AIM-FAS可以比现有基于深度学习的方法更好地解决人脸防伪的零样本和小样本学习问题,并且与人工设置的标签相比,Auto-Label搜索到的回归标签不仅可以提升了AIM-FAS的性能,同时也可以提升现有人脸防伪方法的性能。
4.本文还通过元学习解决人脸防伪中一种特有的单类别域自适应问题。这个问题出现的原因是很少有人使用假人脸迷惑人脸识别系统,所以新的人脸防伪应用通常可以拍摄到大量的真人脸图像却几乎拍摄不到假人脸图像。这就导致一个新的实际问题,即如何仅利用新的应用中的真人脸来使人脸真伪鉴别器适配该应用的人脸域(数据分布)。本文创新性地提出了一种基于元学习的单类别域自适应人脸防伪(One-Class Domain Adaption Face Anti-Spoofing,OCDA-FAS)方法来解决这个问题