关键词:
图像识别
度量学习
直推小样本学习
半监督小样本学习
行人重识别
模型轻量化
知识蒸馏
摘要:
2012年以来,深度神经网络在计算机视觉、语音识别、自然语言处理、智慧医疗等多个领域取得了优异的成果。这是卜数只偶,也是水到渠成。究其本质,还是得益于三个基础的驱动,包括:大数据(充分标注)、大模型(参数量庞大)和大计算(高性能计算)。正因为对这三个基础的严重依赖,也在一定程度上限制了人工智能的进一步发展和普及。首先,大模型对大数据的过度依赖表现在其在训练阶段必须在大量的标注充分的数据下训练,否则模型的准确率将大大降低。很多新的应用场景的样本获取困难并且标注成本极高,因此不少学者开始研究小样本学习方法,目的是当面对一个新的场景时,快速的从少量的有标记样本中学会认识新的类别。其次,大模型对大计算的依赖表现在其无论在训练和测试阶段均需要拥有大量存储空间和优异计算性能的硬件平台的加持。那么,对于很多的存储和计算资源均极其有限的测试场景,比如移动端(智能手机,自动驾驶汽车等),离线监控设备(公共摄像头,汽车行车记录仪等),现有的训练好的大模型将会出现水土不服,无法顺利落地。于是,模型轻量化问题也被领域内科研人员广泛关注。研究模型轻量化的目的是压缩模型参数量,使其在移动端顺利部署。基于以上背景,本文面对实际环境中图像识别应用的真实需求,重点研究深度学习模型落地时亟待解决的两个问题:小样本(训练数据标注不充分)和模型轻量化(测试平台存储计算资源有限)的问题。首先,基于通用的小样本任务,本文主要对小样本问题中的度量方式、特征提取方法以及如何利用无标签样本进行了研究。得益于对于小样本学习方法的研究,本文进一步研究了具体细粒度图像任务中的小样本问题,即行人重识别中的单视角问题。其次,为了研究模型轻量化方法,本文选取一个代表性的智能车载应用驾驶行为分析作为具体研究载体。行人重识别和驾驶行为分析分别为图像识别算法在公共安全和交通安全领域的两大典型应用。其中行人重识别研究的是一个室外的远距离开放场景,而驾驶行为分析研究的是车内的近距离封闭场景。总之,本研究的目的在于降低图像识别应用的普及成本,突破人工智能应用的场景限制,使其在更广泛的领域为更多的人带来更多助益。具体研究内容如下:一、针对小样本问题,从度量学习(metric learning)角度出发,提出了一种新的面向直推小样本学习的局部和全局的相似度度量方式。具体地,局部相似度不仅考虑了查询集和支撑集样本之间的局部关系,而且将支撑集样本之间,以及查询集样本之间的局部关系都考虑进来。为了充分利用每个任务的局部信息,我们提出了一个新的基于特定任务的全局相似度计算方法。在手写数据集Omniglot,通用图像分类数据集miniImageNet,tiered ImageNet上的实验结果表明,局部和全局相似度结合的度量方式能够显著提高小样本分类准确率。二、针对小样本问题,从数据角度出发,提出了一种新的基于上文相似度的二阶注意力模型用于解决半监督的小样本分类问题(semi-supervised few-shot learning)。为了提高特征提取网络的表达能力,在不增加网络参数的前提下,我们提出提取中间层输出的二阶注意力特征。为了充分利用无标签样本集中的正样本的信息,提出一种基于上下文的新的相似度计算方法。在手写数据集Omniglot,通用图像识别数据集miniImageNet,tieredImageNet和细粒度图像识别数据集CUB上的实验结果证明了算法的优越性。三、针对小样本问题,从应用角度,提出一种新的面向应用的基于单视角的小样本学习方法(OVL)。将研究重心从一般问题过渡到具体任务,研究一个开放远距离场景——行人重识别问题中的跨摄像头场景下的小样本问题的解决方案。具体地,为了解决不同摄像头下数据分布不同的问题,设计了一个对抗多源学习方法,用于对齐不同摄像头数据的分布。为了避免无标签样本中负样本对模型训练的干扰,提出一个对抗负样本剔除算法。在Market-1501,DukeMTMC-reID,MSMT17三个数据集上的实验结果表明,我们提出的OVL算法在只有少量标注样本的前提下,可以达到优于现有的域自适应方法和半监督的方法的结果。四、针对模型轻量化问题,提出一种新的基于样本的多教师知识蒸馏的方法(IsMt-KD),学习准确率高,速度快的轻量卷积神经网络。以一个封闭近距离的车内场景——驾驶行为分析问题作为研究载体,研究智能车载移动端图像识别模型的轻量化问题。具体地,为了减少知识蒸馏过程中来自教师网络的误导问题,设计了一个新的基于样本的为教师打分的方法(ISTG)。基于ISTG,实现基于样本的中间层和输出层高效知识蒸馏。在AUC和StateFarm数据集上的实验结果表明,经过IsMt-KD蒸馏的轻量模型能够达到与大模型相当的准确率,并且保持了轻量模型在参数量和执行速度方面的优势。综上所述,本文重点关注应用