关键词:
零样本学习
域偏移
少量可见样本
复合零样本学习
条件概率分布
工业异常检测
摘要:
作为机器学习的基本范式之一,监督式学习方法依靠大规模带标签数据集和深度学习技术在机器学习和计算机视觉领域的诸多问题上展现出了优异的性能,受到了广泛的关注。然而,对大量带标签数据的依赖性严重制约了其进一步的发展和应用。一方面,自然界中的物种规模庞大,为所有类别收集充足数量的带标签样本是不现实的;另一方面,数据的分布通常遵循长尾分布,即总是存在某些类别,其数据天然就难以产生并收集,例如珍稀动物、极端天气等。为了解决以上这些问题,提高机器学习算法的泛用性,小样本学习、增量学习等依赖于少量带标签数据的学习范式被提出,并在近些年来吸引了众多的研究目光。作为其中的一种极端设置,零样本学习旨在研究如何在没有目标类别样本的情况下完成学习任务。受人类的零样本认知能力启发,当前的零样本学习范式以类别的语义描述作为桥梁,来连接可见类别与不可见类别。基本解决思路是从可见数据中学习图像的视觉特征与类别的语义描述之间的映射关系,并将其迁移到不可见数据上,从而在仅给定目标类别语义描述的情况下完成分类任务。研究零样本学习不仅有助于推动人们对人脑高级机制的理解,帮助构建真正意义上的人工智能系统,而且可以应用于各种样本或标签缺失的场景,具有重要的现实意义。基于以上的研究背景,本文从理论和应用层面对零样本学习方法展开了研究。具体而言,针对零样本学习问题、少量可见样本下的零样本学习问题、复合零样本学习问题以及零样本学习在工业异常检测领域的应用,我们基于数据的分布信息,提出了对应的解决方案。具体的研究内容如下:(1)针对零样本学习中的域偏移问题,提出了一种基于簇与原型匹配的零样本学习方法。该方法基于样本在视觉特征空间中呈簇分布的规律,利用鲁棒的样本簇与类别原型之间的关系帮助单个样本抵制域偏移的影响。具体而言,提出一种迭代式簇生成算法捕捉样本的簇结构并利用匈牙利算法完成样本簇与类别原型之间的匹配。根据匹配结果,建立簇与原型之间的相似度关系,并与单个样本和原型之间的相似度融合,作为最后的分类依据。簇-原型匹配框架能够以即插即用的方式作用于大部分零样本学习方法。实验结果证明该方法能够有效地帮助基础零样本学习模型抵御域偏移的影响,提高它们的性能。(2)针对少量可见样本设置下的零样本学习问题,提出一种基于分布与梯度双约束的零样本学习方法。首先,将少量可见样本带来的挑战总结为表征偏移问题和过拟合问题。针对表征偏移问题,提出利用类别在语义空间中的相对分布信息矫正类别在视觉空间中的偏移;针对过拟合问题,约束模型在插值语义向量处的梯度,使模型满足利普希茨连续。实验结果证明该方法能够在每种可见类别仅有少量样本的情况下实现优异的性能,且具有较小的时间开销。(3)针对复合零样本学习问题,提出属性的特征分布是基于物体特征的条件概率分布这一假设,并基于该假设提出一种混合属性专家模型。在训练阶段只能接触可见复合概念数据的情况下,引入基于物体的隐变量作为桥梁,间接地建立所有属性与所有物体之间的依赖关系。提出专家稀疏损失和专家负载均衡损失来约束隐变量分布,使不同的属性专家保持多样性。实验结果证明了所提假设以及方法的有效性。(4)针对零样本学习在工业异常检测领域中的应用问题,提出一种用于不可见异常识别的生成式零样本学习框架。根据工业异常图像的数据分布特点,提出使用图像的中间层特征作为视觉特征表示,同时提出将异常类型专家描述的句子嵌入作为语义特征表示。针对异常检测数据集中正常数据与异常数据的不平衡问题,使用焦点损失来让模型更加关注难分样本和样本较少的类别。基于异常检测数据集构建了不可见异常识别任务集,实验结果验证了将零样本学习用于工业异常检测的可行性以及所提框架的有效性。