关键词:
表达学习
医学图像分析
对比学习
聚类
领域自适应
摘要:
基于深度神经网络的图像认知模型凭借其强大的特征表达提取能力和泛化能力,已经被广泛地应用于各个领域,并取得了巨大成功。如何准确高效地提取具有可分性的表达是图像识别、图像分割等图像认知相关任务的核心问题。表达学习方法利用数据本身含有的丰富信息提取具有可分性的表达,在无监督、半监督、全监督等领域都取得了显著的成果。然而,日益多样的任务和更加实际的应用对表达学习提出了很多严峻的挑战。其中,如何进一步放宽表达学习的适用条件、降低学习成本和提升学习效率都是表达学习在方法和应用上亟待解决的问题。特别在面向医学图像的应用上,医学图像的特殊性以及临床的复杂情况给表达学习提出了特有的挑战。本文针对表达学习的机理、算法和应用中面临的关键问题,基于传统机器学习理论探究可分性表达的学习机理;从两个关键点(即表达空间优化和特征去相关)出发,研究提取具有可分性表达的算法;以医学图像应用中的典型挑战为例,设计面向实际应用的可分性表达提取模型。首先在机理层面,从传统机器学习的理论方法出发研究表达学习方法获取具有可分性表达的作用机理,并基于此机理探讨学习可分性表达的关键因素。其次在算法层面,针对学习可分性表达时需要依赖数据先验知识的问题,提出基于概率分布的可分性表达学习方法;针对可分性表达的学习效率不高和需要庞大计算资源的问题,提出基于间接特征去相关的可分性表达学习方法。最后在应用层面,立足于医学牙科图像应用,针对难以从语义特征模糊的样本中学习具有可分性表达的问题,提出基于局部可分性的龋坏分割方法;针对难以利用少量数据进行模型迁移的问题,提出基于特征空间的领域自适应的方法。本文的创新点和主要贡献包括以下几个方面:1.提出一种对可分性表达学习机理的解释。以表达学习中经典的对比学习为例,通过探讨对比学习和谱聚类的相关性研究学习可分性表达的机理,并基于此探讨学习可分性表达的关键因素。基于对比思想的表达学习方法在众多任务中都取得了良好的效果,验证了对比思想的有效性。这类方法成功的本质原因可视为实现了可分性表达的提取。然而,当前少有工作解释基于对比思想的方法可以提取可分性表达的原因。针对该问题,本文研究对比学习提取可分性表达的作用机理,从对比学习和谱聚类都是基于相似矩阵进行优化的共同特点出发,通过讨论对比学习和谱聚类的关系,分析可分性表达的学习机理。为了证明对比学习和谱聚类的联系,首先证明了优化对比学习的损失函数可以间接优化谱聚类的目标函数,同时证明了对比学习可以自然地促进特征去相关,由此指出在一定的条件下,对比学习本质上类似于谱聚类,因此可以学到类内距离小、类间距离大的可分性表达。此外,讨论了优化对比学习损失函数和特征去相关这两个关键因素对可分性表达学习的影响。最后,通过实验验证了对比学习和谱聚类的关系和提出的两个关键因素对学习可分性表达的影响。2.提出基于概率分布的对比学习方法,实现了在不依靠先验知识的情况下学习易于聚类的可分性表达。通过去除表达学习对先验知识的依赖,放宽了学习可分性表达的条件,提高了可分性表达在多粒度环境中的适用性。无监督表达学习的核心目标之一是在没有人类监督的情况下学习具有可分性的表达。但是,现有方法大多需要利用数据的先验知识(如类别数目,类的分布等)才能学到易于聚类的可分性表达。然而,这些先验知识在真实场景中可能难以获得。此外,当先验知识发生变化时,表达提取模型需要重新训练才能用于新的场景。因此,如何在不利用数据集先验知识的情况下学习可分性表达是亟待解决的问题。针对该问题,本文展开基于对可分性表达学习机理的研究,提出一种基于概率分布的对比学习方法,旨在通过强化表达空间的约束,促使模型在不需利用先验知识的条件下学习易于聚类的可分性表达。本方法将样本编码为多元高斯分布并从分布中随机采样,从而可以同时以概率分布和随机采样两种不同的角度进行对比学习。此外,提出了一个基于多用途向量的对比学习约束,用以更加高效地实现上述两种约束。提出的方法在不利用先验知识的情况下就可以学到利于聚类的表达,并在CIFAR-10数据集上取得比先进方法高9%的准确率。最后,通过实验验证了该方法的有效性,并以多粒度聚类为例展示了该方法在数据先验知识改变时的稳定性。3.提出基于间接特征去相关的可分性表达学习方法,简化了损失函数的优化目标,提高了学习可分性表达的效率;并提出基于双向量的对比学习方法,实现了基于小批量的对比学习,降低了对计算资源的需求。为了获取可分性高的表达,将特征去相关的技术融入表达学习框架是一种实证有效的思路。但是,现有方法通常在一个附加的特征空间中对特征进行去相关,这使得优化过程需要在表达空间和特征空间中同时进行,降低了表达学习的效率。此外,基于对比思想的表达学习方法通常需要大批量来进行优化,使得模型的训练需要大量的计算资源。因此,如何提高可分表达的学习效率并降低对