关键词:
高光谱图像分类
主动学习
聚类方法
原型学习
图卷积网络
自监督学习
摘要:
得益于高光谱成像技术的发展,相比于传统光学图像,高光谱图像不仅具有更为广泛的空间信息,并且蕴含了丰富的光谱信息,能够辅助地物的精准辨别,因此,高光谱图像数据已被广泛应用于环境监测、生物检测、矿产勘探、军事侦察等与人类生活切实相关的领域。高光谱图像分类是高光谱图像解译的关键步骤之一,尽管已有大量的高光谱图像数据以供研究,但是高光谱图像的专业标注有限,即存在小样本的局限性,影响高光谱图像分类方法的分类性能,这是高光谱图像分类任务面临的一大难题。此外,未标记样本中蕴含着丰富的信息以待挖掘,现有的高光谱图像分类方法并未对大量未标记样本加以利用。并且,高光谱图像相邻波段的相关性较强,导致高光谱图像不同类别间样本的空间分布复杂交错,容易影响模型的分类性能。
因此,本文针对上述问题,研究面向高光谱图像分类的主动学习方法,以增强高光谱图像分类精度,并通过大量实验对本文所提方法的效果进行验证。具体的研究内容如下:
(1)针对高光谱图像标记样本有限,现有方法通常未合理挖掘大量未标记样本信息,影响高光谱图像分类精度的问题,提出了一种基于聚类优化高光谱图像分类性能的主动学习方法。一方面,利用K-means聚类方法结合伪标签学习法对分类模型进行预训练,使得模型能够充分学习未标记样本中的特征表征;另一方面,基于改进的快速搜索和查找峰值聚类方法,对含有丰富信息的未标记样本进行采样并人工标注,以扩充有限的标记样本集;最后,使用扩充后的训练集对深度神经网络模型进行微调,以提高模型的泛化能力及高光谱图像分类精度。实验结果表明,相对于现有的主动学习方法,该方法能有效优化高光谱图像分类模型的分类性能。
(2)针对现有主动学习方法未针对高光谱图像复杂特性设计,导致采样效果难以保证,影响模型的分类准确率的问题,提出了一种基于图卷积网络与原型学习的高光谱图像分类主动学习方法。该方法通过图卷积网络结合原型学习对未标记样本的空间分布进行优化,以增强主动学习方法的采样效果;其次,对训练集中每类样本的原型进行迭代更新,通过比较原型样本与未标记样本间的相似性差异,以增强对未标记样本价值的评估效果,从而保证主动学习方法的采样效果,并提升有限标记样本下高光谱图像的分类准确率。实验结果表明,相对于现有的主动学习方法,该方法针对不同类型的高光谱图像分类模型的性能提升均有优势。
(3)针对现有基于伪标签学习的高光谱图像分类方法,容易因标签偏差,影响模型分类性能的问题,提出一种基于自监督学习优化高光谱图像分类性能的主动学习方法。本方法使用未标记样本对自监督学习框架进行预训练,使得特征提取模块在无需标签的情况下学习未标记样本的特征表征,以提高未标记样本的利用效率;其次,结合主动学习采样策略,对未标记样本进行采样及人工标注,扩充有限的数据集,并对分类模型进行微调,以此来提高模型的泛化能力,从而提高模型的分类效果。实验结果表明,该方法能有效增强高光谱图像分类模型的分类性能。