关键词:
投影字典对学习
深度学习
SAR图像分类
摘要:
在遥感领域,合成孔径雷达(Synthetic Aperture Radar,SAR)因其能够在全天候条件下提供大量地面图像而占有重要地位。与光学遥感图像不同,SAR遥感图像不受天气等外界条件干扰,因此可以胜任各种天气下的工作。然而,SAR图像本身与人的视觉认知存在较大差异,所需目标信息不能通过直观的视觉方式理解,往往需要具有遥感背景的专业人员进行识别。此外,图像本身也面临着散斑噪声干扰、数据采集困难及目标特征可变的等一系列问题。因此,如何充分发挥SAR遥感图像的优势,并基于人工智能算法,实现精准高效的SAR图像分类任务成为了广泛关注的焦点。
SAR图像的分类性能很大程度上依赖于特征学习,良好鲁棒的特征将会显著提升SAR图像分类任务的性能。其中,深度神经网络(Deep Neural Networks,DNN)因其卓越的特征提取能力已经广泛应用于SAR图像分类。但深度神经网络模型在样本量较少的情况下往往面临着过拟合和鲁棒性不强等问题。相反,字典学习(Dictionary Learning,DL)作为经典的特征学习方法能够在一定程度上解决这些问题。随着人们对SAR图像分类的准确性及鲁棒性的要求不断提高,近年来将深度学习与字典学习相结合的方法得到越来越多研究者的关注并取得了显著进展。然而,现有的字典学习及深度字典学习方法依旧存在特征学习能力不强、特征质量不高、优化难度大、图像背景信息干扰、噪声鲁棒性不强和空间资源消耗大等一系列问题。
因此,本文将SAR图像分类作为应用背景,针对上述一系列具体问题,展开了对深度投影字典对学习方法的研究与讨论。其目的在于,将改良的投影字典对学习方法与深度神经网络相结合,实现精准高效的SAR图像分类任务,并开发了一个面向SAR遥感图像的多算法分类系统来对某个(或多个)应用领域的SAR遥感图像进行分类,从而解决具体实际问题。本文的主要研究工作如下所示:
(1)提出了基于深度字典对学习的SAR图像分类方法(Deep Dictionary Piar Learning,DDPL)。该方法针对深度神经网络直接提取的特征与字典对学习(Dictionary Piar Learning,DPL)方法不匹配的问题,尝试将深度神经网络与字典对学习算法相结合,实现两者的联合学习,并集成到端到端的深度字典对学习网络中。其中,深度神经网络用于学习适用于DPL算法的判别特征,DPL算法用于学习判别字典并反向引导深度神经网络的更新,进而提升了特征学习能力。
(2)提出了基于图正则多约束深度双字典对学习的SAR图像分类框架(GR-CD3PL)。首先,为了分离不同类别之间共享的背景或噪声信息,通过将DPL中的合成字典分解为类特定和类共享合成字典,将分析字典分解为类特定和类共享分析字典,提出了双字典对学习方法(Double Dictionary Pair Learning,D2PL)。其次,为了进一步增强D2PL的鲁棒性,通过将7)范数约束和核范数约束分别应用于分析字典和合成字典,提出了多约束双字典对学习方法(Constraints Double Dictionary Pair Learning,CD2PL)。最后,为了更有效地进行判别表示学习和增强深度特征的紧凑性,通过将CD2PL、深度神经网络和图判别学习集成到一个端到端的学习框架中,提出了图正则多约束深度双字典对学习网络(Graph Regularized-Constraints Deep Double Dictionary Pair Learning Network,GR-CD3PL)。大量实验结果验证了所提出的三种方法在SAR图像特征学习和分类方面的有效性。
(3)提出了基于熵的深度低秩字典对学习网络(Entropy Based Deep Low-Rank Dictionary Pair Learning Network,EDLRDPL_Net)。首先,针对前述深度字典对学习网络需要耗费大量空间资源的问题,将熵约束引入到了字典对学习方法中。其次,为保证所学到的系数矩阵的对角结构,即使得同一类的样本具有相似的系数,将低秩约束与熵字典对学习模型相结合,提出了基于熵的低秩字典对学习(Entropy Based Low-Rank Dictionary Pair Learning,ELRDPL)方法。最后,将ELRDPL与深度神经网络相结合,提出了基于熵的深度低秩字典对学习网络。在四个SAR图像分类数据集上的大量实验结果证明了EDLRDPL_Net的有效性。
(4)开发了面向SAR遥感图像的多算法分类系统。通过将本文提出的三种分类算法融入系统中,可以为用户提供SAR图像分类功能。具体来说,该系统包含图像加载、预处理、算法选择和SAR图像识别等功能。最终,该系统可以实现SAR图像准确