关键词:
半监督学习
SAR图像目标识别
插值一致性
动态阈值
小损失选择
摘要:
合成孔径雷达(Synthetic Aperture Radar,SAR)是一种采用相干成像机制的主动式微波成像地面观测系统,其通过对目标物发射可以穿透云和植被遮挡的穿透性极强的电磁波,并快速接收回波信号,然后利用多普勒效应对回波数据计算,以实现远距离高分辨率成像,获取目标形状、结构、散射特性等丰富信息。具有全天时、全天候、远作用距离和高分辨率成像等优势,被广泛的应用在国防安全、勘察侦测、环境及能源监测等领域。SAR图像目标识别作为SAR图像分析和解译的基础问题,自SAR诞生以来持续获得了大量关注和研究。与光学图像不同,单极化SAR图像具有独特的散射机制和斑点噪声,增加了SAR图像目标识别的难度。而传统的SAR图像目标识别方法通过特征提取和分类器设计两个阶段进行识别,在特征提取阶段极为依赖先验知识且步骤繁琐。近年来,端到端的深度学习理论及方法快速发展,并在SAR图像目标识别领域获得了大量的应用验证。但深度学习方法需要依靠海量的标记数据进行特征提取,在SAR图像识别领域中收集大量适合深度学习方法的标记样本图像既昂贵又耗时。为了减少深度学习SAR图像目标识别方法对于标记样本图像的依赖,本文围绕半监督学习SAR图像目标识别这一热点课题,提出多块插值混合运算、一致性正则化师生模型、动态阈值和权值调整、早期样本选取重训练等半监督学习SAR图像目标识别方法,提高小数量标记样本情况下SAR图像目标识别模型的泛化性能,本文的具体研究内容和创新点如下:(1)针对SAR图像使用插值一致性算法处理后产生的混合后图像带有局部模糊的问题,分析现有的插值运算方法的优势与存在的问题,充分考虑插值运算带来的不利因素,提出多块插值混合运算半监督学习SAR图像目标识别方法。与现有插值混合运算方法进行全局混合思想不同,通过多个并列排序的矩形框将主次混合样本图像划分为不同区域,并在每个区域中随机选取小面积区域,进行插值混合处理,生成视觉效果近似于主混合样本且含有次混合样本的部分特征的新样本。使用新样本通过半监督学习的方式训练卷积神经网络模型,提高模型的识别泛化性能。通过所提策略插值运算后获得的图像更易被卷积神经网络模型所学习,提高半监督学习SAR图像的目标识别准确率。(2)针对当前基于师生模型的SAR图像目标识别半监督学习方法存在模型训练耦合效应,影响训练模型识别准确率的问题,提出一致性正则化师生模型半监督学习SAR图像目标识别方法,使用多个网络模型互为教师学生对无标记样本进行伪标记处理,优化网络模型的识别性能。首先对无标记图像样本进行多次数据增强,采用学生模型以一致性正则化的方式对多次增强后的样本进行预测,依据学生模型对无标记样本类别预测置信概率对无标记样本进行伪标记与排序,从而将无标记样本划分为一致性伪标记样本和置信伪标记样本,使用教师模型对划分后的置信伪标记样本重新标记,解决单一师生模型下半监督学习方法存在的耦合问题,改善学生模型对伪标记样本的整体标记准确度,以实现对模型识别性能的优化,并通过实测数据对所提方法进行了验证和分析。(3)针对SAR图像目标识别半监督学习方法在早期训练过程中存在伪标记样本标记错误率高,且伪标记样本类别分布不均衡,影响模型早期训练过程,从而影响最终所得卷积神经网络模型识别准确性的问题,提出动态阈值和权值调整半监督SAR图像目标识别方法。采用动态阈值和权值调整的策略减少用于训练模型的伪标记样本错误率,平衡伪标记样本类别分布。训练过程中统计每次用于优化模型的各类别伪标记样本数量,根据各个类别的历史数量分别设置不同阈值,以平衡各类别样本数量。同时根据计算获得各样本损失项的大小,将部分样本定义为“难学”样本,并赋予高学习权重,以使模型加强对“难学”样本的学习注意力,提高模型的识别泛化性能。(4)针对标记的SAR图像样本数据量极少的情况下,半监督学习模型存在过度拟合标记样本图像的风险,使SAR图像目标识别模型存在泛化性能不足的问题,提出早期样本选择再训练半监督SAR图像目标识别方法。根据早期训练模型首先学习简单、干净样本的原则,通过初始化多个参数不同的模型经过多次迭代训练得到模型集,使用模型集对无标记样本数据进行伪标注。然后在各个类别中筛选出一些具有高置信度的伪标记样本,组成低噪声伪标记样本集,同标记样本结合起来训练模型,从而丰富标记样本的数量。最后通过小损失选择的方法对低噪声伪标记样本和模型实时标记的伪标记样本进行进一步筛选,重新训练新的半监督学习SAR图像目标识别模型,以获得更高的识别准确率。