关键词:
胶囊网络
注意力机制
深度学习
卷积神经网络
高光谱影像分类
摘要:
高光谱影像分类任务一直是遥感领域的研究热点。随着高光谱成像技术的提高,高光谱影像数据向高分辨率方向发展,带来了更为丰富的光谱信息和空间结构信息,同时对分类模型提出了更高的要求。目前,基于卷积神经网络的深度学习模型是高光谱影像分类最常用的模型之一,但传统的卷积神经网络模型融合空间和光谱信息的能力较弱、平均化效应严重、对空域和光谱域信息的差异性不够敏感。引入胶囊网络,利用胶囊向量对特征的表达能力以及动态路由算法对特征的整合能力,提高模型的分类性能。首先,深入研究了卷积神经网络的基础理论和经典模型,通过对比经典的卷积结构,分析卷积的优缺点。在原生胶囊网络的基础上,改进卷积结构以提取多尺度特征和浅层特征,减少了平均化效应,并基于通道间的胶囊向量表达和子胶囊划分,表达数据空间结构的多样性,为后续构建基于胶囊网络的高光谱影像分类模型奠定基础。在Indian Pines、Salinas、Tea Farm、Pavia University和雄安马蹄湾村五种高光谱影像数据集上测试了多种经典模型,作为后续模型的对照组测试结果。其次,分析高分辨率高光谱影像的特点,改进卷积模块和胶囊结构。在卷积模块中引入了多尺度卷积、深度可分离卷积和跳跃连接等结构,以高效提取多样性特征。在胶囊结构中,根据特征图的空间或通道划分胶囊,并通过向量到向量或矩阵到矩阵的信息传递,在表达数据局部与整体关系的同时,改善了高分辨率带来的地物结构多样性对分类的干扰。在五种高光谱影像数据集上验证模型,证明所提出的胶囊网络在高光谱影像分类中的有效性,在五种高光谱影像数据集上分类精度有所提高。最后,在胶囊网络嵌入注意力机制,以提高模型对特征的表达能力。在卷积结构嵌入注意力机制,改善碎片化特征的同时提高模型的收敛速度;利用注意力机制代替胶囊整合过程中的仿射变换矩阵,以保持胶囊矩阵内部的空间结构特征。嵌入注意力机制的胶囊网络在训练时收敛速度快,模型精度更高,泛化性更强。通过在五种高光谱影像数据集上对比测试,在卷积结构中嵌入注意力的胶囊网络具有较高的实用性,利用注意力机制实现仿射变换的胶囊结构取得了良好的分类效果,为胶囊网络研究提供了新的思路。