关键词:
小样本学习
光谱分析
数据增强
对抗攻击
对抗防御
摘要:
基于振动光谱分析的无损检测技术在化工、制药、国防等多个领域应用广泛。近年来,深度学习技术高速发展,基于深度学习的振动光谱分析方法越来越受到重视。然而,由于特殊环境要求和高昂的采样设备成本等因素,将深度学习应用于光谱分析领域面临数据样本稀缺的挑战。训练数据不足,导致深度网络模型难以充分训练,识别精度提升受限。此外,已有研究表明,面向图像、语音等领域的深度学习模型容易受到精心制造的对抗样本的欺骗。因此,小样本场景下的深度光谱分析模型的对抗鲁棒性也是亟待深入研究的问题。
为解决光谱分析模型因训练数据不足而导致的性能低的问题,本文提出了一个新的自监督学习框架,该框架能够生成具有语义的新数据,从而辅助光谱分析模型的训练。为深入研究光谱分析模型的对抗鲁棒性,本文首先从攻击者的角度出发,在白盒设置下使用不同的攻击方法针对光谱分析模型生成对抗样本。结果表明,光谱分析模型同样存在面对对抗样本时鲁棒性差的问题。最后,本文从防御者的角度进行光谱分析模型的防御性研究,分析不同方法的防御效果。
第一,针对振动光谱分析领域现存的数据量不足的问题,结合已有的数据增强方法,本文提出了一种端到端的神经网络框架——Tea Net。与现有数据增强方法相比,Tea Net降低了训练过程中对数据量的要求,且可以产生具有语义的新样本。实验结果表明,Tea Net训练得到的振动光谱分类器精度有所提升。
第二,为了研究现有振动光谱分析模型的对抗鲁棒性,本文基于图像领域中提出的攻击方法,结合光谱数据的特征,提出了一种面向振动光谱分析模型的新攻击方法。与直接应用于图像领域的攻击方法相比,该方法生成的对抗样本具有更好的隐蔽性。此外,从特征空间的角度出发,本文提出了一种新的攻击模式,并将其应用于光谱匹配系统。实验结果显示,在对抗攻击的背景下,现有的光谱分析模型普遍存在对抗鲁棒性差的问题。
第三,针对现存的振动光谱分析模型面对对抗样本时鲁棒性差的问题,基于前述攻击方法,本文从主动防御和被动防御两个角度出发,提出了一系列防御措施。其中包括被动防御:平滑化、网络参数正则化以及对抗性训练;主动防御:使用附加网络检测对抗样本。实验结果表明,平滑化和使用附加网络检测对抗样本可以有效的过滤对抗样本,而网络参数正则化和对抗性训练很容易被重新产生的对抗样本欺骗。