关键词:
深度学习
端到端方法
混合建模
时间序列
分类
摘要:
数据科学是利用科学方法、算法和系统从数据中提取价值的跨领域学科。时间序列分析是数据科学的一个重要领域,分析按时间顺序排列的一系列数据点。时间序列分析可以通过数据揭示趋势、关联和相似性。很多领域都包含时间序列数据,例如,医疗保健、金融、遥感、天气预报、交通控制、工业等。近年来,时间序列分类已经成为工业界和学术界的一个重要研究问题,为此,研究人员提出了大量的时间序列分类模型。一般来说,好的时间序列分类模型可以捕获和泛化时间序列模式,可以对不可见的数据进行分类。深度学习是一个新兴的领域,以更复杂和抽象的方式象征统计数据。随着深度学习技术在文本、音频等多个序列数据分析领域的成功应用,研究人员开始采用深度学习技术解决时间序列数据挖掘问题。许多深度学习技术具有检测时间不变特征的能力,并且需要较少的数据来发现时间序列数据中的模式。它还可以处理高维数据,如多变量时间序列数据等。端到端方法可以直接从原始输入数据中学习特性,而且它们与领域无关,适用于任何类型的数据集。因此,本文采用端到端深度学习方法分类单变量和多变量时间序列数据。本文提出了四种基于端到端深度学习的单变量和多变量时间序列分类方法,在不需要大量数据预处理、特征加工、微调和细化的情况下提高了性能。本文的主要创新点如下。首先,双向长短时记忆(BiLSTM)是对传统长短时记忆(LSTM)的扩展,可以提高模型在序列分类问题上的性能。在输入序列的所有时间步长都可用的问题中,双向LSTM在输入序列上训练两个而不是一个LSTM。受此启发,可以利用BiLSTM为序列相关方法带来突破,并采用擅长特征提取的全卷积网络(FCN)作为时间序列的分类基线。因此,本文提出了一种新的BiLSTM-FCN模型用于单变量时间序列分类,它增加了两个分支,BiLSTM和FCN。本文还发现注意机制在BiLSTM-FCN上的有效性,提出了另一个模型ABiLSTM-FCN。在加州大学河滨分校(UCR)单变量时间序列档案的85个数据集上验证了这些模型的性能。实验结果表明,本文提出的模型全面优于当前最好的方法、传统技术和基线。其次,针对单变量时间序列分类问题,本文提出了另一种新的鲁棒方法残差LSTM(Res-LSTM)。Res-LSTM将残差网络(Res Net)和LSTM技术集成在一个单一的混合网络中,利用LSTM来学习长期依赖关系,并解决了消失梯度问题。有了Res Net,梯度可以直接流过跳过连接,从后面的层向后流到初始过滤器。因此,Res Net也可以帮助避免随着LSTM消失的梯度问题。此外,Res Net被认为是提出用于时间序列分类的最深层次的体系结构,可以从时间序列数据中提取深度空间特征。Res-LSTM模型是端到端的模型,不需要任何特性加工、数据预处理或微调。本文在85个单变量公共可用数据集上对Res-LSTM的性能进行了评价,实验结果表明,本文提出的方法比当前最好的方法、传统的方法和基线的性能更优越。再次,在两个端到端混合深度学习体系结构中,本文引入了注意机制、深度门控循环单元(deep Gated Recurrent Unit,d GRU)、挤压激励块(squeeze-and-励磁块)和FCN。利用注意机制构造dGRU的深度,并从时间序列数据中建立长期依赖模型。相比之下,FCN用来提取特征层次,SE块有助于从整体上重新校准特征映射,抑制信息较少的特征映射,并且可以很好地与FCN进行多元分类任务。不同领域的多变量和多变量数据集上的实验结果表明,本文所提出的模型比其他方法的性能更优越,并且不需要大量的数据预处理,可以部署在实时系统上。最后,本文研究了循环神经网络(RNN)及其变体,如双向循环神经网络(BiRNN)、双向长短期记忆(BiLSTM)、门控循环单元(GRU)和双向门控循环单元(BiGRU)等,用于多元时间序列分类。本文通过在MLSTM-FCN中替换LSTM来单独增加这些RNN变体,MLSTM-FCN是LSTM、SE块和FCN的组合。此外,本文在FCN中集成了SE块,以利用其在多变量时间序列分类任务中的高性能。由此产生的算法不需要大量的预处理或特征编码。因此,它们可以很容易地部署在实时系统上。通过对35个标准多元数据集进行综合评估,验证了本文所提方法比当前最好方法和基线的性能更优越。综上,大量的实验结果表明,本文所提出的模型新颖、高效,并且可以显著优于最先进的技术、传统方法和基线,而不需要任何繁重的数据预处理、特征加工、精炼或微调,可以很容易地部署在实时应用程序上。