关键词:
数据流挖掘
特征演化
增量学习
动态数据流
集成学习
摘要:
目的特征演化数据流的特征空间随时间推移而动态变化,传统增量学习方法囿于固定特征空间的假设,无法直接应用于特征演化数据流的学习场景,因此针对挖掘特征演化数据流时面对的分类模型与当前数据特征不匹配而失效、模型预测性能受噪声干扰等问题,提出了一种面向特征演化数据流的增量学习方法。方法首先,通过引入模糊隶度函数并结合增量孪生支持向量机模型,鲁棒地训练与更新分类器;当出现新特征时,重新训练新分类器,同时结合局部线性加权回归算法拟合新旧特征之间的映射关系,从而在旧特征消失时,利用所学到的映射关系,将已训练好的旧分类器投影至新特征空间继续更新;最后,结合两种不同的集成策略以合并新旧两分类器实现共同预测。结果通过大量仿真实验,所提方法分类准确率相较于对比方法提升了0.3%~21.7%;在含不同信噪比数据集上,分类模型性能整体优于对比模型,并随着人工增加噪声比例,模型分类效果受负面影响较小。结论所提方法得以构建性能高效稳定的分类模型,在提升模型预测精度的同时能减少噪声对分类性能的干扰,增强了模型对特征演化数据流自适应学习能力。