关键词:
高频数据
已实现波动率
外部变量
EEMD分解
XGBoost模型
摘要:
股票市场作为一国经济的“晴雨表”,可以实现资源的合理化配置和充分利用,投资者可以在股票市场中获得可观的收益。然而,风险与收益并存,如何实现股票市场风险的良好管理,是一个不容忽视的问题。除此之外,股票市场受多种因素的影响,外部变量对股市波动的影响同样不容忽视。迄今为止,异质自回归(HAR)模型是基于高频数据的波动率建模研究中最经典的模型之一,许多学者基于该模型提出了很多改进,如简单地将它分解为连续的路径变化和不连续的跳跃路径变化进行研究。然而,已实现波动率是一个非常复杂的非线性时间序列,这种简单的分解很难理解其变化规律,这不利于我们对其进行分析和建模。而集合经验模态分解方法(EEMD)不仅可以从序列中自适应地选择波动特征,而且对于非线性时间序列分解具有鲁棒性。此外,HAR模型本质上是一个线性模型,它使用线性模型对已实现波动率进行建模,忽略了其非线性特质,而XGBoost这种机器学习方法具有优秀的非线性拟合能力,且因其优良的学习效果等优点获得广泛的关注。基于上述背景,本文详细阐述了研究背景、研究意义和相关的研究现状和理论基础之后,对于已实现波动率的短期、中期和长期预测问题分别提出了基于EEMD-XGBoost预测模型。在实证研究中,首先对2015年1月5日至2020年12月25日上证指数的已实现波动率序列进行EEMD分解,并根据零均值显著性检验结果对分解序列进行重构,然后针对已实现波动率的短期、中期和长期预测问题,将不同的重构序列与已实现波动率的原始序列作为输入变量,分别拟合XGBoost模型,并与EEMD-HAR模型对比预测效果。此外,还将经济政策不确定性指数(EPU)和恐慌指数(VIX)作为外部变量研究了其对已实现波动率的影响,主要结论如下:(1)将序列进行EEMD分解,并以零均值显著性检验重构得到的序列中,低频序列有明显的趋势性,这与其原始序列的走势大致相同,这表明低频序列应该包含更多的预测信息;趋势项则体现的是已实现波动率的整体走向,这证明了EEMD分解方法的有效性。(2)将经过EEMD分解重构的序列与已实现波动率的原始序列作为输入变量拟合XGBoost预测模型,并将其预测效果与EEMD-HAR模型对比后发现,对于每日、每周和每月已实现波动率的预测效果,EEMD-XGBoost模型均显著优于EEMD-HAR模型。(3)关于外部变量对已实现波动率的影响,结果表明经济政策不确定性指数(EPU)和恐慌指数(VIX)对于每日和每周已实现波动率的预测效果提升不明显,而对于每月已实现波动率的预测效果有明显的改善,这表明EPU指数和VIX指数对已实现波动率更倾向于长期的影响。