关键词:
XGBoost模型
广义线性模型
可解释的人工智能技术
车险定价
摘要:
目前机器学习方法在诸多领域得到了广泛的应用,并取得巨大进展,但由于存在不可解释、不透明的缺点,制约了其在非寿险精算领域的实际应用。与此同时,我国商业车险市场化改革放大了保险公司的自主定价权,从而对其定价能力提出了更高的要求。因此可解释的人工智能技术在机器学习精算模型中的应用研究,将有助于机器学习方法在非寿险精算领域的推广,为保险公司提供了一种新的定价思路。本文主要是通过可解释的人工智能技术,研究机器学习精算模型的车险费率厘定过程,并以传统的广义线性模型为基准,说明机器学习精算模型的车险费率厘定过程及其预测结果具有合理性。首先,基于法国第三方责任险的车险保单数据freMTPL2freq和freMTPL2sev,对被保险人在一个保险年度的车险累积索赔额进行建模,并通过均方根误差来评价损失预测模型的预测精确度。然后,使用置换特征重要性方法、importance方法、interaction方法等可解释的人工智能技术,对损失预测模型中的“黑盒子”过程进行可视化、透明化,阐述损失预测模型的具体工作原理。最后,将XGBoost模型与广义线性模型进行对比,说明XGBoost模型的预测过程是合理的。基于车险费率厘定的国内外研究现状,本文提出以下两个创新点:第一,运用机器学习方法中的XGBoost模型,直接对车险累积索赔额进行预测。近年来,机器学习方法逐渐被应用于非寿险精算领域,其中的XGBoost模型更是在各大赛事中崭露头角,目前XGBoost模型主要应用于车险索赔频率及索赔强度的预测问题中,而较少有学者将其用于车险累积索赔额的预测中。因此本文在不考虑索赔是否发生的情况下,运用XGBoost模型中的线性回归对车险累积索赔额进行预测,并将其预测结果与广义线性模型进行比较。第二,运用importance、interaction、waterfall等可解释性方法,综合分析XGBoost模型在车险定价中的“黑盒子”过程。本文在对损失预测模型的可视化过程研究中,使用了 XGBoost模型特有的可解释性方法,与一般的可解释人工智能技术相比,importance方法、interaction方法以及waterfall方法,不仅涉及了车险费率厘定因子的重要性和边际效应分析,还详细且直观的阐述了车险费率厘定因子间交互效应的重要性。损失预测模型的实证结果表明:(1)当以均方根误差作为模型性能的评价指标时,XGBoost模型的预测精确度高于广义线性模型;(2)在可视化损失预测模型的“黑盒子”过程中,以广义线性模型为基准,车险费率厘定因子的重要性分析及边际效应分析结果表明,XGBoost模型的车险费率厘定过程及其结果具有合理性;(3)通过置换特征重要性方法对车险费率厘定因子的重要性分析,可以得出结论,XGBoost模型与广义线性模型中的车险费率厘定因子重要性排序基本一致,其中最重要的车险费率厘定因子是驾驶员风险因子,其次是车辆风险因子,最后是环境风险因子。