关键词:
区域滑坡易发性制图
机器学习
集成学习
卷积神经网络
摘要:
滑坡作为我国发生最频繁的灾害之一,对国家的经济发展、社会和谐稳定和人民的生命财产安全都造成了严重威胁。随着整个社会对滑坡灾害的日益重视,十分有必要分析区域滑坡分布规律,从而预测滑坡空间分布特征,进而采取有效的预防措施。区域滑坡易发性制图作为近年来评价滑坡最主要的手段之一,能够有效地进行区域滑坡易发性分区,对于滑坡防灾减灾及城镇规划等工作具有重要意义。
近些年,机器学习方法被广泛应用于滑坡易发性制图研究,主要因为这类方法具有省时省力、客观性强等特点,能有效解决许多传统野外调查、专家知识方法所无法解决的问题。但是传统机器学习方法在滑坡易发性建模中还存在许多不足与局限性,如逻辑回归容易欠拟合,不能很好的处理滑坡这样的非线性数据;支持向量机处理大样本很耗时,且不能很好处理多分类问题。与之相比,基于多种机器学习的集成方法,在区域滑坡易发性制图中具有适用范围广、分类精度高的优点,表现出更好的拟合效果。
针对传统机器学习方法在区域滑坡易发性制图中的不足,本文以达州市为研究区,首先选取适合研究区的致灾因子,并对因子进行易发性分析,再制作出研究区滑坡样本集;然后将传统机器学习方法与集成方法进行集成,构建出新的集成模型;最后将上述模型用于区域滑坡易发性制图,并分别对模型效果与易发性结果进行分析与比较,以研究集成机器学习方法的合理性与有效性。具体研究工作和结果如下:
(1)采用成因分析、相关研究等方法,选取研究区适合的滑坡致灾因子。为了探究滑坡与周围地理环境因素的关系,选取了研究区合适的滑坡致灾因子,在分析研究区地理环境因素、调研相关研究、参考数据可获取性的基础上,从地形地质、土地覆盖、气象水文、人为活动四个方面选取了12个滑坡致灾因子。最后对12个因子进行共线性分析,结果证明12个因子不存在多重共线性,都能被用到后续研究。
(2)量化致灾因子评价指标,从而对滑坡致灾因子进行易发性分析,进而制作滑坡样本集。为了分析致灾因子与滑坡空间分布关系,首先利用自然间断法将每个因子划分为不同评价等级,再采用确定性系数法量化因子评价指标,然后对因子易发性进行评价。评价结果显示,滑坡空间分布为西南区域多,东北区域少;且滑坡主要分布在低海拔的山地、丘陵地区,缓坡,直线坡,坡向为西,离断层较远的区域;植被覆盖度适中、草地等区域也易发生滑坡;滑坡在离河流较近,水体指数适中,TWI值较小,年降雨量1100mm左右的区域分布较多;同时距离道路较近的区域也是滑坡主要分布区域。最后通过将滑坡点和非滑坡点与致灾因子专题图进行叠加,制作研究区滑坡样本集。
(3)将机器学习方法与集成方法进行集成,构建新的集成模型,再将其应用于区域滑坡易发性制图,最后分别对易发性建模效果和易发性评价结果进行分析与比较。首先采用将支持向量机(SVM)、决策树(DT)、逻辑回归(LR)分别替代Ada Boost算法(AB)、旋转森林算法(ROF)的基分类器,以及利用卷积神经网络(CNN)提取特征用于SVM、DT、LR分类的方式,构建出九种新的集成方法。再将上述集成模型用于区域滑坡易发性制图,并利用查准率、查全率、准确率、Kappa系数、AUC值等评价指标对建模效果进行定量分析。
研究结果表明,集成方法能有效提升传统机器学习在区域滑坡易发性制图中的效果,其中ROF-SVM的效果最好(AUC=0.7118)。SVM与集成之后相比,ROF-SVM、CNN-SVM的AUC值分别上升了0.0125和0.0071,但是AB-SVM的AUC值下降了0.0261;在对DT的集成模型中,与AB、ROF、CNN集成后的AUC值分别上升了0.0423、0.0453、0.035。在对LR的集成模型中,AB、ROF、CNN集成后的AUC值分别上升了0.0114、0.0074、0.0159。利用上述九个模型制作研究区滑坡易发性地图,并将该区域划分为极高、高、中、低、极低风险区五类,结合对滑坡灾害实际发育情况的分析,除了AB-SVM,其他模型生成的易发性地图都比较合理,其中ROF-SVM为最适合达州市的滑坡易发性制图模型。