关键词:
VTE
神经外科
机器学习
Caprini量表
Boruta
摘要:
目的 构建基于机器学习算法的神经外科静脉血栓栓塞症(venous thromboembolism, VTE)风险预测模型。方法 采用过采样技术对数据进行平衡,应用Boruta算法进行关键特征变量筛选,然后利用AdaBoost、GBDT、LightGBM、SVM四种机器学习方法构建预测模型,并利用准确率、精确度、召回率、F1分数进行模型性能评估,综合对比四个模型的性能,选取最佳模型,并进行模型变量重要性分析。结果 Boruta方法最终将C1(年龄)、C3(体质指数(BMI>25 kg/m^(2)))、C7(下肢肿胀)、C8(卧床的内科患者)、C10(严重肺病,包括肺炎(<1个月))、C16(其他危险因素)、C18(大型开放手术(>45 min))、C20(限制卧床(≥72 h))、C21(恶性肿瘤(现患或既往))、C31(DVT/PTE史)、C33(脑卒中(<1月))、C35(多发性创伤(<1个月))确定为关键特征变量。利用AdaBoost、GBDT、LightGBM、SVM四种机器学习方法构建预测模型,GBDT是表现最佳的模型,准确率是0.967,精确度是0.967,召回率0.954,F1分数是0.954。年龄、下肢肿胀、卧床的内科患者、体质指数(BMI>25 kg/m^(2))、大型开放手术(>45 min)是神经外科VTE最重要的风险因素。结论 基于机器学习和Caprini评估量表构建的风险预测模型具有较高的模型性能,能够有效缩减评估指标,提升VTE评估的准确性和效率。