关键词:
超声
肺
穿刺活检
机器学习
预测模型
摘要:
目的:
本研究旨在通过应用机器学习算法,分别构建超声引导下经皮肺穿刺活检术后出血或气胸风险的预测模型,评估模型效能及各个变量对预测的贡献度,总结穿刺经验,为临床尽早识别可能发生并发症的高风险患者提供证据支持,从而提早干预、降低主要并发症发生率及风险。
方法:
1、回顾性分析2017年1月--2022年6月间行超声引导下经皮肺穿刺活检术的所有患者病例,主要结局分为出血组(术后有出血、术后无出血)、气胸组(术后有气胸、术后无气胸)。收集所有患者相关临床信息、病灶特征及穿刺相关资料。将全部数据随机以7:3划分为训练集和测试集,运用随机负例采样方式,对出血组及气胸组分别构造10000个正例样本和负例样本比例为1:1的数据集,通过单因素逻辑回归,保留P≤0.05的变量,统计每个变量的入选频次,分别选取出血组和气胸组频数前10名的变量进入机器学习模型构建。
2、使用总样本中70%划分为训练集的样本构建术后出血和术后气胸的逻辑回归方程预测模型,并进行效能评估。
3、分别在出血组和气胸组的训练集中将所有阳性样本和随机采样选取同等数量的阴性样本进行组合,每组建立阳性样本组合相同但阴性样本组合不同的新的数据子集,每个数据子集采用决策树算法作为基础模型,并使用梯度提升机器学习方法各构建5个梯度提升分类器模型。对上述2组(出血组5个、气胸组5个)模型引入多数投票机制集成方法,分别再建立一个多数投票型预测模型。对比各组逻辑回归方程预测模型、5个梯度提升模型和投票机制模型的效能,得出最优模型。
结果:
1、根据纳排标准,排除116名患者,最终纳入899名患者,术后共88名(9.8%)患者发生并发症,其中出血65人(7.2%),气胸26人(2.8%),胸膜反应1人(0.1%)。
2、出血组及气胸组的最优模型均为投票机制预测模型,其受试者工作曲线下面积分别为0.77(95%CI 0.64-0.89,P<0.05)、0.87(95%CI 0.79-0.94,P<0.05)。出血组的逻辑回归及5个梯度提升分类器预测模型GBC_0至GBC_4的受试者工作曲线下面积分别如下:0.62(95%CI 0.47-0.76,P<0.05)、0.71(95%CI0.60-0.82,P<0.05)、0.73(95%CI 0.61-0.85,P<0.05)、0.70(95%CI 0.58-0.83,P<0.05)、0.70(95%CI 0.58-0.82,P<0.05)、0.65(95%CI 0.50-0.81,P<0.05)。气胸组的逻辑回归及5个梯度提升分类器预测模型GBC_0至GBC_4的受试者工作曲线下面积分别如下:0.61(95%CI 0.42-0.79,P<0.05)、0.70(95%CI0.45-0.95,P<0.05)、0.73(95%CI 0.53-0.93,P<0.05)、0.82(95%CI 0.66-0.98,P<0.05)、0.79(95%CI 0.68-0.89,P<0.05)、0.84(95%CI 0.80-0.90,P<0.05)。
3、根据出血组的SHAP直方图结果显示,在GBC_0至GBC_4这5个预测术后出血风险的梯度提升分类器模型中,各个模型贡献度排名第一的变量及其对相应模型贡献度结果如下:病灶-胸膜接触弧长(23%)、病灶内坏死灶(50%)、病灶位置(33%)、空气支气管征(28%)、病灶内坏死灶(31%);根据气胸组的SHAP直方图结果显示,在GBC_0至GBC_4这5个预测术后气胸风险的梯度提升分类器模型中,各个模型贡献度排名第一的变量及其对相应模型贡献度结果如下:病灶-胸膜接触弧长(56%)、病灶最大径(87%)、病灶-胸膜接触弧长(70%)、病灶-胸膜接触弧长(84%)、患者穿刺体位(74%)。
结论:
1、投票型预测模型为预测超声引导经皮肺穿刺活检术后发生出血并发症的最佳模型,对模型贡献度较大的变量为病灶内坏死灶、病灶位置、空气支气管征以及病灶-胸膜接触弧长;对于病灶内有坏死灶或空气支气管征,或病灶处于中下肺者、或病灶-胸膜接触弧长小的患者,临床医师需给予足够的重视,术前予患者进行充分的呼吸训练及心理辅导,提前使用止血药,选择年资较高的穿刺医师,避开病灶中有坏死灶及空气支气管征的部位进行穿刺,可降低术后出血发生的风险。
2、投票型预测模型为预测超声引导经皮肺穿刺活检术后发生气胸并发症的最佳模型,对模型贡献度较大的变量为病灶-胸膜接触弧长、病灶最大径以及患者穿刺体位。对于小病灶、病灶-胸膜接触弧长小的患者,临床医师穿刺时应谨慎操作,同时术前与患者进行充分的呼吸训练及心理辅导,在能够清楚显示病灶切面时尽量选择仰卧位或俯卧位进行穿刺,减少切割次数,可降低术后气胸发生的风险。
3、综合负例采样、多重抽样、梯度提