关键词:
机器学习
肺癌
术后心律失常
风险因素
预测模型
摘要:
目的:1、研究肺癌患者术后并发心律失常的现状,并探索其发生的相关危险因素;2、探讨机器学习算法模型在预测肺癌术后心律失常中的应用价值,为临床风险评估提供有效手段和工具。方法:本研究拟收集2022年6月-2022年12月南昌大学第一附属医院符合纳入标准和排除标准的胸外科234例非小细胞肺癌(NSCLC)患者相关病例资料,采用SPSS 26.0统计软件对采集的各个观察指标进行单因素及多因素分析。单因素分析,计量资料采用Wilcoxon秩和检验分析,计数资料采用卡方检验分析;多因素分析,采用二元Logistic回归算法进行分析,结果输出肺癌术后并发心律失常的独立危险因素,并构建简单机器学习Logistic回归风险分类预测模型。相关因素分析结果以P<0.05表示差异有统计学意义。利用基于python语言搭建的机器学习算法决策树(DT)、随机森林(RF)和支持向量机(SVM)对肺癌术后并发心律失常进行分类,构建另外三种风险分类预测模型。根据各个模型输出的风险分类预测结果,通过计算的ROC曲线下面积(Area under curve,AUC)、准确度(ACC)、精准度(Precision)、召回率(Recall)和f-score,来评估模型的预测性能。结果:1、现状分析本研究通过分析234名肺癌术后患者48-72小时内中并发心律失常的现状调查,心电报告结果显示肺癌术后发生心律失常患者人数为44人,占总人数的18.8%。其中术后并发心律失常主要类型有:心房颤动、房性心动过速、房性早搏、室性心动过速、室性早搏、束支传导阻滞、心脏骤停和窦性心律不齐等。房性心律失常26人占总人数的11.1%,占心律失常人数的59.1%,心房颤动12人占总人数5.1%,占心律失常人数的27.3%。2、危险因素分析单因素分析结果显示:年龄≥60岁、吸烟、冠心病、术前化疗、术前心电图、术中输血、术后电解质、手术方式、手术范围、纵隔淋巴结清扫、淋巴结转移、病理类型为鳞癌、病理分期、手术时长、BNP、FEV1%,共16个变量差异有统计学意义(P<0.05),为肺癌的术后相关危险因素。多因素Logistic回归分析结果显示:年龄≥60岁、冠心病、术前心电图、术中输血、手术时长、BNP,共6项肺癌术后心律失常的独立危险因素(P<0.05),FEV1%为1项肺癌术后心律失常的独立保护因素。3、Logistic回归模型、决策树模型、随机森林模型和支持向量机模型的准确率(ACC)分别为88%、81%、94%、92%,召回率(Recall)分别为79%、0.76%、90%、85%,精准度(Precision)分别为 83%、71%、86%、88%,受试者工作特征曲线(ROC曲线)下面积(AUC)分别为0.90、0.83、0.95、0.94。随机森林和支持向量机的识别精度高于Logistic回归和决策树的识别精度。在肺癌术后并发心律失常的预测分类模型中,随机森林和支持向量机的预测准确度高于Logistic回归和决策树的准确率。随机森林预测模型效能最佳,决策树的性能最差。4、肺癌术后心律失常发生率较高,主要与年龄≥60岁、冠心病、术前心电图、术中输血、手术时长、FEV1%、BNP等因素密切相关。随机森林模型在预测肺癌术后心律失常精度性能上优于支持向量机模型、决策树模型和Logistic回归模型,而Logistic回归模型对变量的解释能力强于其他模型。因此,实际应用时,可相互配合。结论:1、心律失常是胸外科肺癌根治手术术后常见并发症之一。本研究中肺癌患者术后并发心律失常发生率为18.8%,房性心律失常最为常见,占总人数11.1%,其中术后心房颤动发生率为5.1%。2、年龄≥60岁、冠心病、术前心电图、术中输血、手术时长、BNP是肺癌术后并发心律失常的独立危险因素,FEV1%是独立保护因素。3、本研究应用的机器学习算法风险分类预测模型中,Logistic回归、决策树、随机森林、支持向量机四种算法模型均可以对肺癌术后有无并发心律失常进行较准确预测。其中,在预测精度上,随机森林模型性能最好,支持向量机模型性能次之,再分别是Logistic回归模型和决策树模型。4、由于Logistic回归模型可对变量赋值,输出各个变量的预测概率,拥有对风险变量的解释能力,能更加直观地描述肺癌患者术后并发心律失常与危险因素间复杂的网络风险机制。临床上可以将Logistic回归模型与随机森林模型实际联合使用,为肺癌患者进行术前预测和筛查提供强大而有效的临床评估工具和手段。从而减少肺癌术后并发心律失常的发生率,减少患者住院费用,降低卒中和死亡率,改善患者长期预后,具有一定的临床指导意义。