关键词:
慢性心力衰竭
中医辨证
机器学习
随机森林
支持向量机
摘要:
目的:
将机器学习方法与心衰中医辨证相结合,旨在开发一个提高慢性心衰中医辨证效率的智能模型,为心衰患者临床治疗和管理提供决策支持。
方法:
收集广州中医药大学第一附属医院2017年1月至2022年1月病房住院收治的慢性心力衰竭患者。根据病例纳入及排除标准筛选合适的病例,并对收集的病例临床数据进行严格的质量控制和预处理。随后,通过聚类分析,应用K-means算法,对心衰患者临床数据分组,探索并分析数据内部的异质性。其次,通过关联规则分析,利用Apriori算法,探索心衰患者临床特征之间的潜在关联。最后,应用支持向量机(Support Vector Machine,SVM)和随机森林(Random Forrest,RF)等机器学习方法构建心衰智能辨证模型,通过交叉验证、ROC曲线等方法对模型性能进行全面评价。
结果:
1.K-means聚类分析中,研究将心衰患者根据临床特征进行有效分类,识别出不同的患者群体,并通过簇内特征分析深入探讨各群体的特点。研究结果提示:气阴两虚血瘀证在聚类簇中具有高度相关的特性,表明气阴两虚血瘀证在某些特征指标存在高度一致性。同时也观察到某些聚类簇包含多种证型,如气虚血瘀证和阳气亏虚血瘀证联系紧密,由此可猜测气虚血瘀证和阳气亏虚血瘀证的某些特征指标相似。
***关联规则分析中,通过挖掘心衰临床特征之间的频繁项集,研究发现一系列有助于心衰辨证的关键特征。研究表明:气促、乏力、神志清等症状在气虚血瘀证、阳气亏虚血瘀证、气阴两虚血瘀证三种辨证类型中频繁共现,提示对于心衰的三种证型,气促、乏力、神志清等症状普遍存在。同时,研究发现,针对气阴两虚血瘀证,舌色红是其强关联特征,针对阳气亏虚血瘀证,该证型患者多合并高血压疾病。
3.心衰辨证模型方面,支持向量机(SVM)和随机森林(RF)模型均展现出优异性能。通过对比分析模型的准确率、召回率、精确率和F1分数等评价指标,研究发现:SVM模型在气虚血瘀证的诊断中,准确率为81.44%、精确度为64.71%、召回率为82.24%、F1分数为72.43%;在气阴两虚血瘀证,模型的准确率为95.01%、精确度为93.83%、召回率为95.00%、F1分数为94.41%;在阳气亏虚血瘀证,模型的准确率为85.32%、精确度为82.54%、召回率为55.32%、F1分数为66.24%。同时,对于RF模型,气虚血瘀证的准确率为81.16%、精确度为66.12%、召回率为74.77%、F1分数为70.18%;在气阴两虚血瘀证,模型的准确率为95.01%、精确度为95.51%、召回率为93.12%、F1分数为94.30%;在阳气亏虚血瘀证,模型的准确率为83.38%、精确度为70.24%、召回率为62.77%、F1分数为66.29%。并且,对比RF模型和SVM模型在不同证型上的AUC值,研究发现,SVM模型和RF模型在气虚血瘀证和气阴两虚血瘀证的诊断上AUC值一致,分别为0.88和0.99。然而,在阳气亏虚血瘀证的诊断上,SVM模型的AUC值为0.91,而RF模型的AUC值为0.89,略低于SVM模型的性能。
结论:
研究通过结合中医传统辨证理念与现代机器学习技术,构建新型心衰辨证模型。通过多种评估指标验证,RF模型和SVM模型均能有效识别心衰患者的中医证型。并且,由于SVM模型在非线性问题上的强大处理能力,在本研究中展现出更好的分类效果。研究的创新性尝试为心衰辨证的客观化、智能化、高效化提供了有效的策略和方向。