关键词:
心力衰竭
风险评估
异构数据特征提取与融合
不平衡学习
小样本学习
摘要:
随着社会老龄化进程的加速,心力衰竭患者数量持续攀升,其高发病率和高死亡率已成为全球范围内亟待解决的重大公共健康问题。这一现象不仅深刻影响患者的健康和生活质量,还对医疗系统的可持续发展和社会经济带来了严峻挑战。作为心力衰竭管理的核心环节,风险评估涵盖了疾病诊断、死亡风险预测以及疾病进展评估等多方面内容,对患者的治疗和管理具有重要意义。电子健康记录(EHR)作为患者医疗数据的数字化载体,能够全面、动态地反映患者的健康状态及诊疗过程。通过对患者EHR数据个性化分析,可为识别高危患者、预测疾病进展及相关不良事件的发生概率、临床治疗方案的制定及医疗资源优化配置提供重要支持。
然而,传统风险评估方法多依赖线性模型或规则统计分析,难以挖掘复杂临床数据中的非线性特征与多维关系。随着医疗数据激增和人工智能技术发展,深度学习凭借卓越的特征提取和模式识别能力,已成为风险评估领域的研究热点。在心力衰竭风险评估中,现有深度学习方法仍面临多重挑战,包括EHR数据的异构性、多模态特征融合不足、阳性样本稀缺导致的类别不平衡,以及院外随访数据的高成本限制下的样本稀疏问题,严重影响了模型的鲁棒性与泛化能力。
针对上述问题与挑战,本文对心力衰竭风险评估中的深度学习方法进行了研究,重点探索异构数据的特征提取与融合方法,以及针对数据不平衡和小样本问题的深度学习优化策略。论文的主要工作与创新点包括:
(1)针对心力衰竭患者结构化表格数据中特征信息复杂、多维交互关系难以有效挖掘的问题,本文提出了一种基于多视角融合的心力衰竭风险评估方法。该方法采用Transformer机制从表格视角提取数据特征,同时将表格数据压缩及聚合进行图像视角转换,并引入双门控注意力机制对不同视角的特征进行融合。通过心力衰竭患者院内死亡预测任务对该方法进行验证,实验结果表明,所提方法能够有效捕捉现有方法难以发现的表格数据中所包含的潜在模式与关系。
(2)针对心力衰竭患者时间序列数据中采样时间不规则导致的特征表达混乱和时间依赖性难以建模的挑战,本文提出了一种基于通道独立特征提取与集成机制的心力衰竭风险评估方法。该方法通过引入时间感知注意力机制对各变量进行独立分析捕捉不规则采样时间序列中的时间间隔差异性,结合神经常微分方程(NODE)与门控循环单元(GRU)分别对临床数据的连续时间演化与离散时间依赖性进行建模,并通过反向Transformer(iTransformer)机制融合各变量的特征,以捕捉临床变量之间的多样化关联。通过心力衰竭患者院内死亡预测任务验证该方法,实验结果表明其能够对不规则时间序列数据进行有效建模,并显著提升风险评估的准确性。
(3)针对心力衰竭患者异构数据(如结构化表格数据、动态时间序列数据以及文本记录)所存在的形式差异和特征分布不一致问题,提出了基于多源异构数据融合心力衰竭风险评估方法。该方法融合各模态数据的关键特征信息,采用交叉注意力机制构建多模态数据融合框架并获取各模态特征间的交互关系,自适应地分配不同模态特征的重要性权重。心力衰竭患者院内死亡预测任务的验证结果表明该框架有效提高了模型对异构数据的整合能力。
(4)针对样本类别不平衡问题,本文提出了一种新颖的基于深度强化学习(DRL)不平衡优化策略的深度学习心力衰竭风险评估方法,以提升前述特征提取与融合模型在阳性样本稀缺情况下的预测能力。该方法利用马尔可夫决策过程(MDP)将心力衰竭风险评估建模为DRL分类问题,通过稀缺阳性样本正向奖励函数与假阳性/假阴性样本差异化惩罚机制的构建优化模型的决策策略,并采用优先经验回放策略等提升DRL模型的稳定性。在心力衰竭院内死亡预测任务和心力衰竭诊断任务两种典型任务上验证所提方法的有效性,实验结果表明,与现有方法相比,所提方法在两种任务中均显著提升了模型的分类性能。
(5)针对心力衰竭风险评估中的小样本条件下学习性能下降问题,提出了一种集成一阶初始参数优化与超参数优化的元学习综合心力衰竭风险评估策略。该策略面向小样本任务,基于梯度下降方法及多任务反复训练对初始参数进行调整,引入超梯度下降机制动态调整学习率,以提高小样本数据的利用率并加速模型的收敛性。该策略有效提升了前述异构数据特征提取、融合方法及不平衡优化评估策略在小样本条件下的模型性能,具备良好的可扩展性。心力衰竭院外死亡预测任务的实验验证表明,该方法在小样本条件下具有显著的优势。
本文通过对异构数据特征提取与融合方法以及不平衡与小样本问题优化策略的系统研究,为心力衰竭风险评估中的多个核心问题提供了有效解决方案,具有重要的理论意义和实践价值。