关键词:
肝细胞癌
磁共振成像
影像组学
深度学习
微血管侵犯
摘要:
目的:探讨基于增强MRI的传统机器学习及深度学习方法术前预测肝细胞癌(hepatocellular carcinoma,HCC)微血管侵犯(microvascular Invasion,MVI)的价值。材料与方法:回顾性收集2009年5月~2021年7月于我院行1.5T和3.0T MRI检查且术后病理为HCC的患者174例,其中MVI(+)61例,MVI(-)113例,按7:3比例随机分为训练集121例(MVI(+)42例,MVI(-)79例)和测试集53例(MVI(+)19例,MVI(-)34例)。在第一部分即“基于增强MRI传统机器学习方法术前预测HCC MVI的价值”研究中,收集临床资料及常规放射学特征,采用单因素及多因素logistic回归分析筛选肝癌MVI(+)临床放射学独立预测因素,基于独立预测因素建立临床放射模型。使用A.K软件对动脉期、门静脉期及延迟期MRI图像进行预处理,由两名观察者在ITK-SNAP中分别逐层手动勾画病灶轮廓并生成三维感兴趣区(region of interest,ROI)。利用A.K软件于各期分别提取107个影像组学特征,通过组内相关系数、Spearman相关性检验及梯度提升决策树(GBDT)筛选特征,基于传统机器学习方法(logistic回归)建立预测肝癌MVI的影像组学模型。本研究分别构建动脉期、门静脉期、延迟期及增强三期联合组学模型。基于所选特征及其在回归模型中的各自加权系数,计算影像组学评分(Radiomics score,Radscore)。采用受试者工作特征曲线(ROC)、校准曲线(Hosmer-Lemeshow检验)及决策曲线分析(DCA)分别评价上述组学模型,基于评价结果选择最优影像组学模型(后续称为“影像组学模型”)。采用logistic回归构建结合临床放射学独立预测因素、影像组学模型Radscore的临床放射-影像组学联合模型(即联合模型)。对临床放射模型、影像组学模型及联合模型进行评价(方法同前),确定本部分研究最优MVI预测模型。在第二部分即“基于增强MRI的传统机器学习与深度学习方法术前预测HCC MVI的价值比较”研究中,由于第一部分增强三期联合组学模型AUC较高,因而将增强三期图像纳入该部分进行研究。图像预处理及病灶分割同第一部分。对训练集的增强三期MRI图像进行数据增强(随机裁剪、水平翻转)及标准化后,将图像及标注结果输入Res Net18网络,直接输出MVI预测结果,该过程建立的模型为基于增强三期的卷积神经网络(CNN)模型。对CNN模型进行预测效能、校准性能及临床应用价值的评价。采用Delong检验对第一部分的增强三期联合组学模型与CNN模型进行比较。结果:在第一部分,白蛋白(albumin,ALB)、肿瘤内动脉为肝癌MVI临床放射学独立预测因素,构建的临床放射模型AUC在训练集及测试集分别为0.665、0.644。动脉期、门静脉期、延迟期及增强三期联合组学模型训练集AUC分别为0.699、0.635、0.674及0.807,与单一期相的组学模型相比,增强三期联合组学模型预测效能明显更高(P值分别为0.020、0.005、0.010);测试集AUC分别为0.667、0.738、0.695及0.759,与单一期相的组学模型相比,增强三期联合组学模型效能稍高,但差异均无统计学意义(P值均>0.05)。校准曲线及决策曲线显示各组学模型表现良好。基于评价结果,确定增强三期联合组学模型为本部分研究最优影像组学模型。在训练集中,联合模型(AUC:0.829)及影像组学模型(AUC:0.807)效能均显著高于临床放射模型(AUC:0.665)(P值分别为0.009、0.026);在测试集中,联合模型AUC为0.766,稍高于临床放射模型(AUC:0.644)和影像组学模型(AUC:0.759),但差异均无统计学意义(P值均>0.05)。三个模型在训练集及测试集均有良好校准性能及较高临床价值。在第二部分中,CNN模型AUC在训练集及测试集分别为0.949、0.854,校准曲线分析(Hosmer-Lemeshow检验)及决策曲线分析均表现良好。在训练集中,影像组学模型效能(AUC:0.807)显著低于CNN模型(AUC:0.949)(P值<0.001)。在测试集中,与影像组学模型(AUC:0.759)相比,CNN模型(AUC:0.854)效能较高,但差异无统计学意义(P值>0.05)。结论:1.传统机器学习方法建立的基于增强MRI的影像组学模型能有效预测HCC的MVI,且临床放射-影像组学联合模型预测效果更优。2.在增强MRI三期联合预测HCC MVI方面,深度学习方法建立的CNN模型有较高的价值,且优于传统机器学习方法的影像组学模型。