基于可解释性放射组学模型的氨基酸PET显像在侵袭性胶质瘤诊断中的临床应用研究

基于可解释性机器学习的氨基酸PET成像在胶质瘤诊断中的应用研究

学术背景

胶质瘤(glioma)是中枢神经系统最常见的恶性肿瘤之一,其诊断和治疗策略通常依赖于组织病理学分析。然而,组织病理学分析存在侵入性高、耗时长等局限性。近年来,基于医学影像的放射组学(radiomics)技术逐渐兴起,通过从医学图像中提取大量定量特征,结合机器学习(machine learning, ML)算法,能够有效捕捉复杂的影像特征关系,为胶质瘤的诊断和预后评估提供了新的可能性。然而,尽管机器学习模型在胶质瘤预测任务中表现出较高的效率,但其在临床实践中的应用仍受到限制,主要原因在于模型决策过程缺乏透明性,且难以与临床工作流程无缝整合。

为了解决这一问题,可解释性机器学习(explainable machine learning, XML)方法应运而生。这些方法通过提供模型预测的解释,帮助医生理解模型决策的依据,从而增强对模型的信任。本研究旨在探讨基于氨基酸正电子发射断层扫描(positron emission tomography, PET)成像的可解释性放射组学模型是否能够改善核医学医生在胶质瘤诊断中对肿瘤侵袭性的评估。

论文来源

本论文由来自法国多个研究机构的团队合作完成,主要作者包括Shamimeh Ahrari、Timothée Zaragori、Adeline Zinsz等。研究团队来自法国洛林大学(Université de Lorraine)、南锡大学医院(CHRU-Nancy)等多个机构。论文于2024年发表在《European Journal of Nuclear Medicine and Molecular Imaging》期刊上,DOI为10.1007/s00259-024-07053-6。

研究流程

1. 研究设计与数据收集

研究回顾性纳入了2013年1月至2023年1月期间在南锡大学医院核医学科接受动态6-[18F]氟-L-多巴(18F-FDOPA)PET扫描的患者。所有患者均在PET扫描后30天内进行了常规磁共振成像(MRI)检查,并在60天内通过手术或立体定向活检获得组织病理学诊断。最终,研究共纳入85名患者,其中63名用于训练集,22名用于测试集。

2. 图像采集与预处理

所有患者在PET扫描前至少禁食4小时,部分患者在扫描前1小时服用卡比多巴(carbidopa)以增强脑部示踪剂摄取。PET扫描使用两种不同的成像系统(Siemens Biograph 6 True Point PET/CT和Philips Vereos PET/CT)进行,扫描时间为30分钟。静态图像基于最后20分钟的采集数据重建,动态图像则分为30帧,每帧1分钟。静态图像通过线性插值进行空间重采样,以获得各向同性的2×2×2 mm³体素。

3. 特征提取

从静态和动态PET图像中提取了208个放射组学特征,包括一阶统计特征、形态学特征和纹理特征。特征提取使用了PyRadiomics软件包和自研软件。此外,还提取了代谢肿瘤体积、肿瘤与背景比值(tumor-to-background ratio, TBR)等常规特征。

4. 模型训练与评估

研究采用分层随机抽样将样本分为训练集(75%)和测试集(25%)。通过去除零方差特征、归一化处理以及基于Spearman相关系数的层次聚类,筛选出最具信息量的特征。随后,使用集成分类器(包括逻辑回归、支持向量机、随机森林和梯度提升决策树)进行模型训练,并通过5折交叉验证优化超参数。最终模型在测试集上进行评估。

5. 模型解释

研究采用了三种可解释性机器学习方法——局部可解释模型无关解释(Local Interpretable Model-agnostic Explanations, LIME)、锚点解释(Anchor)和Shapley加性解释(Shapley Additive Explanations, SHAP)——为测试集中的每个患者生成模型解释。这些解释通过可视化工具提供给医生,帮助其理解模型预测的依据。

6. 医生评估

研究邀请了来自8个机构的18名核医学医生参与评估。评估分为两个阶段:第一阶段,医生仅基于常规MRI和PET图像对22个测试样本进行分类;第二阶段,医生在相同样本的基础上,结合放射组学模型的预测结果和解释进行重新评估。评估内容包括诊断准确性、医生间一致性以及医生对诊断的信心水平。

研究结果

1. 模型性能

在测试集上,放射组学模型的AUC为0.718,诊断准确性为0.775。与第一阶段相比,医生在第二阶段的诊断准确性显著提高(0.775 vs. 0.717,p = 0.007),敏感性和特异性也分别提高了6%和12%。

2. 医生评估结果

在第二阶段,医生的诊断一致性显著提高,Fleiss’s kappa评分从0.609提升至0.747。此外,医生的诊断信心水平也显著增强(p < 0.001)。在三种可解释性方法中,Anchor和SHAP的有效性分别达到75%和72%,显著优于LIME(p ≤ 0.001)。

3. 模型解释的影响

当模型预测正确时,医生的诊断准确性显著提高;而当模型预测错误时,医生的诊断准确性有所下降。研究还发现,模型解释能够帮助医生更好地理解影像数据,从而提升诊断信心。

结论与意义

本研究证明了基于氨基酸PET成像的可解释性放射组学模型在胶质瘤侵袭性评估中的潜在价值。通过提供模型预测的解释,该模型显著提高了医生的诊断准确性和信心水平,同时增强了医生间的一致性。这一研究为机器学习模型在临床实践中的应用提供了新的思路,尤其是在神经肿瘤学领域。未来的研究可以进一步探索该模型在其他神经肿瘤学任务(如胶质瘤复发检测)中的应用,以推动学习算法在医疗保健中的广泛应用。

研究亮点

  1. 创新性方法:本研究首次将可解释性机器学习方法(LIME、Anchor、SHAP)与放射组学模型结合,用于胶质瘤的诊断支持。
  2. 临床实用性:研究通过两阶段医生评估,验证了模型在真实临床环境中的有效性,为机器学习模型的临床转化提供了重要参考。
  3. 多中心合作:研究团队来自多个法国医疗机构,确保了研究结果的广泛适用性。
  4. 数据多样性:研究纳入了来自不同成像系统的数据,增强了模型的鲁棒性。

其他有价值的信息

研究还指出,尽管模型在大多数情况下能够提高医生的诊断准确性,但在某些罕见病例(如黄色星形细胞瘤)中,模型的预测可能存在偏差。此外,研究强调了医生对机器学习模型的熟悉程度对其诊断决策的影响,建议未来研究进一步探讨这一问题。