解释性Transformer模型结合PET与表格数据对滤泡性淋巴瘤的病理分级与预后:一项多机构数字活检研究

用PET影像与临床数据融合的Transformer模型:预测滤泡型淋巴瘤病理分级与预后的一项多中心数字活检研究

学术背景

滤泡型淋巴瘤(Follicular Lymphoma, FL)是西方国家最常见的惰性非霍奇金淋巴瘤,约占新诊断非霍奇金淋巴瘤的30%。根据世界卫生组织(WHO)的分类,滤泡型淋巴瘤分为三个病理等级(1-3级),等级的划分主要依据每高倍视野(High-Power Field, HPF)中的中心母细胞(Centroblasts)数量。然而,3级又进一步细分为3a级和3b级,其中3b级具有更具侵略性的生物学行为,患者预后较差,其治疗策略与弥漫大B细胞淋巴瘤(Diffuse Large B-Cell Lymphoma, DLBCL)相似。相较而言,1-2级患者通常病情进展缓慢,部分无症状、低肿瘤负荷患者甚至可以采取“观察等待”的管理策略。然而,3a级患者的生物学特性和临床表现介于1-2级和3b级之间,并且已证实同一等级间生存率也存在显著差异。

目前,活检联合免疫组化分析仍是确诊滤泡型淋巴瘤病理等级的金标准。然而,这种方法受限于取样偏差和难以从身体深部病变区域获得标本的困难。因此,虽然18F-FDG PET/CT广泛用于滤泡型淋巴瘤的分期,但其在分级中的作用尚未完全被挖掘。以往的研究尝试利用PET参数如SUVmax(最大标准摄取值)、TMTV(总代谢肿瘤体积)和TLG(总病灶糖酵解)来区分滤泡型淋巴瘤的分级。然而,这些研究样本量较小,通常是单中心研究,对其广泛推广性存在疑问。此外,传统的代谢参数对肿瘤异质性的洞察有限,从而难以全面捕获其生物学变异。

近年来,人工智能(Artificial Intelligence, AI)技术的兴起,为医学图像的深入分析提供了可能性,其中基于深度学习的模型在提取PET影像的细致病理信息方面显示了显著潜力。然而,多数AI模型主要依赖于医学影像上的放射组学特征(Radiomic Features)或仅从图像中直接提取信息,尚缺乏对临床数据的有效整合。此外,许多现有的AI模型属于“黑箱”模式,难以解释预测结果的形成过程,从而在临床应用中面临信任危机。

针对这些挑战,该研究旨在开发一种可解释(Explainable)的多模态融合Transformer模型,通过整合PET影像与临床数据,实现滤泡型淋巴瘤病理分级的精准预测,以及进一步的预后评估。


论文来源

这项研究由来自四川大学华西医院核医学科的研究团队牵头,联合南京大学医学院附属鼓楼医院、山东大学齐鲁医院、南京医科大学第一附属医院与厦门大学附属第一医院的研究人员共同完成。论文发表于《European Journal of Nuclear Medicine and Molecular Imaging》,在线时间为2025年1月。该研究的主要作者为Chong Jiang与Zekun Jiang。


研究流程

数据与研究对象

本研究纳入了来自五大独立医疗中心的513例滤泡型淋巴瘤患者,通过回顾性研究的方式,根据患者病理等级分为1-2级、3a级和3b级组别。基于不同地域的医疗中心,研究数据被划分为训练集、内部验证集、以及外部独立验证集。具体地: - 训练集包含来自四川大学华西医院、南京鼓楼医院及山东大学齐鲁医院的随机抽样数据,共275例患者; - 内部验证集包含69例患者; - 外部验证集为独立数据集,来自南京医科大学第一附属医院及厦门大学医院,包含169例患者。

数据预处理

  1. PET影像处理:提取每例患者的肿瘤体积区域(Volume of Interest, VOI),通过标准化处理消除扫描仪强度差异,并确定统一尺寸以适配模型输入。技术采用41% SUVmax阈值半自动勾画病灶。
  2. 临床数据标准化:整合包括年龄、LDH(乳酸脱氢酶)、B症状及其他8项临床特征进行归一化处理,以用于模型训练。
  3. 图像增强:为提升模型泛化能力,增加数据多样性,对PET影像进行旋转、缩放等图像增强操作。

模型设计与开发

本研究构建的Transformer模型包括以下四个模块: 1. 图像编码器:基于Swin Transformer架构,通过3D方式编码PET影像特征。 2. 表格数据编码器:基于多层感知器(Multilayer Perceptron, MLP)结构,对临床表格数据编码。 3. 融合网络:交叉注意力层用于捕获PET影像与临床数据之间的关系,同时通过自注意力层提炼跨模态融合后的特征。 4. 分类头部:通过一系列全连接层与非线性层,将编码后的特征进行分类预测,实现滤泡型淋巴瘤的三分类。

为防止过拟合,模型中应用了丢弃正则化(Dropout)。此外,通过AdamW优化器和余弦退火调度器动态调整学习率。


模型解释机制

为增强临床可解释性,该模型集成了三种解释机制: 1. Grad-CAM(梯度加权类激活映射):生成热图,定位PET图像中对分类影响最大的区域。 2. SHAP(Shapley Additive Explanations)分析:为表格数据中各临床特征赋予重要性评分,展示特征对分类预测的贡献程度。 3. 交互注意力加权分析:解析图像与表格数据的融合比例,在决策过程中验证不同模态之间的影响力。


结果总结

分类模型性能

研究表明,融合Transformer模型在病理等级分类上的表现优异,于训练集、中内验证集及外部验证集中均可达到 >0.9的ROC曲线下面积(AUC)。特别是外部验证集上: - 对1-2级的预测:AUC = 0.936,准确率 = 86.4%; - 对3a级的预测:AUC = 0.927,准确率 = 88.2%; - 对3b级的预测:AUC = 0.994,准确率 = 97.0%。

此外,通过消融实验验证,融合模型显著优于仅依赖PET或临床数据的单模态模型。

临床解释与预后分析

  1. Grad-CAM热图显示,模型集中关注肿瘤核心区域,并能部分捕获周边信息,与临床认知一致。
  2. SHAP分析揭示年龄与SUVmax(最大标准摄取值)为预测分级的最重要特征,而年龄与滤泡型淋巴瘤的侵袭性高度相关。
  3. 预后分层:基于Transformer模型预测结果的Kaplan-Meier曲线表明,不同分类患者在无进展生存率(PFS)上有显著差异,其中1-2级患者预后最好,3b级患者最差。

研究意义与亮点

  1. 创新性模型结构:首次结合Transformer体系架构,将PET影像与表格数据进行深度融合,突破了单一模态分析的限制。
  2. 临床可解释性:通过使用Grad-CAM与SHAP,明确展示模型的决策依据,为临床医生提供了可靠的参考。
  3. 广泛泛化性:多中心验证研究提供了证据支持其应用于不同地区、不同设备环境下的患者。
  4. 实际应用价值:模型精准的病理等级分类能力,可促进非侵入性分级方法在临床的落地,同时实现重点患者的早期预后干预。

总结

这项研究成功开发并验证了一种基于多模态融合的可解释Transformer模型,为滤泡型淋巴瘤的分级与预后分析提供了非侵入性替代手段。此模型不仅具有优越的性能且显著提升临床应用的可解释性,为精准医学发展赋予了新动能。