分享自:

可解释人工智能在医学影像中的应用:一种可解释且协作的联邦学习模型用于脑肿瘤分类

期刊:frontiers in oncologyDOI:10.3389/fonc.2025.1535478

基于可解释联邦学习的脑肿瘤分类模型研究

作者及发表信息

本研究由Qurat-ul-Ain Mastoi(英国西英格兰大学布里斯托分校计算与创意技术学院)、Shahid Latif(同单位)、Sarfraz Brohi(同单位)、Jawad Ahmad(沙特阿拉伯Alkhobar的Prince Mohammad bin Fahd大学网络安全中心)、Abdulmajeed Alqhatani(沙特阿拉伯Najran大学信息系统系)、Mohammed S. Alshehri(同校计算机科学系)、Alanoud Al Mazroa(沙特阿拉伯Princess Nourah bint Abdulrahman大学信息系统系)及通讯作者Rahmat Ullah(英国埃塞克斯大学计算机科学与电子工程学院)合作完成。论文《Explainable AI in Medical Imaging: An Interpretable and Collaborative Federated Learning Model for Brain Tumor Classification》于2025年2月27日发表在开放获取期刊Frontiers in Oncology(影响因子未提及),DOI为10.3389/fonc.2025.1535478。

学术背景

研究领域与动机
本研究属于医学影像人工智能交叉领域,聚焦脑肿瘤的MRI(磁共振成像)分类问题。脑肿瘤因其异常细胞扩散特性威胁生命,早期精准分类对临床决策至关重要。传统深度学习(Deep Learning, DL)模型依赖集中式数据训练,面临两大挑战:
1. 数据隐私问题:医疗影像涉及敏感信息,跨机构共享存在伦理和法律障碍;
2. 模型可解释性不足:黑箱决策机制降低临床信任度。

技术背景
- 联邦学习(Federated Learning, FL):允许多个设备协作训练模型而无需共享原始数据,通过本地训练和参数聚合保护隐私。
- 可解释人工智能(Explainable AI, XAI):通过可视化技术(如梯度加权类激活映射Grad-CAM和显著性图)揭示模型决策依据。

研究目标
开发一种结合FL与XAI的协作联邦学习模型(Collaborative Federated Learning Model, CFLM),实现:
1. 高精度四分类(胶质瘤、脑膜瘤、无肿瘤、垂体瘤);
2. 数据隐私保护;
3. 临床可解释的决策过程。

研究流程与方法

1. 数据预处理与分配

数据集:使用Kaggle公开的Brain Tumor MRI Dataset(7,023张MRI图像,四类均衡分布)。
预处理流程
1. 尺寸标准化:所有图像调整为224×224像素(公式:( x’ = \text{resize}(x, (224,224)) ));
2. 张量转换与归一化:像素值映射至[0,1]区间(( x” = \text{ToTensor}(x’) ));
3. 客户端分配:数据划分为10个非重叠子集(( D = \cup_{i=1}^{10} D_i )),每个客户端仅访问本地数据。

2. 模型架构设计

核心分类器:预训练GoogleNet(含Inception模块),优势包括:
- 多尺度特征提取:并行1×1、3×3、5×5卷积核捕捉不同粒度特征;
- 计算效率:1×1卷积降维减少参数量。
联邦学习框架
- 本地训练:10个客户端各训练3轮,批次大小128,学习率0.002,使用SGD优化器;
- 参数聚合:采用联邦平均(FedAvg),按客户端数据量加权全局模型(( \theta = \sum_{i=1}^{10} \frac{|D_i|}{|D|} \theta_i’ ))。

3. 可解释性模块

  • Grad-CAM:通过计算目标类梯度对末层卷积特征的权重(( \alpha_k = \frac{1}{UV} \sum_i \sum_j \frac{\partial yc}{\partial A{ij}^k} )),生成热图定位关键区域;
  • 显著性图:基于输入像素梯度(( S_c(x)_i = \left| \frac{\partial y_c}{\partial x_i} \right| )),高亮影响分类的像素。

4. 实验设计

硬件:Google Colab Pro平台,NVIDIA L4 GPU加速。
评估指标:准确率、精确率、召回率、F1值及混淆矩阵。

主要结果

1. 分类性能

  • 全局模型准确率:50轮通信后达94.24%(第5轮仅89.07%),优于对比的7种现有方法(最高92.31%);
  • 客户端表现:10个客户端最终准确率均达99%以上(表2),验证FL的稳定性。

2. 可解释性验证

  • Grad-CAM热图:胶质瘤和脑膜瘤的激活区域与肿瘤实际位置重合率>90%;
  • 显著性图:垂体瘤分类中,模型聚焦垂体区域(图7),与临床关注点一致。

3. 对比分析

本研究的FL+GoogleNet组合在MICCAI BraTS2018等数据集上表现优于:
- 传统CNN(77.6%准确率);
- 级联CNN(92.03%);
- 其他FL方案(如Sheller等提出的多机构分割模型,85.1%)。

结论与价值

科学价值
1. 隐私与性能平衡:首次将GoogleNet嵌入FL框架,解决医疗数据孤岛问题;
2. 决策透明化:Grad-CAM与显著性图双验证提升临床可信度。

应用价值
- 为多医院协作的脑肿瘤筛查提供标准化AI工具;
- 模型代码与流程已开源,适配其他医学影像任务。

研究亮点

  1. 方法论创新:FL与XAI的协同设计,兼顾隐私与可解释性;
  2. 技术优势:GoogleNet的Inception模块在联邦环境下保持高精度(94% vs. 传统DL的92.66%);
  3. 临床适配性:可视化结果可直接辅助放射科医生复核AI判断。

局限性与展望

  1. 客户端假设:未考虑异构计算资源对训练效率的影响;
  2. 动态环境:需进一步测试网络延迟对联邦聚合的干扰;
  3. 扩展性:未来计划适配PET-CT等多模态数据分类。

(注:文中所有术语首次出现时均标注英文原名,如联邦学习(Federated Learning, FL)、梯度加权类激活映射(Gradient-weighted Class Activation Mapping, Grad-CAM)等。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com