本研究由Qurat-ul-Ain Mastoi(英国西英格兰大学布里斯托分校计算与创意技术学院)、Shahid Latif(同单位)、Sarfraz Brohi(同单位)、Jawad Ahmad(沙特阿拉伯Alkhobar的Prince Mohammad bin Fahd大学网络安全中心)、Abdulmajeed Alqhatani(沙特阿拉伯Najran大学信息系统系)、Mohammed S. Alshehri(同校计算机科学系)、Alanoud Al Mazroa(沙特阿拉伯Princess Nourah bint Abdulrahman大学信息系统系)及通讯作者Rahmat Ullah(英国埃塞克斯大学计算机科学与电子工程学院)合作完成。论文《Explainable AI in Medical Imaging: An Interpretable and Collaborative Federated Learning Model for Brain Tumor Classification》于2025年2月27日发表在开放获取期刊Frontiers in Oncology(影响因子未提及),DOI为10.3389/fonc.2025.1535478。
研究领域与动机
本研究属于医学影像人工智能交叉领域,聚焦脑肿瘤的MRI(磁共振成像)分类问题。脑肿瘤因其异常细胞扩散特性威胁生命,早期精准分类对临床决策至关重要。传统深度学习(Deep Learning, DL)模型依赖集中式数据训练,面临两大挑战:
1. 数据隐私问题:医疗影像涉及敏感信息,跨机构共享存在伦理和法律障碍;
2. 模型可解释性不足:黑箱决策机制降低临床信任度。
技术背景
- 联邦学习(Federated Learning, FL):允许多个设备协作训练模型而无需共享原始数据,通过本地训练和参数聚合保护隐私。
- 可解释人工智能(Explainable AI, XAI):通过可视化技术(如梯度加权类激活映射Grad-CAM和显著性图)揭示模型决策依据。
研究目标
开发一种结合FL与XAI的协作联邦学习模型(Collaborative Federated Learning Model, CFLM),实现:
1. 高精度四分类(胶质瘤、脑膜瘤、无肿瘤、垂体瘤);
2. 数据隐私保护;
3. 临床可解释的决策过程。
数据集:使用Kaggle公开的Brain Tumor MRI Dataset(7,023张MRI图像,四类均衡分布)。
预处理流程:
1. 尺寸标准化:所有图像调整为224×224像素(公式:( x’ = \text{resize}(x, (224,224)) ));
2. 张量转换与归一化:像素值映射至[0,1]区间(( x” = \text{ToTensor}(x’) ));
3. 客户端分配:数据划分为10个非重叠子集(( D = \cup_{i=1}^{10} D_i )),每个客户端仅访问本地数据。
核心分类器:预训练GoogleNet(含Inception模块),优势包括:
- 多尺度特征提取:并行1×1、3×3、5×5卷积核捕捉不同粒度特征;
- 计算效率:1×1卷积降维减少参数量。
联邦学习框架:
- 本地训练:10个客户端各训练3轮,批次大小128,学习率0.002,使用SGD优化器;
- 参数聚合:采用联邦平均(FedAvg),按客户端数据量加权全局模型(( \theta = \sum_{i=1}^{10} \frac{|D_i|}{|D|} \theta_i’ ))。
硬件:Google Colab Pro平台,NVIDIA L4 GPU加速。
评估指标:准确率、精确率、召回率、F1值及混淆矩阵。
本研究的FL+GoogleNet组合在MICCAI BraTS2018等数据集上表现优于:
- 传统CNN(77.6%准确率);
- 级联CNN(92.03%);
- 其他FL方案(如Sheller等提出的多机构分割模型,85.1%)。
科学价值:
1. 隐私与性能平衡:首次将GoogleNet嵌入FL框架,解决医疗数据孤岛问题;
2. 决策透明化:Grad-CAM与显著性图双验证提升临床可信度。
应用价值:
- 为多医院协作的脑肿瘤筛查提供标准化AI工具;
- 模型代码与流程已开源,适配其他医学影像任务。
(注:文中所有术语首次出现时均标注英文原名,如联邦学习(Federated Learning, FL)、梯度加权类激活映射(Gradient-weighted Class Activation Mapping, Grad-CAM)等。)