可解释人工智能在医学影像中的应用：一种可解释且协作的联邦学习模型用于脑肿瘤分类

分享自：

可解释人工智能在医学影像中的应用：一种可解释且协作的联邦学习模型用于脑肿瘤分类

影像医学与核医学

人工智能

期刊:frontiers in oncologyDOI:10.3389/fonc.2025.1535478

【点击此处】阅读全文、收藏及针对性提问

基于可解释联邦学习的脑肿瘤分类模型研究作者及发表信息本研究由Qurat-ul-Ain Mastoi（英国西英格兰大学布里斯托分校计算与创意技术学院）、Shahid Latif（同单位）、Sarfraz Brohi（同单位）、Jawad Ahmad（沙特阿拉伯Alkhobar的Prince Mohammad bin Fahd大学网络安全中心）、Abdulmajeed Alqhatani（沙特阿拉伯Najran大学信息系统系）、Mohammed S. Alshehri（同校计算机科学系）、Alanoud Al Mazroa（沙特阿拉伯Princess Nourah bint Abdulrahman大学信息系统系）及通讯作者Rahmat Ullah（英国埃塞克斯大学计算机科学与电子工程学院）合作完成。论文《Explainable AI in Medical Imaging: An Interpretable and Collaborative Federated Learning Model for Brain Tumor Classification》于2025年2月27日发表在开放获取期刊Frontiers in Oncology（影响因子未提及），DOI为10.3389/fonc.2025.1535478。
学术背景研究领域与动机
 本研究属于医学影像人工智能交叉领域，聚焦脑肿瘤的MRI（磁共振成像）分类问题。脑肿瘤因其异常细胞扩散特性威胁生命，早期精准分类对临床决策至关重要。传统深度学习（Deep Learning, DL）模型依赖集中式数据训练，面临两大挑战：
 1. 数据隐私问题：医疗影像涉及敏感信息，跨机构共享存在伦理和法律障碍；
 2. 模型可解释性不足：黑箱决策机制降低临床信任度。
技术背景
 - 联邦学习（Federated Learning, FL）：允许多个设备协作训练模型而无需共享原始数据，通过本地训练和参数聚合保护隐私。
 - 可解释人工智能（Explainable AI, XAI）：通过可视化技术（如梯度加权类激活映射Grad-CAM和显著性图）揭示模型决策依据。
研究目标
 开发一种结合FL与XAI的协作联邦学习模型（Collaborative Federated Learning Model, CFLM），实现：
 1. 高精度四分类（胶质瘤、脑膜瘤、无肿瘤、垂体瘤）；
 2. 数据隐私保护；
 3. 临床可解释的决策过程。
研究流程与方法1. 数据预处理与分配数据集：使用Kaggle公开的Brain Tumor MRI Dataset（7,023张MRI图像，四类均衡分布）。
 预处理流程：
 1. 尺寸标准化：所有图像调整为224×224像素（公式：( x’ = \text{resize}(x, (224,224)) )）；
 2. 张量转换与归一化：像素值映射至[0,1]区间（( x” = \text{ToTensor}(x’) )）；
 3. 客户端分配：数据划分为10个非重叠子集（( D = \cup_{i=1}^{10} D_i )），每个客户端仅访问本地数据。
2. 模型架构设计核心分类器：预训练GoogleNet（含Inception模块），优势包括：
 - 多尺度特征提取：并行1×1、3×3、5×5卷积核捕捉不同粒度特征；
 - 计算效率：1×1卷积降维减少参数量。
 联邦学习框架：
 - 本地训练：10个客户端各训练3轮，批次大小128，学习率0.002，使用SGD优化器；
 - 参数聚合：采用联邦平均（FedAvg），按客户端数据量加权全局模型（( \theta = \sum_{i=1}^{10} \frac{|D_i|}{|D|} \theta_i’ )）。
3. 可解释性模块Grad-CAM：通过计算目标类梯度对末层卷积特征的权重（( \alpha_k = \frac{1}{UV} \sum_i \sum_j \frac{\partial yc}{\partial A{ij}^k} )），生成热图定位关键区域；
 
显著性图：基于输入像素梯度（( S_c(x)_i = \left| \frac{\partial y_c}{\partial x_i} \right| )），高亮影响分类的像素。
 
4. 实验设计硬件：Google Colab Pro平台，NVIDIA L4 GPU加速。
 评估指标：准确率、精确率、召回率、F1值及混淆矩阵。
主要结果1. 分类性能全局模型准确率：50轮通信后达94.24%（第5轮仅89.07%），优于对比的7种现有方法（最高92.31%）；
 
客户端表现：10个客户端最终准确率均达99%以上（表2），验证FL的稳定性。
 
2. 可解释性验证Grad-CAM热图：胶质瘤和脑膜瘤的激活区域与肿瘤实际位置重合率>90%；
 
显著性图：垂体瘤分类中，模型聚焦垂体区域（图7），与临床关注点一致。
 
3. 对比分析本研究的FL+GoogleNet组合在MICCAI BraTS2018等数据集上表现优于：
 - 传统CNN（77.6%准确率）；
 - 级联CNN（92.03%）；
 - 其他FL方案（如Sheller等提出的多机构分割模型，85.1%）。
结论与价值科学价值：
 1. 隐私与性能平衡：首次将GoogleNet嵌入FL框架，解决医疗数据孤岛问题；
 2. 决策透明化：Grad-CAM与显著性图双验证提升临床可信度。
应用价值：
 - 为多医院协作的脑肿瘤筛查提供标准化AI工具；
 - 模型代码与流程已开源，适配其他医学影像任务。
研究亮点方法论创新：FL与XAI的协同设计，兼顾隐私与可解释性；
 
技术优势：GoogleNet的Inception模块在联邦环境下保持高精度（94% vs. 传统DL的92.66%）；
 
临床适配性：可视化结果可直接辅助放射科医生复核AI判断。
 
局限性与展望客户端假设：未考虑异构计算资源对训练效率的影响；
 
动态环境：需进一步测试网络延迟对联邦聚合的干扰；
 
扩展性：未来计划适配PET-CT等多模态数据分类。
 
（注：文中所有术语首次出现时均标注英文原名，如联邦学习（Federated Learning, FL）、梯度加权类激活映射（Gradient-weighted Class Activation Mapping, Grad-CAM）等。）

上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com

【点击此处】阅读全文、收藏及针对性提问