分享自:

基于可解释AI的分层Swin Transformer集成方法在稳健和去中心化乳腺癌诊断中的应用

期刊:bioengineeringDOI:10.3390/bioengineering12060651

乳腺癌诊断新突破:基于联邦学习与可解释AI的分层Swin Transformer集成系统

作者与发表信息
本研究的核心团队由来自孟加拉国、美国、韩国和埃及的多所高校研究人员组成,包括第一作者Md. Redwan Ahmed(东西方大学计算机科学与工程系)、通讯作者Young-Im Cho和Mohamed S. Abdallah(韩国嘉泉大学计算机工程系)等。研究成果于2025年6月13日发表在开源期刊《Bioengineering》(2025年第12卷,第651页),论文标题为《Hierarchical Swin Transformer Ensemble with Explainable AI for Robust and Decentralized Breast Cancer Diagnosis》,遵循CC BY 4.0许可协议。


学术背景与研究动机
乳腺癌是全球女性最常见的恶性肿瘤,早期诊断对降低死亡率至关重要。传统诊断方法(如组织病理学、超声和乳腺X线摄影)依赖医生经验,存在主观性和跨机构差异。尽管深度学习(Deep Learning, DL)在计算机辅助诊断(CAD)中展现出潜力,但现有模型面临三大挑战:
1. 数据隐私问题:集中式训练需共享患者数据,违反HIPAA(美国健康保险流通与责任法案)和GDPR(欧盟通用数据保护条例)等法规;
2. 领域过拟合:单一机构数据训练的模型在外部数据上性能下降可达20%;
3. 模型不可解释性:黑箱决策阻碍临床信任,仅15%的医生完全信任无解释的AI系统。

为此,研究团队提出BreastSwinFedNetX系统,结合联邦学习(Federated Learning, FL)、分层Swin Transformer集成和可解释AI(Explainable AI, XAI),旨在实现隐私保护、跨机构泛化和临床可解释的乳腺癌诊断。


研究方法与流程
1. 数据准备与预处理
- 数据集:整合五个公开数据集——BreakHis(组织病理,7909张)、BUSI(超声,830张)、InBreast(乳腺X线,7632张)、CBIS-DDSM(乳腺X线,3086张)及其联合数据集(共19,274张)。
- 预处理流程
- 标准化:图像统一调整为224×224像素,应用最小-最大归一化(Min-Max Normalization)或Z-score归一化;
- 增强技术:针对不同模态定制增强策略(如BreakHis采用旋转±20°、亮度调整;BUSI加入弹性变形和斑点噪声);
- 数据划分:按80:5:15比例分层分割训练集、验证集和测试集,并通过×2和×4扩增解决类别不平衡问题。

  1. 模型架构设计

    • 基础模型:集成四种Swin Transformer变体(Tiny/Small/Base/Large),利用其分层窗口自注意力机制捕获多尺度特征。
    • 元学习器:采用随机森林(Random Forest, RF)整合各变体的预测,通过交叉验证优化泛化能力。
    • 联邦学习框架
      • 客户端模拟:每个Swin变体作为独立客户端,在本地数据上训练;
      • 隐私保护:通过FedAvg算法聚合加密权重更新,结合Paillier同态加密和差分隐私(ε=1.0);
      • 知识蒸馏:采用联邦知识蒸馏(FKD)缓解非独立同分布(Non-IID)数据问题。
  2. 可解释性实现

    • Grad-CAM可视化:生成热图突出显示模型决策依赖的病理区域(如恶性肿瘤的密集细胞结构)。
    • 实时应用:部署至BreastInsight网页平台,支持不确定性预测与医生交互。

主要实验结果
1. 性能指标
- BreakHis数据集:F1分数达99.34%,PR AUC(Precision-Recall曲线下面积)98.89%;
- 联合数据集:马修斯相关系数(MCC)99.61%,特异性98.97%。
- 消融实验:RF元学习器比逻辑回归/SVM等提升1.5-3%的F1分数;×4数据扩增使少数类(如腺病)F1分数从96.96%提升至99.42%。

  1. 可解释性验证

    • Grad-CAM热图与病理学家标注高度一致(如恶性超声图像的低声区激活),临床信任度显著提高。
  2. 联邦学习优势

    • 在模拟的跨机构环境中,模型性能下降不足1%,显著优于集中式训练(下降15-20%)。

结论与价值
1. 科学价值
- 首创结合FL、Swin Transformer和XAI的乳腺癌诊断框架,解决隐私-性能-解释性三角难题;
- 提出分层联邦聚合策略,为多中心医疗AI协作提供范式。
2. 应用价值
- BreastInsight平台符合GDPR/HIPAA,适用于资源匮乏地区的远程筛查;
- 可扩展至其他癌症类型(如肺癌病理分类)。


研究亮点
1. 方法创新
- 首次在FL中集成多尺度Swin Transformer,通过RF元学习器优化异构特征融合;
- 开发轻量级Grad-CAM实时解释模块,支持临床决策。
2. 性能突破
- 在五大数据集上全面超越现有CNN/ViT模型(如DenseNet-169在BreakHis上准确率98.73%,本研究达99.34%)。
3. 开源部署
- 代码与模型权重公开,推动可重复研究与临床转化。

局限与展望
当前系统对高分辨率全切片图像(WSI)的计算效率待优化,未来计划引入动态窗口注意力与量子化联邦压缩技术。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com