乳腺癌诊断新突破:基于联邦学习与可解释AI的分层Swin Transformer集成系统
作者与发表信息
本研究的核心团队由来自孟加拉国、美国、韩国和埃及的多所高校研究人员组成,包括第一作者Md. Redwan Ahmed(东西方大学计算机科学与工程系)、通讯作者Young-Im Cho和Mohamed S. Abdallah(韩国嘉泉大学计算机工程系)等。研究成果于2025年6月13日发表在开源期刊《Bioengineering》(2025年第12卷,第651页),论文标题为《Hierarchical Swin Transformer Ensemble with Explainable AI for Robust and Decentralized Breast Cancer Diagnosis》,遵循CC BY 4.0许可协议。
学术背景与研究动机
乳腺癌是全球女性最常见的恶性肿瘤,早期诊断对降低死亡率至关重要。传统诊断方法(如组织病理学、超声和乳腺X线摄影)依赖医生经验,存在主观性和跨机构差异。尽管深度学习(Deep Learning, DL)在计算机辅助诊断(CAD)中展现出潜力,但现有模型面临三大挑战:
1. 数据隐私问题:集中式训练需共享患者数据,违反HIPAA(美国健康保险流通与责任法案)和GDPR(欧盟通用数据保护条例)等法规;
2. 领域过拟合:单一机构数据训练的模型在外部数据上性能下降可达20%;
3. 模型不可解释性:黑箱决策阻碍临床信任,仅15%的医生完全信任无解释的AI系统。
为此,研究团队提出BreastSwinFedNetX系统,结合联邦学习(Federated Learning, FL)、分层Swin Transformer集成和可解释AI(Explainable AI, XAI),旨在实现隐私保护、跨机构泛化和临床可解释的乳腺癌诊断。
研究方法与流程
1. 数据准备与预处理
- 数据集:整合五个公开数据集——BreakHis(组织病理,7909张)、BUSI(超声,830张)、InBreast(乳腺X线,7632张)、CBIS-DDSM(乳腺X线,3086张)及其联合数据集(共19,274张)。
- 预处理流程:
- 标准化:图像统一调整为224×224像素,应用最小-最大归一化(Min-Max Normalization)或Z-score归一化;
- 增强技术:针对不同模态定制增强策略(如BreakHis采用旋转±20°、亮度调整;BUSI加入弹性变形和斑点噪声);
- 数据划分:按80:5:15比例分层分割训练集、验证集和测试集,并通过×2和×4扩增解决类别不平衡问题。
模型架构设计
可解释性实现
主要实验结果
1. 性能指标
- BreakHis数据集:F1分数达99.34%,PR AUC(Precision-Recall曲线下面积)98.89%;
- 联合数据集:马修斯相关系数(MCC)99.61%,特异性98.97%。
- 消融实验:RF元学习器比逻辑回归/SVM等提升1.5-3%的F1分数;×4数据扩增使少数类(如腺病)F1分数从96.96%提升至99.42%。
可解释性验证
联邦学习优势
结论与价值
1. 科学价值:
- 首创结合FL、Swin Transformer和XAI的乳腺癌诊断框架,解决隐私-性能-解释性三角难题;
- 提出分层联邦聚合策略,为多中心医疗AI协作提供范式。
2. 应用价值:
- BreastInsight平台符合GDPR/HIPAA,适用于资源匮乏地区的远程筛查;
- 可扩展至其他癌症类型(如肺癌病理分类)。
研究亮点
1. 方法创新:
- 首次在FL中集成多尺度Swin Transformer,通过RF元学习器优化异构特征融合;
- 开发轻量级Grad-CAM实时解释模块,支持临床决策。
2. 性能突破:
- 在五大数据集上全面超越现有CNN/ViT模型(如DenseNet-169在BreakHis上准确率98.73%,本研究达99.34%)。
3. 开源部署:
- 代码与模型权重公开,推动可重复研究与临床转化。
局限与展望
当前系统对高分辨率全切片图像(WSI)的计算效率待优化,未来计划引入动态窗口注意力与量子化联邦压缩技术。