基于可解释AI的分层Swin Transformer集成方法在稳健和去中心化乳腺癌诊断中的应用

分享自：

基于可解释AI的分层Swin Transformer集成方法在稳健和去中心化乳腺癌诊断中的应用

信息科学

生物医学工程

期刊:bioengineeringDOI:10.3390/bioengineering12060651

【点击此处】阅读全文、收藏及针对性提问

乳腺癌诊断新突破：基于联邦学习与可解释AI的分层Swin Transformer集成系统
作者与发表信息
 本研究的核心团队由来自孟加拉国、美国、韩国和埃及的多所高校研究人员组成，包括第一作者Md. Redwan Ahmed（东西方大学计算机科学与工程系）、通讯作者Young-Im Cho和Mohamed S. Abdallah（韩国嘉泉大学计算机工程系）等。研究成果于2025年6月13日发表在开源期刊《Bioengineering》（2025年第12卷，第651页），论文标题为《Hierarchical Swin Transformer Ensemble with Explainable AI for Robust and Decentralized Breast Cancer Diagnosis》，遵循CC BY 4.0许可协议。
学术背景与研究动机
 乳腺癌是全球女性最常见的恶性肿瘤，早期诊断对降低死亡率至关重要。传统诊断方法（如组织病理学、超声和乳腺X线摄影）依赖医生经验，存在主观性和跨机构差异。尽管深度学习（Deep Learning, DL）在计算机辅助诊断（CAD）中展现出潜力，但现有模型面临三大挑战：
 1. 数据隐私问题：集中式训练需共享患者数据，违反HIPAA（美国健康保险流通与责任法案）和GDPR（欧盟通用数据保护条例）等法规；
 2. 领域过拟合：单一机构数据训练的模型在外部数据上性能下降可达20%；
 3. 模型不可解释性：黑箱决策阻碍临床信任，仅15%的医生完全信任无解释的AI系统。
为此，研究团队提出BreastSwinFedNetX系统，结合联邦学习（Federated Learning, FL）、分层Swin Transformer集成和可解释AI（Explainable AI, XAI），旨在实现隐私保护、跨机构泛化和临床可解释的乳腺癌诊断。
研究方法与流程
 1. 数据准备与预处理
 - 数据集：整合五个公开数据集——BreakHis（组织病理，7909张）、BUSI（超声，830张）、InBreast（乳腺X线，7632张）、CBIS-DDSM（乳腺X线，3086张）及其联合数据集（共19,274张）。
 - 预处理流程：
 - 标准化：图像统一调整为224×224像素，应用最小-最大归一化（Min-Max Normalization）或Z-score归一化；
 - 增强技术：针对不同模态定制增强策略（如BreakHis采用旋转±20°、亮度调整；BUSI加入弹性变形和斑点噪声）；
 - 数据划分：按80:5:15比例分层分割训练集、验证集和测试集，并通过×2和×4扩增解决类别不平衡问题。
模型架构设计
基础模型：集成四种Swin Transformer变体（Tiny/Small/Base/Large），利用其分层窗口自注意力机制捕获多尺度特征。
 
元学习器：采用随机森林（Random Forest, RF）整合各变体的预测，通过交叉验证优化泛化能力。
 
联邦学习框架：
 客户端模拟：每个Swin变体作为独立客户端，在本地数据上训练；
 
隐私保护：通过FedAvg算法聚合加密权重更新，结合Paillier同态加密和差分隐私（ε=1.0）；
 
知识蒸馏：采用联邦知识蒸馏（FKD）缓解非独立同分布（Non-IID）数据问题。
 
可解释性实现
Grad-CAM可视化：生成热图突出显示模型决策依赖的病理区域（如恶性肿瘤的密集细胞结构）。
 
实时应用：部署至BreastInsight网页平台，支持不确定性预测与医生交互。
 
主要实验结果
 1. 性能指标
 - BreakHis数据集：F1分数达99.34%，PR AUC（Precision-Recall曲线下面积）98.89%；
 - 联合数据集：马修斯相关系数（MCC）99.61%，特异性98.97%。
 - 消融实验：RF元学习器比逻辑回归/SVM等提升1.5-3%的F1分数；×4数据扩增使少数类（如腺病）F1分数从96.96%提升至99.42%。
可解释性验证
Grad-CAM热图与病理学家标注高度一致（如恶性超声图像的低声区激活），临床信任度显著提高。
 
联邦学习优势
在模拟的跨机构环境中，模型性能下降不足1%，显著优于集中式训练（下降15-20%）。
 
结论与价值
 1. 科学价值：
 - 首创结合FL、Swin Transformer和XAI的乳腺癌诊断框架，解决隐私-性能-解释性三角难题；
 - 提出分层联邦聚合策略，为多中心医疗AI协作提供范式。
 2. 应用价值：
 - BreastInsight平台符合GDPR/HIPAA，适用于资源匮乏地区的远程筛查；
 - 可扩展至其他癌症类型（如肺癌病理分类）。
研究亮点
 1. 方法创新：
 - 首次在FL中集成多尺度Swin Transformer，通过RF元学习器优化异构特征融合；
 - 开发轻量级Grad-CAM实时解释模块，支持临床决策。
 2. 性能突破：
 - 在五大数据集上全面超越现有CNN/ViT模型（如DenseNet-169在BreakHis上准确率98.73%，本研究达99.34%）。
 3. 开源部署：
 - 代码与模型权重公开，推动可重复研究与临床转化。
局限与展望
 当前系统对高分辨率全切片图像（WSI）的计算效率待优化，未来计划引入动态窗口注意力与量子化联邦压缩技术。

上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com

【点击此处】阅读全文、收藏及针对性提问