作者及机构
本研究的通讯作者为印度PSG理工学院计算机科学与工程系的G.R. Karpagam教授(邮箱:grk.cse@psgtech.ac.in)与研究生Madhvesh V S(邮箱:madhvesh29@gmail.com),研究成果发表于2025年IEEE国际计算创新与工程可持续性会议(ICCIES)。
乳腺癌是全球女性第四大死因,2022年新增病例230万,死亡67万例。传统集中式AI诊断依赖数据共享,但医疗数据的隐私法规(如GDPR)限制了数据流通。联邦学习(Federated Learning, FL)通过分布式训练解决此问题,但面临数据异质性、隐私泄露风险和模型不可解释性三大挑战。本研究提出融合Titans’记忆架构、差分隐私(Differential Privacy, DP)和可解释AI(Explainable AI, XAI)的混合模型,旨在实现:
1. 跨机构协作训练时不共享原始数据
2. 通过记忆机制提升测试阶段泛化能力
3. 满足临床诊断对决策透明度的需求
核心组件:
- 分布式特征提取:采用ResNet50作为基础CNN,各医疗机构本地提取特征
- Titans’记忆模块:动态存储历史特征模式,其记忆函数为:
$$ Mt = \lambda M{t-1} + (1-\lambda)f(X_t, \theta_t) $$
其中$\lambda$为记忆保留因子,$f(\cdot)$为特征提取函数
- 隐私保护机制:在模型参数上传前添加拉普拉斯噪声:
$$ w_k^* = w_k + Lap(0,1/\epsilon) $$
- 可解释性层:集成LIME(Local Interpretable Model-agnostic Explanations)和注意力热力图
工作流程:
1. 数据预处理:对超声图像进行旋转、翻转、对比度调整等增强,平衡三类(良性/恶性/正常)数据分布
2. 本地训练:各客户端用ResNet50提取特征,Titans’模块存储关键模式
3. 联邦聚合:中央服务器采用FedAvg算法整合权重更新
4. 推理阶段:记忆模块调用历史特征辅助诊断,LIME生成局部可解释结果
数据集:
- 分布式超声图像数据集,三个客户端分别持有良性/恶性/正常病例
- 样本量未明确,但通过数据增强解决类别不平衡
技术栈:
- 框架:PyTorch + Flower(FL框架)
- 硬件:未披露,但提及需优化Titans’模块的内存占用
评估指标:
- 分类准确率(对比基线未给出具体数值)
- 隐私保护强度(通过$\epsilon$值调节)
- 解释性质量(临床医生对LIME输出的可理解性评估)
结果逻辑链:
- 记忆模块弥补了FL因数据隔离导致的模式遗忘问题 → 提升泛化性
- DP噪声控制在不泄露个体信息的前提下 → 保障多中心协作合法性
- XAI输出符合临床思维习惯 → 增强医生对AI的信任度
科学价值:
1. 首次将Titans’记忆架构应用于医疗FL,解决分布式环境下的长期依赖问题
2. 提出动态隐私预算分配策略,优化隐私-效用权衡
3. 建立可解释性评估标准,推动AI在医疗领域的合规应用
应用价值:
- 为发展中国家提供低成本、高隐私的癌症筛查方案
- 模型框架可扩展至其他医学影像分析任务(如肺结节检测)
(注:部分实验细节未在原文完整披露,如具体数据集来源和准确率数值,实际应用需进一步验证)