本研究由Ling-Li Zeng、Zhipeng Fan、Jianpo Su、Min Gan、Limin Peng、Hui Shen和Dewen Hu(IEEE高级会员)共同完成,作者团队来自中国国防科技大学智能科学与技术学院。该研究发表在IEEE Transactions on Neural Networks and Learning Systems期刊,于2022年11月3日被接受。
本研究属于医学影像分析与联邦学习的交叉领域。随着医疗数据隐私保护政策的严格化,不同医疗机构间的原始数据共享存在障碍,这阻碍了基于深度学习的医学影像分析发展,特别是神经精神疾病的诊断分类。联邦学习(Federated Learning)作为一种隐私保护范式,允许在不传输原始数据的情况下进行协作机器学习,但其性能常受不同机构间”域偏移”(domain shift)问题的影响。
研究团队针对这一挑战,提出了梯度匹配联邦域适应(GM-FedDA)方法,专门用于多中心脑功能磁共振成像(fMRI)数据的诊断分类。该方法旨在利用公共数据集作为公共源域,通过两阶段训练策略减少域间差异,同时保护数据隐私。研究选择了精神分裂症(schizophrenia, SCZ)和重度抑郁症(major depressive disorder, MDD)这两种常见神经精神疾病的诊断作为验证任务。
研究团队首先提出了一种单公共源对抗域适应(OCS-ADA)策略。该阶段包含四个关键模块: 1) 源模型(包括源编码器和线性分类器) 2) 目标模型(本地联邦模型) 3) 域鉴别器 4) 梯度匹配模块
研究人员采用了条件对抗域适应方法(Conditional Adversarial Domain Adaptation),在保持特征空间对齐的同时进行标签判别。创新性地引入了三种损失函数: - 特征对齐损失(l_ada-fa):通过最小化源域和目标域特征分布的均方距离 - 域适应损失(l_ada-da):采用梯度惩罚控制Lipschitz范数 - 梯度匹配损失(l_ada-gm):通过余弦相似度优化梯度方向
该阶段使用全连接网络(Fully Connected Networks)作为基础架构,在公共源域(fs)和n个联邦站点(fi)上分别训练编码器,提取特定域不变特征。
研究人员开发了梯度匹配联邦(GM-Fed)微调方法,关键创新在于: 1) 采用高斯机制(gaussian mechanism)实现差分隐私加密,保护梯度信息 2) 通过最小化联邦站点间的梯度匹配损失(l_fdl-gm),推动本地模型优化 3) 避免直接传输模型参数,仅共享加密后的梯度方向信息
微调过程采用三阶段更新策略: 1) 给定站点广播其预训练的源模型 2) 其他站点使用本地数据微调接收到的模型 3) 加密梯度信息返回原始站点进行梯度匹配优化
研究使用了两个独立的多中心rs-fMRI数据集: 1) SCZ数据集:来自6个成像中心的411名患者和592名对照 2) MDD数据集:来自REST-meta-MDD项目的424名患者和382名对照
数据处理流程包括: 1) 使用SPM8进行标准预处理 2) 基于三种脑图谱(AAL116、17-network、BA512)提取功能连接矩阵 3) 进行Fisher r-to-z转换和z标准化 4) 将矩阵上三角向量化为特征输入
实验采用十折交叉验证策略,主要评估指标为AUC(曲线下面积)和平均准确率。
在SCZ诊断分类任务中,GM-FedDA方法在三类脑图谱上的平均AUC分别为: - AAL116图谱:0.9035±0.0010 - 17-network图谱:0.9093±0.0017 - BA512图谱:0.9157±0.0007
相应准确率达到80%以上的临床相关阈值。与FedAvg和Fed_Align等现有方法相比,GM-FedDA在所有站点上展现出更优且更稳定的性能。
在MDD诊断任务中,虽然整体准确率略低(约68%),但GM-FedDA仍显著优于基线方法,反映了该方法对不同神经精神疾病的泛化能力。
通过对最具判别性功能连接特征的分析,研究发现: 1) SCZ患者显示默认模式网络(DMN)内连接异常,特别是涉及前扣带回(ACC)、后扣带回(PCC)和颞叶区域的连接 2) MDD患者主要表现边缘系统(如杏仁核)与额叶区域连接紊乱 3) 两种疾病共有的异常涉及小脑-皮层连接通路
这些发现与既往独立研究结果一致,证实了方法的神经生物学合理性。
在系统消融研究中发现: 1) 单独使用GM-Fed方法可达0.8871 AUC 2) 加入DA损失后提升至0.8953 3) 完整GM-FedDA框架达到最佳性能 验证了各模块的协同贡献。
本研究提出了首个针对梯度联邦学习的域适应框架GM-FedDA,其核心贡献包括: 1) 创新性两阶段设计,有效平衡隐私保护与域偏移校正 2) OCS-ADA预训练策略,可扩展至其他存在公共数据库的领域 3) GM-Fed微调方法,通过梯度方向匹配优化本地模型 4) 在SCZ和MDD诊断中实现state-of-the-art性能
方法学价值体现在: 1) 为多中心医学影像分析提供了隐私保护新范式 2) 提出的梯度匹配策略可泛化至其他联邦学习场景 3) 开源框架便于临床转化应用
临床应用价值包括: 1) 为神经精神疾病提供客观影像诊断标记 2) 识别了具有疾病特异性的脑功能网络异常 3) 支持分布式医疗体系的协同研究
研究团队指出了四个潜在发展方向: 1) 开发配套软件框架促进临床转化 2) 探索图卷积网络在特征提取中的应用 3) 扩展到多模态影像数据分析 4) 验证方法在多类诊断任务中的表现
该研究为医学影像分析中的隐私保护联邦学习设立了新标准,有望促进跨机构协同研究的发展。