基于联邦学习的早期非小细胞肺癌术后进展风险预测模型研究
作者及发表信息
本研究由Yu Liu(第一作者,单位:重庆大数据协同创新中心、桂林航天工业学院智能检测与信息处理实验室)、Xiaobei Duan(江门市中心医院核医学科)、Xiangmeng Chen(通讯作者,江门市中心医院放射科)等来自中国多家医疗与科研机构的团队合作完成,发表于2025年的开放获取期刊*Cancer Imaging*(DOI: 10.1186/s40644-025-00911-y)。研究遵循知识共享许可协议(CC BY 4.0),数据可公开获取。
科学领域与背景知识
非小细胞肺癌(NSCLC)占肺癌病例的85%,术后进展(复发或转移)率高达18-34%。目前TNM分期系统虽能评估疾病范围,但难以精准预测同分期患者的异质性预后。深度学习(DL)在医学影像分析中展现出潜力,但多中心数据共享面临隐私与伦理问题。联邦学习(FL)作为一种分布式机器学习框架,可在不共享原始数据的前提下整合多中心知识,但现有方法存在数据异质性和类别不平衡(如仅20%患者出现术后进展)的挑战。
研究目标
开发一种鲁棒联邦学习模型(RFed),通过术前CT影像预测早期(I/II期)NSCLC患者的术后进展风险,以辅助临床分层管理和个性化治疗决策。
(1)特征提取模型
- 改进1:参数聚合策略
提出指数渐进傅里叶聚合(EPFA)算法:
- 低频共享:通过傅里叶变换聚合各中心模型的低频参数(反映全局特征),保留高频参数(反映局部特征)。
- 三阶段迁移学习(ATTL):结合分布差异度量(A-distance)分阶段优化全局模型与本地模型的参数传递,防止性能退化。
- 改进2:类别不平衡处理
- 边际校正损失函数:调整分类边际(margin),平衡多数类(非进展)与少数类(进展)的预测权重(公式4-6)。
- 对比预测编码(CPC):约束本地模型特征与全局特征的相似性,提升泛化性(公式7)。
(2)分类器构建
- 使用贝叶斯极限学习机(Bayesian Extreme Learning Machine)对提取的7,616个特征进行筛选(MRMR算法)和分类。
诊断性能
生存分析
泛化能力
可解释性
科学价值
- 首次将联邦学习与边际校正技术结合,解决了医学FL中的异质性与类别不平衡问题。
- 通过EPFA和ATTL算法,实现了全局知识共享与本地个性化的平衡。
临床应用价值
- 为早期NSCLC患者提供无创、精准的术后风险预测工具,辅助制定辅助化疗或密切随访策略。
- 多中心协作框架符合隐私保护需求,推动智能医疗的可持续发展。
局限性:样本量受多中心数据限制,未来需引入多模态数据(如基因组学)提升预测精度。
(注:文中涉及的算法细节与补充材料可参考原文献Supplementary S1-S7。)