分享自:

多目标联邦平均算法

期刊:expert systemsDOI:10.1111/exsy.13761

类型a:学术研究报告

作者及机构
本研究由重庆邮电大学自动化学院的Daoqu Geng、Shouzheng Wang和Yihang Zhang合作完成,发表于2025年的”expert systems”期刊(卷42, 文章编号e13761),DOI为10.1111/exsy.13761。研究获得重庆市自然科学基金(cstc2021jcyj-msxmx0330)和国家重点研发计划(2022yfe0114300)支持。

学术背景
该研究属于人工智能与分布式计算交叉领域,针对联邦学习(Federated Learning, FL)现存的核心挑战展开。随着信息通信技术(ICT)与各领域的深度融合,数据隐私问题日益突出。联邦学习通过在本地训练模型并仅上传模型参数的方式解决了数据孤岛问题,但传统联邦平均算法(FedAvg)存在四方面缺陷:(1)通信成本高;(2)参与者间性能分布不均衡;(3)隐私保护不足;(4)全局模型精度受限。此前研究多在单目标优化方向探索,如Geyer等(2017)应用差分隐私(DP)牺牲了模型精度,Qolomany等(2020)仅优化通信成本。

研究方法与流程
研究团队提出多目标联邦平均算法(M-FedAvg),其创新性工作流程包含五个关键环节:

  1. 多目标建模
    建立四个优化目标函数:

    • f1=1-全局模型准确率
    • f2=参与者准确率方差(公平性指标)
    • f3=ω·c(通信成本)
    • f4=ε^(-1)σδ_s√(2ctln(1/δ))(隐私预算)
      决策变量包含MLP超参数、参与率c、SET算法连接参数(α,ξ)、高斯噪声标准差σ共7维混合编码空间。
  2. 改进SET算法
    创新性地提出参数化权重删除策略:

    • 设置删除比例p=10%,仅在最后10%训练周期删除不重要的权重
    • 相比传统全程删除或末轮删除,平衡了模型质量与计算效率
    • 通过中位数梯度范数设定修剪阈值s,并添加N(0,σ_t^2)高斯噪声
  3. NSGA-III优化框架
    采用第三代非支配排序遗传算法处理高维目标空间:

    • 种群规模20,迭代20代
    • 交叉概率0.9,变异概率0.1
    • 生成参考点进行非支配排序
    • 每代合并父代与子代种群(共40个体)进行联邦训练
  4. 联邦训练实施
    实验设置:

    • 100个客户端,参与率c∈[0.1,1]
    • 在MNIST的IID/Non-IID数据测试MLP和CNN
    • 本地训练epoch=5,批次大小50
    • 通信轮次MLP 500轮,CNN 200轮
    • DP参数:δ=10^-4,σ∈[0.001,0.5]
  5. 四维帕累托前沿分析
    通过三维可视化展示准确率-通信成本-公平性的权衡关系,隐私预算用颜色深度表示,获得最优解集。

主要研究结果
在MNIST数据集上取得突破性成果:

  1. 通信效率
    最优解(solution 2)通信成本仅9036,相比对比方法减少:

    • 比solution f1降低84.3%
    • 比solution f2降低63.3%
    • 比全连接方案降低95.46%
  2. 模型精度
    最高准确率(solution 1)达97.36%,提升:
    +0.66%(vs f1)
    +5.28%(vs f2)
    +1.67%(vs全连接)
    Non-IID数据仍保持>95%准确率

  3. 公平性优化
    准确率方差最低3.83,较对比方法:

    • 比solution f1下降18.7%
    • 比全连接方案下降61.2%
  4. 隐私保护
    实现(3.11,10^-4)-局部差分隐私:

    • 隐私泄漏风险比solution f2降低10.1%
    • 高斯噪声σ=0.15时精度损失%

实验验证
关键发现:
1. IID数据50轮即达近100%准确率,Non-IID需更多轮次
2. 连接参数α=20,ξ=0.3时:
- 稀疏连接仅保留10%权重
- MLP精度下降<2%,CNN<1% 3. σ>0.2时模型收敛显著放缓

研究结论与价值
该研究通过四维目标协同优化,实现了:
1. 科学价值:
- 证明联邦学习中精度-成本-公平性-隐私的帕累托最优存在性
- 建立高维目标空间的NSGA-III优化范式
2. 应用价值:
- 医疗/IoT等敏感领域可降低83%通信开销
- 为《网络安全法》要求的隐私保护提供技术方案
3. 工业意义:
- 每百万客户端训练可节约1.4PB带宽
- 在GTX4060设备上实现可行部署

研究亮点
1. 方法创新:
- 首个个四目标FL优化框架
- 参数化SET修剪策略(p=10%)
2. 工程创新:
- 混合编码方案处理7维决策变量
- 动态DP噪声注入机制
3. 理论突破:
- 证明稀疏连接下模型收敛界
- 量化隐私预算与通信轮次的关系

后续方向
作者指出三个未来研究方向:
1. 抗毒化攻击与拜占庭容错机制
2. 基于区块链的去中心化优化
3. 多目标算法的计算成本压缩

本研究为联邦学习的工业落地提供了重要方法论,其创新性的多目标权衡框架已被证实可在实际资源约束下实现最优性能分配,相关代码已通过通信作者提供开放获取。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com