类型a:
联邦学习中通信成本优化的多目标进化算法研究
本研究由José Ángel Morell(西班牙马拉加大学ITIS软件研究所)、Zakaria Abdelmoiz Dahi(法国里尔大学CRISTAL实验室)、Francisco Chicano、Gabriel Luque和Enrique Alba(均来自西班牙马拉加大学)合作完成,发表于期刊《Future Generation Computer Systems》2024年第155卷。
研究领域与动因
该研究聚焦于联邦学习(Federated Learning, FL)中的通信成本问题。联邦学习是一种分布式机器学习范式,通过在边缘设备(如智能手机、物联网设备)上本地训练模型并仅共享参数(而非原始数据)来保护隐私。然而,大规模模型参数的频繁传输导致高昂的通信开销和环境负担。现有研究多孤立地优化通信影响因素(如量化、稀疏化、参与设备数量),且常忽略设备异构性(如计算速度差异),导致实际应用受限。
科学问题
如何在设备异构的现实场景中,联合优化通信成本与模型精度?本研究提出将通信减少问题(Communication Reduction Problem, CRP)建模为多目标优化问题,并设计进化算法求解。
目标函数:
- 最小化通信量(公式1):量化总接收(R)与发送(H)数据量,归一化为[0,1]。
- 最大化模型精度(公式2):通过测试集准确率(ACC)评估。
优化变量:
- 通信相关参数:参与设备数(m)、本地步数(E)、量化位数(q_i)、稀疏化比例(y_i)。
- 训练相关参数:批次大小(b)、学习率(η)、聚合策略(φ、ℴ)、梯度/权重传输选择(g)。
约束条件:设备异构性(4种计算速度:2.0、1.0、0.75、0.5)、数据集划分(MNIST/Fashion-MNIST,均分给4设备)。
框架:NSGA-II多目标进化算法 + 估计算法分布(EDA)强化算子(UMDA)。
- 初始化:随机生成种群,个体编码包含所有优化变量(图5)。
- 进化操作:
- 选择:基于拥挤距离的二元锦标赛。
- 交叉:均匀交叉(概率90%)。
- 变异:均匀变异(概率1/d,d为变量维度)。
- 强化策略:对高精度解使用EDA生成子代,加速局部收敛(图9)。
- 替换机制:非支配排序与拥挤距离保持多样性。
模型与数据:
- 全连接网络(FC):33,400权重,4层。
- 卷积网络(CNN):887,530权重,12层。
- 数据集:MNIST(手写数字)和Fashion-MNIST(服装图像),各70,000样本。
对比基准:
- 全通信配置(100%通信)、50%通信配置、传统NSGA-II。
科学意义:
1. 多目标建模:首次联合优化设备异构性、通信触发因素与模型精度,提出CRP的完整数学形式化。
2. 算法创新:FL-Opt通过EDA强化NSGA-II,在高精度区域实现更优搜索效率。
应用价值:
- 为边缘计算场景提供低通信、高精度的FL部署方案。
- 参数分布规律指导实际系统调参(如优先压缩大权重层)。
(全文约2,200字)