个性化联邦学习综述

分享自：
个性化联邦学习综述

期刊:IEEE Transactions on Neural Networks and Learning Systems
个人化联邦学习（Personalized Federated Learning， PFL）的研究进展与未来展望：一份系统性综述
本文旨在为中文研究社群介绍一篇发表于 IEEE Transactions on Neural Networks and Learning Systems 的重要综述论文，其标题为“Towards Personalized Federated Learning”（迈向个人化联邦学习）。该论文的作者团队包括 Alyssa Ziying Tan（新加坡南洋理工大学）、Han Yu（南洋理工大学，通讯作者）、Lizhen Cui（山东大学，通讯作者）以及 Qiang Yang（香港科技大学/微众银行，通讯作者，IEEE Fellow）。这篇综述全面、深入地探讨了联邦学习（Federated Learning, FL）领域一个至关重要且快速发展的分支——个人化联邦学习。
论文核心主题与背景 论文的核心主题是系统性地回顾、分类并展望个人化联邦学习（PFL）这一研究方向。其产生的学术背景根植于人工智能（AI）的广泛应用与日益严格的数据隐私法规（如欧盟《通用数据保护条例》（GDPR））之间的矛盾。传统的集中式机器学习（Centralized Machine Learning， CML）需要汇集数据，面临带宽、延迟和严重的隐私泄露风险。联邦学习应运而生，作为一种隐私保护的分布式机器学习范式，允许多个数据持有者（客户端）在不共享原始数据的情况下协作训练模型，其典型算法是联邦平均（Federated Averaging， FedAvg）。
然而，标准联邦学习面临两个根本性挑战，这构成了PFL研究的直接动因。第一，在异构（非独立同分布，non-IID）数据上收敛性差。现实世界的数据本质上是异构的，不同客户端的数据分布（如特征分布、标签分布）存在显著差异。在FedAvg中，本地训练会导致“客户端漂移”（client drift），使得基于本地最优解平均得到的全局模型严重偏离真正的全局最优解，从而损害模型性能。第二，缺乏解决方案的个人化。标准FL旨在训练一个“放之四海而皆准”的单一全局模型，这无法很好地泛化到与全局数据分布差异巨大的本地客户端。例如，为不同地区、不同年龄段的用户开发统一的手机键盘预测模型，效果往往不佳。因此，PFL的研究目标正是为了解决数据异构性带来的挑战，为每个客户端学习定制的、性能更优的个性化模型。
论文提出的核心分类框架与主要观点 本综述最重要的贡献之一是提出了一个独特且清晰的PFL技术分类法。作者根据解决核心挑战的不同策略，将PFL方法分为两大类，并在此基础上进一步细分，形成了一个层次化的分类体系（对应原文图1c）。
第一大类策略：全局模型个性化（Global Model Personalization） 此类策略的核心思路是首先改进标准FL流程，训练一个更强大、更具泛化能力的全局模型，然后通过一个本地适应步骤（如在本地数据上进行微调）为每个客户端生成个性化模型。这是一种“FL训练 + 本地适应”的两步法。根据具体技术手段，可细分为： * 基于数据的方法（Data-based Approaches）：旨在从源头上减少客户端间的统计异构性。 * 数据增强（Data Augmentation）：通过在服务器端生成合成数据（如使用生成对抗网络GAN）或客户端间少量共享数据，来平衡各客户端的数据分布。例如，FEDAU方法训练一个服务器端的GAN来为客户端生成数据；FedHome算法则结合了SMOTE过采样技术。然而，这些方法常需一个具有代表性的代理数据集或涉及有限的数据/统计信息共享，存在潜在的隐私泄露风险。 * 客户端选择（Client Selection）：设计智能的客户端选择机制，在每一轮训练中选择数据分布更同质的客户端子集参与，以减轻异构性的影响。例如，FAVOR使用深度Q学习优化选择策略；FedSAE则自适应地选择本地损失大的客户端以加速收敛。这些方法虽然不改变本地数据，但增加了计算开销（如优化选择策略），且同样可能需要代理数据集。 * 基于模型的方法（Model-based Approaches）：旨在通过改进模型训练过程本身来获得更好的全局模型或更优的本地适应能力。 * 正则化本地损失（Regularized Local Loss）：在客户端的本地损失函数中添加正则化项，限制本地更新与全局模型的偏离。例如，FedProx添加了近端项；MOON采用了对比学习思想，拉近本地与全局模型表征的距离，同时推远本地模型与其历史版本的距离；SCAFFOLD使用方差减少技术校正本地更新方向。这些方法实现简单，仅需对FedAvg进行小幅修改。 * 元学习（Meta-learning）：将FL过程视为一个“学习如何学习”的元问题。目标是学习一个良好的全局模型初始化参数，使得该模型在客户端本地数据上仅需少量梯度步就能快速适应（个性化）。Per-FedAvg和pFedME是代表性的算法。这类方法直接优化模型以适应快速个性化，但计算二阶梯度开销较大，常需梯度近似。 * 迁移学习（Transfer Learning）：将训练好的全局FL模型视为源域，将各客户端视为目标域，通过领域自适应技术（如添加CORAL层）减少域间差异，从而提升个性化效果。FedHealth、FedMD等医疗领域应用常采用此策略。这种方法通常复用全局模型的底层通用特征，仅微调高层任务特定层。
第二大类策略：学习个性化模型（Learning Personalized Models） 此类策略的核心思路是直接修改FL的模型聚合过程，为每个客户端训练独立的个性化模型，而非先训练单一全局模型再调整。根据模型构建方式，可细分为： * 基于架构的方法（Architecture-based Approaches）：通过定制化的模型架构设计实现个性化。 * 参数解耦（Parameter Decoupling）：将模型参数划分为共享（联邦）部分和私有（个性化）部分。例如，可以让所有客户端共享基础层以学习通用特征，而各自保留并独立训练顶部的个性化层；或者将用户嵌入向量等特征表示作为私有参数。LG-FedAvg结合了本地表征学习与联邦训练。这种方法架构设计灵活，但如何最优划分共享与私有部分是一大挑战。 * 知识蒸馏（Knowledge Distillation）：允许客户端和服务器拥有不同的模型架构，通过知识蒸馏（以logits或类别分数作为知识载体）在异构架构间传递知识。根据蒸馏方向可分为：向客户端蒸馏（如FedMD、FedGen）、向服务器蒸馏、双向蒸馏（如FedGKT）以及客户端间蒸馏（如D-DISTILL）。这种方法能极大支持模型架构的个性化，适应资源异构的客户端，且通常通信高效，但常依赖于一个公共代理数据集。 * 基于相似性的方法（Similarity-based Approaches）：通过建模客户端之间的关系来学习个性化模型，使数据相似的客户端学习相似的模型。 * 多任务学习（Multi-Task Learning, MTL）：将每个客户端视为一个独立但相关的任务，通过联合学习捕捉客户端间关系。MOCHA算法是早期将分布式MTL引入FL的工作，但要求所有客户端每轮参与且限于凸模型。FedAMP引入注意力机制促进相似客户端间的协作；FedCurv借鉴持续学习思想防止灾难性遗忘。 * 模型插值（Model Interpolation）：学习一个全局模型和多个本地模型的混合体，通过惩罚参数控制个性化程度（λ=0为纯本地学习，λ→∞逼近全局模型）。APFL算法能自适应学习每个客户端的最优混合权重。HeteroFL则从一个全局模型派生出不同复杂度的本地模型以适应系统异构性。 * 聚类（Clustering）：假设客户端存在自然分组，为每个同质群组训练一个簇模型，而非单一全局模型。方法包括基于梯度相似性的层次聚类（计算开销大）、迭代联邦聚类算法IFCA（需预设簇数K，通信开销为K倍）、以及FedGroup等。这类方法适用于客户端分布存在固有分区的场景，但需要额外的簇管理和部署基础设施，且聚类过程通常带来较高的计算和通信成本。
PFL的基准测试、评估指标与不足 论文指出，当前PFL研究在基准测试和评估方面存在不足。大多数研究使用公开数据集（如MNIST, CIFAR, EMNIST）并通过人工划分（如按标签狄利克雷分布Dir(α)采样、按用户划分、旋转增强等）来模拟非IID设置，主要包括四种类型：数量偏斜、特征分布偏斜、标签分布偏斜和标签偏好偏斜。然而，现有研究大多只针对单一类型的非IID设置进行评估，缺乏对更复杂、更现实异构场景（如随时间变化的概念漂移）的考察。 评估指标可分为三类： 1. 模型性能：主要是个性化模型的平均测试精度，也有研究采用精度分布直方图、方差、或个体客户端精度提升来衡量。 2. 系统性能：包括通信效率（通信轮数、参数量）、计算效率（FLOPs、训练时间）、系统异构性（不同硬件能力模拟）、可扩展性（客户端规模、总耗时）和容错性（客户端掉线率）。 3. 可信AI属性：如公平性、鲁棒性（对抗攻击）和可解释性。目前这方面的评估在PFL中尚不充分。
未来研究方向 基于对现有文献的梳理，作者展望了PFL未来几个充满希望的研究方向： * PFL架构设计的新机遇： * 客户端数据异构性分析：在保护隐私的前提下量化数据分布差异。 * 聚合过程创新：探索超越简单平均的、更适应异构数据的模型聚合方法。 * PFL架构搜索：利用神经架构搜索（NAS）自动优化模型架构。 * 空间适应性：解决新客户端加入的冷启动问题、客户端掉队和掉线问题，可结合持续学习、梯度压缩、异步更新等技术。 * 时间适应性：应对现实世界中数据分布随时间变化（概念漂移）的挑战。 * PFL基准测试的完善： * 更真实的数据集：需要包含更多模态、源自真实FL场景的数据集。 * 更真实的非IID设置：模拟混合型、动态变化的非IID场景。 * 更全面的评估指标：建立兼顾模型性能、系统开销和可信AI属性的综合评价体系。 * 可信PFL的探索： * 开放协作与激励机制：设计机制激励自利的数据所有者参与和共享。 * 公平性：定义并解决FL中因数据量、活跃度等差异带来的新公平性问题。 * 可解释性：在隐私约束下实现FL模型，特别是PFL模型的可解释性。 * 鲁棒性：研究针对复杂PFL协议的新型攻击与防御方法。
论文的意义与价值 这篇题为“Towards Personalized Federated Learning”的综述具有重要的学术价值与实践意义。首先，它首次为快速发展的PFL领域提供了一个系统、清晰且具有洞察力的分类框架，将纷繁复杂的研究工作梳理为“全局模型个性化”和“学习个性化模型”两大策略，并进一步细分为数据、模型、架构、相似性四类方法，为研究人员理解和探索该领域提供了宝贵的“路线图”。其次，论文不仅总结了技术方法，还深入分析了每类方法的优势、劣势、假设和潜在限制，并指出了当前基准测试和评估指标的不足。最后，论文高屋建瓴地提出了多个未来研究方向，涵盖了算法设计、系统构建、基准评测和可信AI等多个维度，对引领领域未来发展具有重要的指导作用。对于任何希望进入或深入了解个人化联邦学习这一前沿领域的研究者和实践者而言，本文都是一份不可或缺的纲领性文献。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问