这篇文档属于类型a,即单篇原创研究的学术报告。以下是对该研究的详细介绍:
本研究的主要作者包括Rui Ye、Zhenyang Ni、Fangzhao Wu、Siheng Chen和Yanfeng Wang。他们分别来自上海交通大学、微软亚洲研究院和上海人工智能实验室。该研究发表于2023年的第40届国际机器学习会议(ICML),会议地点为美国夏威夷檀香山。
个性化联邦学习(Personalized Federated Learning, PFL)是一种在保护隐私的前提下,通过多个客户端协作训练个性化模型的机器学习框架。传统的联邦学习方法通常训练一个全局模型,但由于客户端数据的异构性,全局模型可能无法满足每个客户端的个性化需求。因此,PFL应运而生,旨在为每个客户端训练一个适应其本地数据的个性化模型。
然而,现有的PFL方法未能细粒度地确定哪些客户端应该协作,导致难以处理数据异构性和恶意客户端的问题。为了解决这一问题,本研究提出了一种基于推断协作图(Inferred Collaboration Graph)的PFL算法,名为pfedgraph。该算法的核心思想是通过学习一个协作图来建模每对客户端之间的协作收益,并为每个客户端分配适当的协作强度。
pfedgraph算法包含两个关键模块: 1. 服务器端的协作图推断:基于客户端之间的模型相似性和数据集大小,推断协作图,以促进细粒度的协作。 2. 客户端的本地模型优化:在服务器提供的聚合模型的辅助下,优化本地模型,以促进个性化。
服务器通过计算客户端上传的本地模型之间的余弦相似性,推断协作图。具体而言,服务器首先计算所有客户端模型参数的两两余弦相似性,生成相似性矩阵。然后,服务器通过求解一个二次规划问题,优化协作图的权重矩阵。优化目标是最小化协作强度与数据集大小之间的差异,并最大化协作强度与模型相似性之间的相关性。
客户端在接收到服务器发送的聚合模型后,初始化本地模型,并通过平衡任务驱动的经验损失与本地模型和聚合模型之间的相似性,优化本地模型。具体而言,客户端通过随机梯度下降(SGD)方法更新本地模型,同时利用聚合模型进行正则化。
pfedgraph算法在多个数据集和场景下进行了广泛的实验验证,结果表明其在处理不同数据异构性水平和恶意客户端的情况下,均优于其他14种基线方法。具体结果如下: 1. 图像分类任务:在Fashion-MNIST、CIFAR-10和CIFAR-100数据集上,pfedgraph在不同异构性水平下的平均准确率显著高于其他方法。 2. 文本分类任务:在Yahoo! Answers数据集上,pfedgraph在不同异构性水平下的平均准确率也优于其他方法。 3. 模型中毒攻击:在CIFAR-10数据集上,pfedgraph在四种不同类型的模型中毒攻击下,均表现出较强的鲁棒性,显著优于其他方法。
本研究提出的pfedgraph算法通过推断协作图和优化本地模型,成功解决了PFL中的关键挑战,即在个体效用与协作收益之间找到适当的平衡。该算法的优势在于能够灵活适应不同的数据异构性水平,并通过协作图推动每个客户端与相似且有益的客户端进行更多协作。实验结果表明,pfedgraph在处理数据异构性和模型中毒攻击方面具有显著的鲁棒性,为个性化联邦学习提供了一种有效的解决方案。
本研究还探讨了模型相似性度量方法的选择,实验结果表明,余弦相似性在捕捉模型相似性方面表现最佳。此外,研究还通过可视化协作图,展示了pfedgraph在不同数据异构性水平和模型中毒攻击下的协作关系,进一步验证了算法的有效性。
本研究为个性化联邦学习领域提供了一种新颖且高效的解决方案,具有重要的理论和应用价值。