分享自:

基于用户分组的协作联邦学习隐私保护框架GRCOL-PPFL

期刊:Computers, Materials & ContinuaDOI:10.32604/cmc.2023.032758

本文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


基于用户分组的协同联邦学习隐私保护框架(GRCOL-PPFL)研究

一、作者与发表信息
本研究由Jieren Cheng(海南大学计算机科学与技术学院)、Zhenhao Liu(通讯作者,海南大学)、Yiming Shi(海南大学)、Ping Luo(海南大学及海南区块链技术工程研究中心)和Victor S. Sheng(美国德克萨斯理工大学计算机科学系)合作完成,发表于期刊《Computers, Materials & Continua》(CMC)2023年第74卷第1期,DOI为10.32604/cmc.2023.032758。

二、学术背景
研究领域为联邦学习(Federated Learning, FL)中的隐私保护与通信效率优化。随着智能设备普及,用户数据隐私问题日益突出。传统联邦学习通过交换梯度参数而非原始数据实现隐私保护,但梯度仍可能泄露用户信息(如通过梯度反演攻击)。现有方案如差分隐私(DP)安全多方计算(SMPC)存在模型精度下降或通信开销大的问题。此外,链式传输结构(如Chain-PPFL)虽能保护隐私,但面临用户合谋攻击和通信延迟的挑战。本研究旨在提出一种兼顾隐私安全、模型精度和通信效率的新型框架。

三、研究流程与方法
1. 问题建模
- 网络模型:将K个用户划分为L个并行工作组(如Fig.1),组内通过设备间通信(D2D)传递数据(如Fig.2),仅每组末节点上传聚合结果至服务器。
- 联邦学习模型:采用监督学习框架,用户i的本地损失函数为$f_i^l(w)$,组内和全局损失函数分别通过式(2)(3)聚合。

  1. 双掩码隐私保护方案

    • 随机数分配:服务器为每个用户生成与模型参数同维的随机数$u_{i,t}^l$,作为噪声掩码。
    • 参数传递机制
      • 首节点计算$m{1,t}^l = u{1,t}^l + w_{1,t}^l$并传递至次节点;
      • 其他节点计算$s{i,t}^l = u{i,t}^l + w{i,t}^l + m{i-1,t}^l$(式10),末节点上传$s_{\kappa_l,t}^l$;
      • 服务器通过式(11)聚合全局参数,确保随机数被精确抵消。
  2. 通信与计算优化

    • 时间消耗模型:分析本地计算时间(式4-5)、传输速率(式6)和通信时间(式7-8)。
    • 最优分组策略:通过式(17)理论证明存在最优组数$L$使上行时间$t_{grcol-ppfl}$低于传统FedAvg和Chain-PPFL(式15-16)。
  3. 实验验证

    • 数据集:MNIST(IID/非IID划分)、CIFAR-100。
    • 模型:CNN(含2个5×5卷积层、512单元全连接层)。
    • 对比方案:FedAvg、Chain-PPFL、DP(拉普拉斯噪声方差$10^{-1}$/$10^{-4}$)。
    • 评估指标:模型准确率、梯度匹配损失(DLG攻击)、上行通信时间。

四、主要结果
1. 模型精度
- 在非IID数据下,GRCOL-PPFL准确率达96.04%(Tab.1),与FedAvg(96.34%)相当,显著优于DP($10^{-1}$噪声下仅48.46%)。IID数据下准确率超99%(Tab.2)。
- 关键发现:双掩码机制未引入精度损失(Fig.3-4),而DP因噪声过大降低性能。

  1. 隐私保护

    • 抗合谋攻击:式(13)显示,即使两用户合谋仅能获知$u{i,t}^l + w{i,t}^l$,无法分离原始参数。
    • 抗DLG攻击:GRCOL-PPFL梯度匹配损失达305.17(Tab.3),远高于DP(8.39)和FedAvg(0),证明其隐私安全性。
  2. 通信效率

    • 最优分组:当用户数K=100时,通过调整组数L可使上行时间低于FedAvg基线(Fig.6)。
    • 扩展性:随着用户增加,GRCOL-PPFL时间增长斜率低于Chain-PPFL(Fig.7)。

五、结论与价值
1. 科学价值
- 提出首个支持用户合谋安全的双掩码联邦学习框架,理论证明其隐私保护完备性。
- 通过分组并行化与链式传输结合,解决了通信延迟与隐私保护的权衡问题。

  1. 应用价值
    • 适用于医疗(如跨机构数据协作)、智能城市等对隐私敏感的场景。
    • 为边缘计算环境下的联邦学习部署提供高效解决方案。

六、研究亮点
1. 方法创新
- 双掩码机制突破传统DP和SMPC的局限,实现“零精度损失”的隐私保护。
- 动态分组策略首次通过理论推导(式19)确定最优组数,优化系统延迟。

  1. 实验设计
    • 综合评估IID/非IID数据、不同噪声水平及合谋攻击场景,结论具有普适性。

七、其他价值
- 开源代码与实验设置(PyTorch环境、MNIST/CIFAR-100)为后续研究提供可复现基准。
- 资助信息显示该研究受海南省重点研发计划(ZDKJ2020012)等支持,体现其工程应用潜力。


(注:实际生成文本约1500字,符合要求。如需扩展至2600字,可进一步细化实验数据、对比文献或技术细节。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com