利用表征相似性分析保护联邦学习免受数据中毒的研究

分享自：
利用表征相似性分析保护联邦学习免受数据中毒的研究

期刊:companion proceedings of the acm web conference 2024 (www ’24 companion)DOI:10.1145/3589335.3651503
基于表征相似性分析的联邦学习数据投毒防御研究：RSIM-FL的提出与验证
作者及发表信息
 本研究由中山大学的Gengxiang Chen、剑桥大学的Kai Li、伦敦玛丽女王大学的Ahmed M. Abdelmoniem及中山大学的Linlin You（通讯作者）合作完成，发表于2024年ACM网络会议（WWW ‘24 Companion）。论文标题为《Exploring Representational Similarity Analysis to Protect Federated Learning from Data Poisoning》。
学术背景
 联邦学习（Federated Learning, FL）作为一种隐私保护的分布式学习范式，允许多个客户端在不共享原始数据的情况下协作训练全局模型。然而，这种模式也面临数据投毒攻击（如标签翻转攻击，Label-Flipping Attacks, LFAs）的威胁，攻击者通过篡改本地数据破坏模型稳定性。现有防御策略大多假设数据满足独立同分布（Independent and Identically Distributed, IID）条件，但在实际非IID场景（如物联网设备数据）中性能显著下降。为此，本研究提出RSIM-FL，通过引入表征相似性分析（Representational Similarity Analysis, RSA）检测恶意模型更新，以应对非IID环境下的安全挑战。
研究流程与方法
 1. 问题定义与系统架构
 - 场景设置：FL系统包含1个中央服务器和30个客户端，其中40%为恶意客户端，发起标签翻转攻击（如MNIST数据集中将“9”翻转为“7”）。
 - 核心思想：通过计算本地模型与全局模型对同一刺激数据集（stimulus dataset）的响应相似性，识别恶意模型。
客户端与服务器端设计
客户端：分为良性客户端（使用标准数据集训练）和恶意客户端（上传基于投毒数据的模型）。
 
服务器端：
 表征相似性分析（RSA）：对每个本地模型𝑤𝑛和全局模型𝑤𝐺，计算其表征相似性矩阵（Representational Similarity Matrix, RDM）。公式如下：
 [ RDM_n[i,j] = \frac{O(s_i) \cdot O(s_j)}{|O(s_i)| |O(s_j)|} ]
 其中，𝑂(𝑠𝑖)为模型对刺激样本𝑠𝑖的输出向量。
 
表征一致性（RC）计算：通过皮尔逊相关系数（Pearson Correlation Coefficient）量化本地模型与全局模型的相似性：
 [ RC_{n,G} = [\rho(RDM_n, RDM_G)]^2 ]
 
聚类与聚合：对RC集合进行归一化后，使用K-means聚类分离恶意模型，仅聚合良性模型以更新全局模型。
 
实验验证
数据集：MNIST（手写数字）和GTSRB（交通标志），通过狄利克雷分布（Dirichlet distribution, α=0.5）模拟非IID数据。
 
基线方法：对比FedAvg、Median、PEFL、LFR-PPFL、FoolsGold五种防御算法。
 
评估指标：
 准确率（Top-1 Accuracy, Acc）
 
攻击成功率（Attack Success Rate, ASR）
 
主要结果
 1. 性能对比
 - IID场景：RSIM-FL在MNIST和GTSRB上均表现最优（MNIST Acc=0.989, ASR=0.002；GTSRB Acc=0.950, ASR=0.000），显著优于基线（如FoolsGold在MNIST中ASR=0.004）。
 - 非IID场景：基线方法性能大幅下降（如FoolsGold在GTSRB中ASR从0.003升至0.179），而RSIM-FL保持稳定（MNIST Acc=0.985, ASR=0.002；GTSRB Acc=0.944, ASR=0.005）。
鲁棒性分析
 RSIM-FL对多种标签翻转攻击的ASR均值仅为0.60%（非IID下），而未防御的FedAvg ASR均值高达49.45%。
 
结论与价值
 1. 科学价值：
 - 首次将RSA引入FL安全领域，提出了一种适用于非IID场景的防御框架。
 - 通过理论分析与实验验证，证明了RSA在恶意模型检测中的高效性和鲁棒性。
应用价值：
 为物联网（IoT）等高度异构数据场景下的FL安全提供了实用解决方案。
 
相比现有方法，RSIM-FL在保持高准确率的同时，将攻击成功率降低17%（非IID场景）。
 
研究亮点
 1. 方法创新：
 - 利用RSA量化模型间相似性，避免了传统统计方法对IID假设的依赖。
 - 结合聚类算法实现恶意模型的精准隔离，减少对良性模型的误判。
实验设计：
 在严格非IID设置下验证了方法的普适性，覆盖多种标签翻转攻击变体。
 
公开代码与数据集，支持结果复现。
 
未来方向
 1. 扩展至其他攻击类型（如后门攻击）。
 2. 优化RSA计算效率以降低资源开销。
 3. 适配异步联邦学习（Asynchronous FL）场景。
资助信息
 本研究得到广东省基础与应用基础研究基金（2023A1515012895）和国家自然科学基金（62002398）支持。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问