基于知识蒸馏的联邦学习在鲁棒聚合规则下的投毒攻击研究

分享自：
基于知识蒸馏的联邦学习在鲁棒聚合规则下的投毒攻击研究

期刊:IEEE Transactions on Information Forensics and SecurityDOI:10.1109/TIFS.2025.3586491
这篇文档属于类型a，是一篇关于联邦学习中知识蒸馏（Knowledge Distillation, KD）安全漏洞的原创研究论文。以下为详细学术报告：
作者及机构
 该研究由Xiaoyi Pang、Zhibo Wang（IEEE高级会员）、Defang Liu、Jiahui Hu、Peng Sun、Meng Luo和Kui Ren（IEEE Fellow）合作完成。作者团队来自浙江大学区块链与数据安全国家重点实验室、武汉大学、南昌大学、湖南大学及新加坡国立大学。论文发表于《IEEE Transactions on Information Forensics and Security》2025年第20卷。
学术背景
 联邦学习（Federated Learning, FL）是一种隐私保护的分布式学习范式，允许多个客户端在不共享本地数据的情况下协同训练全局模型。然而，FL易受投毒攻击（Poisoning Attacks），传统防御依赖于基于统计相似性的鲁棒聚合规则（Robust Aggregation Rules, AGRs）。近年来，知识蒸馏（KD）被引入FL以解决客户端模型异构性问题，通过聚合模型输出（logits）实现跨架构协作。但KD过程引入了新的攻击面：攻击者可操纵恶意客户端的logits破坏全局模型性能。现有研究未充分探索KD-based FL在鲁棒AGR下的安全风险，本研究旨在填补这一空白，提出首个针对KD-based FL的通用无目标投毒攻击方案ManipulatingKD。
研究流程与方法
 1. 问题建模与威胁模型
 - 攻击能力：攻击者控制部分客户端（c个），在联邦蒸馏过程中发送精心设计的恶意logits。攻击适用于异构FL环境（客户端模型架构不同）。
 - 攻击知识：分为四种场景：
 - Full-Local：已知所有客户端的良性logits；
 - Partial-Local：仅知恶意客户端的良性logits；
 - Full-Global：额外知晓全局模型参数；
 - Partial-Global：仅知本地模型参数。
 - 攻击目标：通过操纵logits使全局模型测试误差显著增加（无目标攻击），同时绕过鲁棒AGR的检测。
攻击方案设计
核心思想：将攻击建模为约束优化问题，最大化恶意logits与原始聚合logits（或全局logits）的差异（KL散度衡量），同时约束恶意logits与良性logits的统计相似性（MSE衡量）。
 
关键技术：
 参考信息估计：根据攻击模型类型，使用均值AGR估计原始聚合logits、全局logits及最大参考距离（max-ref distance）。
 
优化求解：采用拉格朗日乘数法，通过梯度上升迭代生成恶意logits。
 
实验验证
数据集与设置：在MNIST和CIFAR-10数据集上测试，比较IID与非IID数据分布，评估攻击在均值（Mean）、Trimean、Median、Krum和AFA等AGR下的效果。
 
对比基线：包括高斯噪声（Gaussian）、随机扰乱（Disruption）、标签翻转（LabelFlip）、梯度攻击（Grad）等传统方法。
 
评估指标：攻击效果以全局模型准确率下降（Attack Impact）衡量。
主要结果
 1. 攻击有效性
 - 在异构FL环境中，ManipulatingKD在MNIST（IID）上使均值AGR下的全局准确率下降超66.69%，在鲁棒AGR（如Krum）下最高下降82.8%，显著优于基线方法（如Shuffling攻击仅降8.27%）。
 - 在CIFAR-10（非IID）中，攻击对Median和AFA的准确率降幅分别达64.73%和41.92%，验证了攻击对鲁棒AGR的通用性。
鲁棒性分析
Krum与AFA的脆弱性：因二者依赖向量级过滤，恶意logits的高相似性易导致误选（Krum）或误删良性logits（AFA）。
 
Trimean与Median的防御优势：因采用维度级过滤，恶意logits的影响被部分抵消。
参数影响
恶意客户端比例：30%比例即可显著降低模型性能，50%时全局准确率可降至10%以下（如CIFAR-10+Mean）。
 
非IID程度：数据分布越异构，攻击效果越强（MNIST非IID下攻击效果提升约20%）。
结论与价值
 1. 科学价值
 - 首次揭示了KD-based FL在鲁棒AGR下的新型投毒风险，提出通过logits操纵实现间接攻击的理论框架。
 - 提出的优化攻击方法为FL安全领域提供了自适应攻击（Adaptive Attack）的典型案例，推动防御策略的动态演进。
应用意义
 警示现有鲁棒AGR可能提供虚假安全感，需设计更精细的logits检测机制。
 
为异构FL系统的安全部署提供实验基准，如建议在KD过程中引入熵检测（Entropy-based Filtering）等补充防御。
研究亮点
 1. 创新性攻击面：首次系统性探索KD过程中logits操纵的攻击潜力，突破传统数据/模型投毒的局限。
 2. 方法普适性：提出的优化框架可适配不同攻击模型（Full/Partial-Local/Global），无需预知AGR类型。
 3. 实验全面性：覆盖异构/同构FL、IID/非IID数据、多种AGR，攻击效果均优于现有方法。
其他发现
 - 攻击隐蔽性：恶意logits的统计相似性使其能绕过基于子logits检测（SubDet）和熵检测（EntroDet）的自适应防御。
 - 与梯度攻击对比：在异构环境中，ManipulatingKD的间接攻击效果甚至优于直接梯度篡改（如Grad），凸显logits攻击的独特威胁。
该研究为FL安全领域提供了重要警示，未来需进一步探索针对logits攻击的专用防御机制。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问