分享自:

利用标签偏斜优化联邦学习中的脉冲神经网络

期刊:proceedings of the thirty-fourth international joint conference on artificial intelligence (ijcai-25)

这篇文档属于类型a,是一篇关于联邦学习(Federated Learning, FL)中脉冲神经网络(Spiking Neural Networks, SNNs)在标签偏斜(label skew)场景下性能优化的原创研究论文。以下是详细的学术报告内容:


主要作者与机构

本文由Di YuXin Du(通讯作者)、Linshan JiangHuijing ZhangShuiguang Deng(通讯作者)合作完成。作者团队分别来自中国浙江大学和新加坡National University of Singapore。论文发表于Proceedings of the Thirty-Fourth International Joint Conference on Artificial Intelligence (IJCAI-25)


学术背景

研究领域:本文聚焦于联邦学习(FL)脉冲神经网络(SNNs)的交叉领域,致力于解决FL中因标签偏斜导致的模型性能下降问题。

研究动机
- 现实需求:边缘设备(edge devices)因能效高、隐私保护强,常被用于部署SNNs。然而,其数据分布存在天然异构性(如标签偏斜),导致传统FL算法(如FedAvg)在聚合局部模型时产生梯度偏差(gradient bias),最终全局模型性能显著下降。
- 研究空白:现有FL方法多针对人工神经网络(ANNs)设计,而SNNs的脉冲特性(如基于时间的动态计算)使其训练过程存在独特的梯度累积偏差(layer-wise accumulated gradient drifts),现有方法难以直接适用。

研究目标
提出FedLEC框架,通过标签权重校准(intra-client label weight calibration)跨客户端知识蒸馏(inter-client knowledge distillation),缓解标签偏斜对SNNs训练的负面影响,提升全局模型准确率。


研究流程与实验设计

1. 问题定义与框架设计

  • 标签偏斜类型:分为数量型(quantity-based,如每个客户端仅含固定类别标签)和分布型(distribution-based,按Dirichlet分布分配标签样本)。
  • FedLEC核心策略
    • 标签校准(Label Calibration):通过调整局部损失函数,对少数类标签(minority labels)的logits进行加权,平衡类别学习强度(公式8)。
    • 知识蒸馏(Label Distillation):利用全局模型对缺失标签(missing labels)的预测作为“教师信号”,通过KL散度损失(公式9)对齐局部与全局模型的输出,减少过拟合。
  • 聚合方法:提出时间聚合(Aggregation Through Time, ATT),按时间步长平均局部模型参数(公式10),避免传统FedAvg在SNNs中的时序信息丢失。

2. 实验设置与基线对比

  • 数据集:5个数据集(3静态图像:CIFAR10/100、SVHN;2事件驱动:CIFAR10-DVS、N-MNIST)。
  • 模型结构:S-VGG9(默认)、MS-ResNet、Meta-Spikeformer(验证泛化性)。
  • 基线方法
    • 通用FL算法(FedAvg、FedProx、SCAFFOLD、FedNova);
    • 标签偏斜专用算法(FedLC、FedRS、Flea、FedConcat)。
  • 参数设置:50通信轮次,20%客户端参与,本地训练10轮,学习率0.001。

3. 性能评估指标

  • 准确率:对比FedLEC与基线在极端标签偏斜(如#cnum=2、p∼Dir(0.05))下的Top-1准确率。
  • 效率分析:通过T-SNE可视化特征分布,验证FedLEC对少数类和缺失标签的区分能力。

主要结果

  1. 准确率提升

    • 在CIFAR10上,FedLEC比FedAvg平均提升11.59%(如Dir(0.05)场景下从35.8%提升至46.87%)。
    • 事件驱动数据集(如N-MNIST)因数据稀疏性,提升幅度较小(约4%),但仍优于基线。
  2. 消融实验

    • 知识蒸馏(LD)贡献更大(平均提升17.61%),标签校准(LC)进一步带来1.20%增益。
    • 时间聚合(ATT)有效缓解SNNs的梯度累积偏差。
  3. 可视化验证

    • T-SNE显示FedLEC能清晰分离少数类和缺失标签的特征(图6),而FedAvg的特征重叠严重。

结论与价值

  1. 科学价值

    • 首次系统分析了SNNs在FL中因标签偏斜导致的梯度偏差问题,提出专用框架FedLEC。
    • 通过理论证明(Theorem 1-2)FedLEC在非独立同分布(Non-IID)数据下的收敛性。
  2. 应用价值

    • 适用于边缘设备部署场景(如智能交通、医疗隐私数据),兼顾能效与隐私。
    • 开源代码(GitHub链接)促进社区发展。
  3. 局限性:事件驱动数据提升有限,未来需优化稀疏特征处理。


研究亮点

  1. 方法创新

    • 首次将标签校准与知识蒸馏结合,针对性解决SNNs的标签偏斜问题。
    • 提出ATT聚合方法,适配SNNs的时序特性。
  2. 实验全面性

    • 覆盖静态与事件驱动数据、多种SNN结构(如Transformer类Meta-Spikeformer)。
    • 在极端偏斜(#cnum=2)下仍保持稳健性。
  3. 理论支撑:通过收敛性分析证明FedLEC在Non-IID场景的有效性。


其他补充

  • 隐私保护:集成拉普拉斯噪声(Laplacian noise)的本地差分隐私(LDP),在δ=0.1时准确率仅下降2.29%(表4)。
  • 超参数分析:参与率(20%-80%)、客户端数量(10-1000)对FedLEC影响较小,凸显其可扩展性。

本文为联邦脉冲神经网络的实际部署提供了重要理论工具与实验基准,未来可扩展至更复杂场景(如动态客户端、多模态数据)。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com