分享自:

9、基于掩膜自动编码器的对抗对比蒸馏算法

期刊:计算机学报DOI:10.11897/sp.j.1016.2024.02274

基于掩膜自动编码器的对抗对比蒸馏算法:提升神经网络对抗鲁棒性的新方法

作者及发表信息
本文由张点(西北工业大学计算机学院)和董云卫(西北工业大学软件学院)共同完成,发表于《计算机学报》第47卷第10期(2024年10月)。研究得到国家重点研发计划(2022YFB4501801)和西北工业大学博士论文创新基金(CX2024075)资助。


学术背景
随着人工智能的快速发展,神经网络在计算机视觉、自动驾驶和医疗等领域展现出卓越性能,但其对抗鲁棒性(adversarial robustness)问题日益突出。对抗样本(adversarial examples)通过添加微小扰动即可导致模型误分类,威胁安全关键领域的应用。现有对抗训练方法虽能提升鲁棒性,但存在两大瓶颈:
1. 耗时问题:需在每次迭代中生成对抗样本,计算成本高;
2. 样本多样性不足:单一对抗攻击生成的样本限制模型泛化能力。
本文旨在通过结合掩膜自动编码器(masked auto-encoder, MAE)、知识蒸馏(knowledge distillation)和对比学习(contrastive learning),提出一种高效且多样化的对抗鲁棒性提升算法。


研究方法与流程

1. 改进的掩膜自动编码器(MAE)设计
目标:训练教师模型从局部可见图像块推理全局特征,减少对完整图像的依赖。
流程
- 输入处理:将图像随机分为可见子块(30%)和遮挡子块(70%),移除遮挡部分仅保留可见块。
- 编码器:采用Vision Transformer(ViT)架构,将可见块映射为隐式特征表示(latent features)。
- 特征融合模块(创新点):
- 计算完整图像的特征表示作为参考模板;
- 通过池化和softmax加权融合可见块与完整图像特征,生成全局特征表示。
- 解码器:根据全局特征和遮挡位置标记(mask tokens)重建被遮挡的像素。
- 损失函数:结合特征均方误差(MSE)和像素重建误差,确保特征一致性与重建精度。

实验验证:在CIFAR-10和CIFAR-100数据集上,MAE成功恢复遮挡部分像素(图2),证明其推理能力。

2. 对比知识蒸馏框架
目标:将教师模型的推理能力迁移至学生模型(目标模型主干),同时增强细节特征识别。
流程
- 知识蒸馏
- 教师模型(MAE编码器)提供全局特征表示;
- 学生模型通过最小化特征距离(如KL散度)学习教师模型的推理模式。
- 对比学习
- 输入学生模型的图像采用不同遮挡尺寸和比率,构建多视角样本;
- 通过对比损失(如InfoNCE)拉近同类样本特征、推开异类样本特征。
- 分类头微调:使用标签信息调整分类层,平衡干净样本准确率与对抗鲁棒性。

实验设计
- 模型:ResNet50和WideResNet50;
- 数据集:CIFAR-10、CIFAR-100;
- 对抗攻击:白盒(FGSM、PGD)和黑盒攻击,扰动强度为8/255和16/255。


主要结果
1. 对抗鲁棒性提升
- CIFAR-10:ResNet50对抗准确率平均提升12.73%,WideResNet50提升6.67%;
- CIFAR-100:ResNet50提升3.66%,WideResNet50提升7.13%。
2. 效率优势:仅需单次生成对抗样本,训练时间比传统对抗训练缩短约40%。
3. 多样性增强:随机掩膜生成的多视角样本有效缓解对比学习中的特征单一性问题。

结果逻辑链
- MAE的特征融合模块使学生模型减少对全局特征的依赖,从而削弱对抗干扰的影响;
- 对比学习通过多视角样本增强细节识别能力,进一步提升鲁棒性;
- 分类头微调确保干净样本的准确率不受显著损失。


结论与价值
科学价值
1. 提出首个结合MAE与对比蒸馏的对抗防御框架,为鲁棒性研究提供新思路;
2. 揭示了通过局部特征推理全局信息的有效性,为自监督学习与对抗训练的融合奠定基础。
应用价值
1. 适用于安全敏感场景(如自动驾驶、医疗诊断),降低对抗攻击风险;
2. 高效训练机制可扩展至大规模数据集(如ImageNet)。

重要观点:对抗鲁棒性的提升需同时关注模型结构优化(如MAE)和训练策略创新(如对比蒸馏),而非仅依赖对抗样本生成。


研究亮点
1. 方法创新
- 改进MAE的特征融合模块,首次实现从局部到全局的特征推理;
- 提出“单次对抗样本生成+随机掩膜”策略,解决耗时与多样性矛盾。
2. 实验验证:在经典模型和数据集上实现显著鲁棒性提升,结果具有可复现性。
3. 跨领域意义:为计算机视觉、网络安全等领域的模型安全性研究提供通用框架。

其他价值:开源代码与实验细节为后续研究提供基准,推动对抗防御领域的标准化进程。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com