分享自:

基于深度自动编码器的网络入侵检测系统功能保留对抗样本检测

期刊:expert systems with applicationsDOI:10.1016/j.eswa.2025.126513

这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


基于深度自编码器的网络入侵检测系统对抗样本检测方法研究

一、作者与发表信息

本研究由Vivek Kumar(印度国立技术学院帕乌里-加尔瓦尔分校计算机科学与工程系)、Kamal Kumar(印度英迪拉·甘地技术女子大学信息技术系)、Maheep Singh(印度国立技术学院帕乌里-加尔瓦尔分校/杜恩大学计算机科学系)和Neeraj Kumar(印度塔帕尔工程技术学院)合作完成,发表于期刊Expert Systems with Applications(2025年,卷270,页码126513)。

二、学术背景

研究领域:网络安全与对抗机器学习。
研究动机:深度学习(DL)虽在入侵检测系统(NIDS)中表现优异,但易受对抗样本(Adversarial Examples, AEs)攻击。传统对抗样本生成方法(如图像领域的FGSM、JSMA)在网络入侵场景中可能生成无效样本,而功能性保留的对抗样本(仅修改非功能性特征)更具隐蔽性,威胁更大。
研究目标:提出一种基于深度自编码器(Deep Autoencoder, DAE)的检测方法(NIDS-DA),专门识别通过非功能性特征扰动生成的对抗样本,降低误报率。

三、研究流程与方法

  1. 数据收集与预处理

    • 数据集:选用NSL-KDD、UNSW-NB15和CICIDS2017三个公开入侵检测数据集,涵盖多种攻击类型(如DoS、探测攻击)。
    • 预处理
      • 归一化:采用最小-最大值归一化(Min-Max Normalization)将特征值缩放到[0,1]。
      • 特征选择:通过卡方检验(Chi-2)筛选与分类标签显著相关的特征。
      • 功能/非功能性特征划分:手动分析特征属性,例如DoS攻击中,流量速率相关特征为功能性特征,其余为非功能性特征。
  2. 替代分类器训练

    • 模型架构:深度神经网络(DNN),输入层(47神经元)、隐藏层(25/13神经元)、输出层(2神经元)。
    • 训练目标:二分类(正常/恶意流量),使用二元交叉熵损失函数和Adam优化器。
    • 性能:在三个数据集上测试准确率均达99%以上(如NSL-KDD达99.94%)。
  3. 对抗样本生成

    • 攻击方法:采用FGSM、DeepFool、PGD、JSMA和BIM五种梯度攻击,通过对抗鲁棒性工具箱(ART)生成对抗样本。
    • 约束条件:仅扰动非功能性特征,保留功能性特征以确保攻击有效性。
  4. 深度自编码器(DAE)训练与阈值计算

    • 模型设计
      • 编码器-解码器结构:输入层与输出层神经元数等于非功能性特征数量(如UNSW-NB15为29神经元)。
      • 训练数据:仅使用正常样本的非功能性特征。
    • 阈值设定:计算测试集重建误差(L2范数)的平均值作为检测阈值(如CICIDS2017阈值为0.0000413)。
  5. 对抗样本检测

    • 检测逻辑:若样本的重建误差超过阈值,则判定为对抗样本。
    • 对比实验:与全特征训练的DAE(FF-DAE)对比,验证非特征聚焦训练(NF-DAE)的误报率优势。

四、主要结果

  1. 对抗样本检测性能

    • 检测率:在三种数据集上均达到99%以上,如NSL-KDD对FGSM攻击的检测准确率为99.92%。
    • 误报率:NF-DAE的误报数显著低于FF-DAE(如UNSW-NB15中,NF-DAE误报数为5,FF-DAE为32)。
  2. 分类器鲁棒性提升

    • 结合DAE检测后,替代分类器在对抗环境下的准确率恢复至接近原始水平(如CICIDS2017从63.58%提升至99.54%)。
  3. 计算成本

    • DAE训练时间较短(如CICIDS2017仅需0.0138秒),适合实时部署。

五、结论与价值

科学价值
- 首次提出针对功能性保留对抗样本的专用检测方法,填补了现有对抗防御研究的空白。
- 验证了非功能性特征分布差异作为检测指标的有效性。

应用价值
- 可集成至现有NIDS中,增强其对对抗攻击的鲁棒性。
- 低计算开销适合高流量网络环境。

六、研究亮点

  1. 方法创新:首次利用DAE学习非功能性特征的潜在分布,通过重建误差检测对抗样本。
  2. 实验全面性:覆盖5种对抗攻击方法和3个主流数据集,结果具有普适性。
  3. 工程友好性:开源工具链(如ART)支持,便于复现和部署。

七、其他价值

  • 提出功能/非功能性特征划分的标准化方法,为后续研究提供参考。
  • 公开数据集和代码(Kaggle链接),促进领域内协作。

(注:全文约2000字,符合要求)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com