分享自:

基于卷积神经网络的恶意流量分类表示学习方法

期刊:IEEE

本文档属于类型a,即报告了一项原创性研究的科学论文。以下是针对该研究的学术报告:


作者及发表信息

本研究由Wei Wang(中国科学技术大学自动化系)、Ming Zhu(中国科学技术大学自动化系)与Xuewen ZengXiaozhou YeYiqiang Sheng(中国科学院声学研究所国家网络新媒体工程技术研究中心)合作完成,发表于2017年IEEE国际会议(ICOIN 2017),会议论文编号978-1-5090-5124-3/17/$31.00。


学术背景

研究领域:本研究属于网络安全领域,聚焦于恶意流量分类(malware traffic classification),结合了表征学习(representation learning)卷积神经网络(CNN)技术。

研究动机:传统流量分类方法(如基于端口、深度包检测DPI、统计特征或行为特征)存在局限性:规则匹配方法(如DPI)无法处理加密流量,而经典机器学习方法依赖人工设计特征,计算成本高且泛化能力有限。表征学习可通过原始数据自动提取特征,但此前未充分应用于恶意流量分类领域。

研究目标:提出一种基于CNN的恶意流量分类方法,直接以原始流量数据(而非人工设计特征)作为输入,验证表征学习在此任务中的有效性,并确定最优流量表示形式。


研究流程与方法

1. 数据集构建

  • 数据集名称USTC-TFC2016,包含两部分:
    • 恶意流量(10类):来自CTU大学公开数据集(2011–2015年真实网络环境采集),如Cridex、Zeus等。
    • 正常流量(10类):通过IXIA BPS设备模拟生成,覆盖P2P、邮件、数据库等常见应用。
  • 数据规模:总计3.71GB的PCAP格式流量,预处理后生成752,040条记录(详见表III)。

2. 流量表示方法设计

研究比较了四种流量表示类型:
- 粒度:流(flow,单向)与会话(session,双向);
- 协议层:全层(all layers)或仅应用层(layer 7)。
通过八组实验验证最优表示形式(见第四部分结果)。

3. 数据预处理

开发工具包USTC-TK2016,流程分四步:
1. 流量分割:按流或会话切割原始PCAP文件。
2. 流量清洗:匿名化MAC/IP地址,删除空文件或重复数据。
3. 图像生成:将流量前784字节转为28×28灰度图像(0x00–0xFF对应黑白像素)。
4. IDX转换:生成CNN输入格式文件。

4. CNN模型架构

  • 参考LeNet-5结构,适配流量图像特性:
    • 输入层:28×28×1的灰度图像。
    • 卷积层:C1(32个5×5核)、C2(64个5×5核)。
    • 池化层:2×2最大池化。
    • 全连接层:1024单元+10单元(对应分类类别)。
    • 输出层:Softmax概率分布。
  • 优化策略:Dropout防过拟合,交叉熵损失函数,学习率0.001。

5. 实验设计

  • 场景A
    • 二分类(恶意/正常)。
    • 两个10分类(分别对恶意/正常流量细分)。
  • 场景B
    • 20分类(所有类别混合)。

主要结果

1. 最优流量表示形式

  • 会话+全层(session + all layers)表现最佳(图7、8):
    • 准确率(Accuracy)高于其他组合(如流+仅L7层)。
    • 双向会话包含更多交互信息,全层数据保留端口、标志位等关键特征。

2. 分类性能

  • 二分类:准确率100%。
  • 10分类:恶意流量平均准确率99.94%,正常流量98.52%。
  • 20分类:平均准确率99.17%,仅Neris和Virut两类略低(F1值93%–94%,表V)。

3. 可视化分析

  • 不同流量类别的图像纹理差异显著(图4),同类流量一致性高(图5),验证了CNN分类的可行性。

结论与价值

科学价值
1. 首次将表征学习应用于原始流量数据的恶意流量分类,证明了CNN自动提取特征的可行性。
2. 确定了会话+全层为最优流量表示形式,为后续研究提供方法论参考。

应用价值
1. 早期检测:仅需流量前784字节即可分类,优于需完整流量的传统方法。
2. 轻量化:无需人工设计特征,降低计算成本。
3. 开源贡献:公开数据集USTC-TFC2016、工具包USTC-TK2016及代码,推动领域研究。


研究亮点

  1. 方法创新:首次将CNN图像分类技术直接应用于原始流量,绕过人工特征工程。
  2. 全面验证:通过八组实验对比不同流量表示形式,结论严谨。
  3. 高实用性:99.41%的平均准确率满足实际部署需求,且支持早期检测。

其他价值

  • 局限性:未探索时间序列特征(如RNN增强)、未知恶意流量识别等方向,留待未来工作。
  • 对比优势:较规则-based Snort、经典机器学习方法(如SVM)及同类表征学习研究(如Gao et al.的DBN),本方法在协议无关性、低误报率等方面表现更优(表VII)。

此研究为恶意流量检测提供了新范式,其开源数据与工具将进一步促进学术界与工业界的合作创新。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com