分享自:

生成新型基于云的分布式拒绝服务(DDoS)数据集与云入侵流量特征分析

期刊:informationDOI:10.3390/info15040195

这篇文档属于类型a,因为它报告了一项原创研究。以下是对该研究的学术报告:


研究作者及机构
本研究由Mohammadmoein ShafiArash Habibi LashkariVicente RodriguezRon Nevo共同完成。Shafi和Lashkari来自加拿大约克大学的信息技术学院和行为中心网络安全中心(BCCC),Rodriguez和Nevo则来自美国加州的CPacket公司。该研究于2024年3月31日发表在期刊Information上。

学术背景
本研究的主要科学领域是网络安全,特别是针对分布式拒绝服务攻击(DDoS)的检测与防御。DDoS攻击通过大量恶意流量淹没目标网络,对网络安全构成重大威胁。尽管已有多种DDoS检测方法,但实时检测和低计算开销的挑战仍然存在。此外,新检测方法的有效性高度依赖于高质量的数据集。因此,本研究旨在创建一个新的基于云的DDoS数据集,并通过多层次的检测模型提高DDoS检测的准确性。

研究背景包括对现有16个公开数据集的深入分析,发现这些数据集在多个维度上存在15个主要缺陷,例如类别分布不平衡、攻击类型多样性不足、缺乏真实网络流量等。基于这些分析,本研究提出了一个新的数据集生成方法,并开发了一个名为BCCC-CPacket-Cloud-DDoS-2024的公开数据集。该数据集通过云基础设施模拟了8种良性用户活动和17种DDoS攻击场景,并结合了良性用户行为分析工具(BUP)和网络流量分析工具(NTLFlowLyzer)来生成和标注数据。

研究流程
本研究的主要流程包括以下几个步骤:

  1. 数据集生成路线图
    研究首先提出了一个详细的网络数据集生成路线图,包括以下步骤:

    • 范围定义:明确目标网络的环境和用户活动。
    • 基础设施准备:搭建云基础设施,确保其可扩展性和可靠性。
    • 用户和实体定义:根据用户角色和行为生成用户配置文件。
    • 良性流量生成器设计:基于用户配置文件设计并实现良性流量生成工具(BUP)。
    • 攻击趋势研究:分析历史攻击趋势,确定攻击类型。
    • 攻击选择与实施:选择并实施17种不同的DDoS攻击场景。
    • 数据捕获与分析:通过pcap文件捕获网络流量,并使用NTLFlowLyzer进行分析。
    • 数据标注与测试:手动标注数据,并进行测试和验证。
  2. 新数据集的构建
    研究构建了一个名为BCCC-CPacket-Cloud-DDoS-2024的新数据集,具体包括以下内容:

    • 基础设施:搭建了一个模拟真实企业环境的云架构,包括受害者网络、服务器网络和攻击者组件。
    • 攻击场景:实施了17种基于TCP的DDoS攻击,每种攻击持续20分钟,间隔10分钟。
    • 良性用户行为分析:设计了良性用户行为生成器(BUP),模拟了8种良性用户活动,如网页浏览、电子邮件收发、文件传输等。
    • 数据捕获与标注:捕获了超过300个网络和传输层特征,并通过NTLFlowLyzer生成CSV文件。
  3. 流量特征模型
    研究提出了一个多层次的流量特征模型,用于区分良性流量和恶意流量。该模型包括以下层次:

    • 分类层:使用随机森林(RF)算法对流量进行分类,区分良性、可疑和攻击流量。
    • 识别层:根据分类结果,分别使用良性模型和攻击模型对流量进行详细识别。
  4. 实验与结果
    研究通过实验验证了模型的性能,具体包括以下步骤:

    • 特征选择:使用ANOVA、信息增益和Extra Tree三种算法选择最优特征集。
    • 模型实现:使用随机森林算法实现多层次检测模型。
    • 实验场景:定义了7个实验任务,分别测试模型在不同场景下的性能。
    • 性能评估:通过精度、召回率和F1分数评估模型性能,并与传统方法进行对比。

主要结果
1. 数据集生成:成功构建了一个包含17种DDoS攻击和8种良性用户活动的数据集,解决了现有数据集的多个缺陷。
2. 特征选择:通过ANOVA、信息增益和Extra Tree算法选择了40个最优特征,其中75%与TCP头部相关。
3. 模型性能:提出的多层次检测模型在7个实验任务中表现出色,特别是在区分良性流量和攻击流量方面,F1分数达到0.94。
4. 与传统方法的对比:与传统方法相比,该模型在处理复杂攻击场景时表现出更高的准确性和鲁棒性。

结论与价值
本研究的主要贡献包括:
1. 新数据集的生成:提出了一个基于云的DDoS数据集,解决了现有数据集的多个缺陷,为DDoS检测研究提供了高质量的数据支持。
2. 良性用户行为生成器:设计了BUP工具,能够生成真实的良性用户流量,提高了数据集的真实性。
3. 多层次检测模型:提出了一个多层次的流量特征模型,显著提高了DDoS检测的准确性和效率。
4. 特征选择与实验验证:通过实验验证了所选特征的有效性,并展示了模型在实际应用中的潜力。

研究亮点
1. 数据集的创新性:该数据集是首个基于云的DDoS数据集,涵盖了多种攻击类型和良性用户活动。
2. 多层次检测模型:该模型通过分类和识别层的结合,显著提高了检测的准确性和效率。
3. 特征选择的科学性:通过多种算法选择最优特征,确保了模型的高效性和鲁棒性。
4. 实验的全面性:通过7个实验任务全面评估了模型性能,展示了其在复杂场景下的优越性。

其他有价值的内容
1. 攻击场景的多样性:研究涵盖了17种不同的DDoS攻击,确保了数据集的全面性。
2. 良性用户行为的真实性:通过BUP工具生成的良性流量高度模拟了真实用户行为,提高了数据集的实用性。
3. 特征选择的详细分析:研究对所选特征进行了详细分析,解释了其在DDoS检测中的重要性。


这篇报告全面介绍了该研究的背景、流程、结果和意义,为其他研究者提供了详细的研究参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com