分享自:

基于机器学习的网络流量APT攻击检测方法

期刊:Journal of Web EngineeringDOI:10.13052/jwe1540-9589.2019

该文档属于类型a,即报告了一项原创研究。以下是基于文档内容的学术报告:


作者及研究机构
该研究的主要作者是Cho Do Xuan,来自越南河内FPT大学的信息保障系。该研究于2021年2月17日发表在《Journal of Web Engineering》上。

学术背景
该研究的主要科学领域是网络安全,特别是针对高级持续性威胁(Advanced Persistent Threat, APT)攻击的检测。APT攻击是一种高度复杂且目标明确的网络攻击,通常采用多种先进技术手段,旨在获取目标组织的机密和敏感信息。由于APT攻击的隐蔽性和持久性,传统的检测方法往往难以有效应对。因此,研究团队提出了一种基于网络流量异常行为的机器学习方法,旨在提高APT攻击的检测效率和准确性。

研究目标
该研究的目标是通过分析网络流量中的域名(domain)和IP地址的异常行为,结合随机森林(Random Forest, RF)分类算法,开发一种同步APT攻击检测方法。该方法旨在帮助信息安全系统快速、准确地识别APT攻击的迹象。

研究流程
研究流程主要包括以下几个步骤:

  1. APT攻击特征的提取
    研究首先从网络流量中提取APT攻击的行为特征,重点关注域名和IP地址的异常行为。具体来说,研究团队定义了五个新的域名特征,包括共享同一IP的域名数量、已知C&C服务器同B类IP地址范围、每日相似性、同一时间窗口内的相同查询数量以及极低频率查询。这些特征能够有效区分APT攻击的域名与正常域名。

  2. APT攻击的检测
    在提取特征后,研究团队使用随机森林算法对异常行为进行评估和分类。首先,通过分析域名的异常行为,识别出可疑的APT域名;然后,将这些域名的检测结果作为IP检测的特征,进一步提高APT IP地址的检测效率。这种基于域名和IP相关性的检测方法显著提升了检测效果。

  3. 实验与评估
    研究团队设计了三组实验场景:APT域名的检测、不使用域名特征的APT IP检测以及使用域名特征的APT IP检测。实验数据集包括16万多个域名和多个APT攻击的PCAP文件。通过对比不同方法的准确率、精确率、召回率和F1分数,评估了所提方法的有效性。

主要结果
1. APT域名检测结果
使用随机森林算法进行APT域名检测时,准确率达到97.56%,精确率为98.74%,召回率为96.48%,F1分数为97.60%。这些结果表明,所提方法能够有效区分APT域名与正常域名,且误报率较低。

  1. APT IP检测结果
    在不使用域名特征的情况下,随机森林算法(50棵树)的准确率为93.12%,但精确率较低(73.44%)。而在使用域名特征后,准确率提升至94.62%,精确率提升至80.69%,误报率从5.69%降至3.72%。这表明基于域名和IP相关性的检测方法显著提高了APT IP检测的效率和准确性。

结论
该研究提出了一种基于网络流量异常行为的APT攻击检测方法,通过结合域名和IP地址的异常特征,显著提高了检测效率和准确性。实验结果表明,所提方法在APT域名和IP检测方面均优于现有方法。该方法不仅具有较高的科学价值,还为实际网络安全系统提供了一种有效的APT攻击检测机制。

研究亮点
1. 创新性:研究首次提出基于域名和IP相关性的APT攻击检测方法,充分利用了网络流量中不同组件之间的关联性。
2. 高效性:所提方法在实验数据集上表现出较高的准确率和较低的误报率,验证了其在实际应用中的潜力。
3. 实用性:该方法为网络安全系统提供了一种快速、准确的APT攻击检测方案,具有重要的应用价值。

其他有价值的内容
研究团队还指出,未来可以进一步扩展研究范围,将HTTP、TLS、流量等其他网络组件纳入分析框架,构建更全面的APT攻击检测系统。这将有助于进一步提升检测系统的综合能力和适应性。


以上是基于文档内容的详细学术报告。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com