ATLAS: 一种基于序列学习的攻击调查方法

分享自：
ATLAS: 一种基于序列学习的攻击调查方法

期刊:30th USENIX Security Symposium
本文档属于类型a，即报告了一项原创性研究。以下是对该研究的学术报告。
主要作者及机构
 本研究由Purdue University的Abdulellah Alsaheel、Yuhong Nan、Le Yu、Gregory Walkup、Z. Berkay Celik、Xiangyu Zhang和Dongyan Xu，以及Rutgers University的Shiqing Ma共同完成。研究论文发表于2021年8月11日至13日举办的30th USENIX Security Symposium，并由USENIX协会赞助开放访问。
学术背景
 本研究的主要科学领域为网络安全，特别是针对高级持续性威胁（Advanced Persistent Threats, APT）的攻击调查。APT攻击通常涉及多个攻击步骤，且持续时间较长，调查此类攻击需要分析大量的日志数据。然而，入侵检测系统（Intrusion Detection Systems, IDS）每天会产生大量的威胁警报，导致安全分析师面临“警报疲劳”，可能忽略真正的攻击事件。因此，本研究的目的是开发一种自动化框架，帮助安全分析师从日志中构建端到端的攻击故事，识别关键攻击步骤。该框架名为ATLAS，结合了因果分析、自然语言处理（Natural Language Processing, NLP）和机器学习（Machine Learning, ML）技术，旨在通过序列模型识别攻击行为的关键模式。
详细工作流程
 ATLAS框架的工作流程分为三个阶段：
 1. 因果图构建与优化
 ATLAS首先从系统日志中构建因果依赖图（Causal Dependency Graph），并通过三种优化技术减少图的复杂性：
 - 移除与攻击节点无关的节点和边；
 - 去除重复的动作边，仅保留第一次出现的时间戳；
 - 合并相同类型的事件节点。
 这一优化过程使得因果图的实体数量平均减少了81.81%，从而提高了后续序列提取的效率。
序列构建与学习
 ATLAS从优化后的因果图中提取攻击序列和非攻击序列，并通过以下步骤进行处理：
序列提取：基于攻击实体和非攻击实体构建子集，提取时间戳排序的事件序列。
 
词形还原（Lemmatization）：将序列中的实体和动作映射到预定义的词汇表中，生成语义增强的序列表示。
 
选择性采样：通过欠采样（Undersampling）减少非攻击序列的数量，并通过过采样（Oversampling）增加攻击序列的多样性，以平衡训练数据集。
 
序列嵌入：使用词嵌入（Word Embedding）技术将序列转换为数值向量，捕捉序列中实体之间的关系。
 
模型学习：采用长短期记忆网络（Long Short-Term Memory, LSTM）训练序列模型，识别攻击序列和非攻击序列的模式。
攻击调查
 在推理阶段，ATLAS基于已知的攻击症状实体（如恶意IP地址）构建候选序列，并使用训练好的模型识别序列中的攻击节点。最终，ATLAS将这些攻击节点统一起来，构建完整的攻击故事。此外，ATLAS还支持多主机攻击的调查，通过合并多个主机的日志构建统一的因果图。
主要结果
 ATLAS在十种真实世界的APT攻击上进行了评估，结果显示其平均精确率（Precision）为91.06%，召回率（Recall）为97.29%，F1得分为93.76%。具体而言，ATLAS能够高效地识别攻击实体和事件，显著减少了安全分析师的手动工作量。例如，在处理一个包含20,088个实体和249,000个事件的24小时日志时，ATLAS仅报告了3个假阳性实体和19个假阳性事件，假阳性率分别为0.01%和0.01%。此外，ATLAS在多主机攻击场景中也表现出色，能够通过单个主机的日志推断出跨主机的攻击步骤。
结论与价值
 ATLAS的提出为APT攻击的调查提供了一种新的自动化方法。其科学价值在于通过结合因果分析、NLP和ML技术，实现了对攻击序列的高效建模和识别。在实际应用中，ATLAS能够帮助安全分析师快速构建攻击故事，减少误报和漏报，从而提高网络安全防护的效率。此外，ATLAS的框架设计具有较高的扩展性，可以轻松集成不同类型的日志数据。
研究亮点
 1. 创新性框架：ATLAS是首个将因果分析、NLP和ML技术结合用于APT攻击调查的框架。
 2. 高效的序列建模：通过词形还原和词嵌入技术，ATLAS能够捕捉攻击序列的语义模式，显著提高了模型的准确性。
 3. 多主机支持：ATLAS能够处理跨主机的攻击场景，无需关联不同主机的因果图。
 4. 低假阳性率：ATLAS在真实环境中的评估结果显示其假阳性率极低，证明了其在实际应用中的可靠性。
其他有价值内容
 ATLAS的开源代码和评估数据已在GitHub上公开，供其他研究人员使用和验证。此外，研究团队还提供了详细的实验设置和日志统计信息，便于复现和进一步研究。这些资源的开放为网络安全领域的研究和实践提供了重要的支持。
ATLAS框架通过其创新的技术方法和高效的性能，为APT攻击的调查提供了一种强大的工具，具有重要的科学价值和实际应用潜力。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问