基于CNN与LSTM的物联网入侵检测系统研究:增强IoT安全的深度学习方案
一、作者与机构
本研究由阿尔及利亚梅迪亚大学LSEA实验室的Afrah Gueriani、Hamza Kheddar及Ahmed Cherif Mazari合作完成,论文于2024年5月28日发布于预印本平台arXiv(编号2405.18624v1),并计划在IEEE会议发表(DOI: 979-8-3503-5026-5/24/$31.00)。
二、学术背景与目标
科学领域:研究属于物联网(IoT)安全与深度学习交叉领域,聚焦于入侵检测系统(Intrusion Detection System, IDS)的算法优化。
研究动机:IoT设备因固有安全漏洞易受DDoS、欺骗攻击等威胁,传统IDS(如基于签名的检测)难以应对新型攻击。深度学习(Deep Learning, DL)因其特征自动提取能力成为解决方案,但单一模型(如CNN或LSTM)存在局限性:CNN擅长空间特征提取但忽略时序依赖,LSTM长于序列分析但训练成本高。
研究目标:提出一种融合CNN与LSTM的混合模型(CNN-LSTM),通过协同效应提升IoT流量二元分类(正常/恶意)的准确性与效率,并验证模型在跨数据集场景下的泛化能力。
三、研究流程与方法
1. 数据预处理
- 数据集:采用CICIoT2023数据集(含47M条记录,45个特征,33类攻击)和CICIDS2017数据集。因算力限制,从中提取约1.19M条记录用于训练,1.17M条用于测试。
- 处理步骤:
- 特征工程:将原始流量数据转换为45维特征向量矩阵。
- 标准化与维度调整:归一化数值特征并转换为二维张量以适应模型输入。
- 标签编码:将攻击类型与正常流量编码为二元标签(0/1)。
数据划分
模型架构设计
训练与评估
四、主要结果
1. 性能指标
- CICIoT2023测试集:准确率98.42%,损失值0.0275,F1-score 98.57%,FPR 9.17%。
- 跨数据集验证(CICIDS2017):准确率97.46%,FPR 2.08%,表明模型具备强泛化能力。
分类表现
对比实验
五、结论与价值
1. 科学价值:
- 证实CNN-LSTM混合模型能有效平衡特征提取与时序分析,为IoT-IDS提供新方法论。
- 首次系统性验证CICIoT2023数据集在深度学习中的适用性,填补该领域空白。
六、研究亮点
1. 方法创新:
- 提出端到端的CNN-LSTM混合架构,避免传统IDS依赖人工规则的问题。
- 引入双重任务学习(分类+恶意性预测),增强模型鲁棒性。
七、未来方向
作者建议:1)扩展至多分类攻击识别;2)引入Transformer注意力机制优化长序列分析;3)在树莓派等边缘设备验证实时性。本研究为IoT安全领域提供了兼具理论严谨性与工程可行性的解决方案。