本文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
基于改进YOLOv8n-pose的疲劳驾驶检测研究
一、作者与发表信息
本研究由蔡忠祺(第一作者)、林珊玲、林坚普、吕珊红、林志贤(通信作者)和郭太良合作完成,作者单位包括福州大学先进制造学院(福建泉州)和中国福建光电信息科学与技术实验室(福建福州)。研究成果发表于《液晶与显示》(Chinese Journal of Liquid Crystals and Displays)2025年第40卷第4期,文章编号为1007-2780(2025)04-0617-13,DOI为10.37188/CJLCD.2024-0192。
二、学术背景
1. 研究领域:本研究属于计算机视觉与智能交通交叉领域,聚焦于深度学习驱动的疲劳驾驶实时检测技术。
2. 研究动机:全球约18%的交通事故由疲劳驾驶引发,而现有检测方法存在检测复杂度高(如接触式脑电检测)、环境适应性差(如基于车辆轨迹的方法)或模型冗余(如多模型串联方案)等问题。
3. 技术背景:YOLOv8n-pose作为轻量级关键点检测模型,在通用数据集MSCOCO上表现优异,但直接应用于人脸关键点检测时面临精度不足和计算资源消耗大的挑战。
4. 研究目标:开发一种轻量化、高精度的端到端疲劳驾驶检测算法,满足车载边缘设备的部署需求。
三、研究方法与流程
1. 模型架构改进
- 主干网络优化:
- 引入Ghost卷积(Ghost Convolution)替代传统卷积,通过线性变换生成冗余特征图,参数量减少50%(式2-3)。
- 将C2F模块替换为C3Ghost模块,结合Ghost-Bottleneck结构压缩通道数,降低计算量(图3)。
- 特征融合网络改进:
- 采用GS卷积(GSConv)和VOV-GSCSP模块(图5),通过通道打乱重组增强特征交互,参数量仅为传统卷积的1/2(式4)。
- 检测头设计:
- 提出GNSC-Head结构,采用共享卷积和组归一化(Group Normalization, GN)替代批归一化(Batch Normalization, BN),提升小批量数据下的稳定性(图6)。
- 注意力机制:
- 在颈部网络嵌入遮挡感知注意力模块(SEAM),通过通道-空间混合模块(CSMM)强化人脸区域特征(图7)。
疲劳判定逻辑设计
实验设计
四、主要结果
1. 模型性能提升
- 消融实验(表2)显示:
- Ghost卷积使参数量减少20%,mAP提升0.2%。
- Slim-Neck结构进一步降低参数量,mAP提高0.4%。
- GNSC-Head节省35%参数,SEAM模块使mAP最终达0.965(+0.9%)。
- 对比实验(表3):改进模型在mAP(0.965)、参数量(1.6M)、计算量(4.5GFLOPs)和实时性(683FPS)上均优于YOLOv7n-pose等基线模型。
五、结论与价值
1. 科学价值:
- 提出Ghost卷积与GS卷积的级联轻量化策略,为实时关键点检测提供新方法。
- 验证了GN层在检测头中的优越性,解决了BN层对ROI区域分布敏感的难题。
2. 应用价值:
- 模型参数量减少50%,计算量降低52%,满足车载边缘设备部署需求。
- 端到端设计避免了多模型串联的延迟问题,FPS提升8%。
六、研究亮点
1. 方法创新:
- 首创将SEAM注意力机制用于驾驶场景的遮挡补偿,提升墨镜/口罩下的检测鲁棒性。
- 提出基于共享卷积的GNSC-Head,在保持解耦头优势的同时降低参数冗余。
2. 工程贡献:
- 首次实现93.5%疲劳识别率的单模型轻量化方案,较传统多模型方案(如YOLOv4-tiny+PFLD)显著简化部署流程。
七、其他价值
研究获得国家重点研发计划(2021YFB3600603)支持,算法已具备车载应用潜力,未来可结合头部姿态估计进一步提升精度。