分享自:

高斯混合模型与 ghostnet 结合的 yolo-g 遗留物检测方法

期刊:journal of computer-aided design & computer graphicsDOI:10.3724/sp.j.1089.2023.19276

学术研究报告:高斯混合模型与GhostNet结合的YOLO-G遗留物检测方法

一、研究团队与发表信息
本研究由南昌大学软件学院的林德钰周卓彤过斌,以及南昌大学数学与计算机学院的闵卫东(通信作者)、韩清共同完成,发表于《计算机辅助设计与图形学学报》(Journal of Computer-Aided Design & Computer Graphics)2023年1月第35卷第1期。研究得到国家自然科学基金(62076117, 61762061)、江西省自然科学基金青年项目(20224BAB212016)等资助。

二、学术背景与研究目标
遗留物检测是视频监控领域的关键技术,用于识别公共场所中长时间静止的可疑物体(如包裹、箱子等),在安防场景中具有重要应用价值。然而,传统方法存在两大瓶颈:
1. 光影变化干扰:复杂光照条件下背景建模易失效;
2. 深度学习模型效率不足:现有神经网络参数量大、计算成本高(如YOLOv4),且对小目标检测精度有限。

为此,本研究提出YOLO-G模型,通过结合高斯混合模型(Gaussian Mixture Model, GMM)与轻量化网络GhostNet,优化检测效率与精度,目标包括:
- 降低网络参数量(较YOLOv4减少22.78%);
- 提升小目标检测敏感度(通过改进特征金字塔结构);
- 增强光影变化鲁棒性(引入GMM背景建模)。

三、研究方法与流程
研究分为三大核心环节:前景检测网络结构改进实验验证

1. 前景检测(基于GMM)
- 输入:视频监控序列帧。
- 处理流程
- 使用GMM对背景建模,分离移动区域与静止区域;
- 计算移动物体与静止区域的分离距离静止时间,生成可疑静止区域候选框;
- 将判定为分离时刻的帧图像输入后续神经网络。
- 创新点:动态阈值调整策略,减少光影变化导致的误检。

2. 网络结构改进(YOLO-G)
核心改进包括三部分:
- GhostModule替换传统卷积
- 在CSPDarknet53主干网络中,用GhostNet的GhostModule替代部分卷积层。GhostModule通过廉价线性变换生成冗余特征图,减少浮点运算量(FLOPs降低11.36%)。
- 具体实现:首先生成少量核心特征图,再通过线性操作(如1×1卷积)扩展为完整特征图(图3)。
- 引入压缩激励网络(Squeeze-and-Excitation Network, SE Layer)
- 在ResiBlock结构中嵌入SE Layer,通过全局平均池化(Squeeze)和全连接层(Excitation)动态加权通道特征,提升关键特征响应(公式7)。
- 改进特征金字塔(PAN)结构
- 将原3层FPN(Feature Pyramid Network)扩展为4层,新增104×104尺度特征图,增强对小目标的敏感度(图9)。
- 自顶向下采用最近邻上采样,自底向上采用均值下采样,保留多尺度信息。

3. 实验验证
- 数据集:COCO2014+2017(预训练)、ABODA(遗留物专用)、PETS2006(复杂场景)。
- 对比方法:FCOS、SSD、YOLOv3、YOLOv4等。
- 评价指标:平均精度(AP)、参数量、FLOPs。
- 训练细节
- 硬件:NVIDIA Quadro P4000 GPU,Intel Xeon E-2136 CPU;
- 超参数:初始学习率0.001,Batch Size=32,迭代114,000次,采用余弦下降学习率策略。

四、主要结果与分析
1. 模型效率优化
- 参数量较YOLOv4减少22.78%(52.55M vs. 64.52M),FLOPs降低11.36%(27.18 GFLOPs vs. 30.27 GFLOPs)(表2)。
- 训练损失值收敛后低于YOLOv4(图10),测试集AP50达63.7%,优于YOLOv4的62.8%(表1)。

  1. 检测精度提升

    • 在ABODA数据集中,准确检测遗留包裹并标记报警框(图12-13);
    • PETS2006复杂场景下,误检率为0,且能区分行人短暂停留与真实遗留(图14)。
  2. 小目标敏感度

    • 改进的PAN结构使小目标检测AP提升8.16%(对比LRF方法)。

五、研究结论与价值
1. 科学价值
- 提出轻量化网络YOLO-G,为高实时性目标检测提供新架构思路;
- 验证GhostModule与SE Layer结合的可行性,平衡精度与效率。

  1. 应用价值
    • 适用于车站、商场等高人流监控场景,可集成至现有安防系统;
    • 开源代码与模型参数为后续研究提供基准。

六、研究亮点
- 方法创新:首次将GhostNet引入遗留物检测,结合GMM解决光影干扰;
- 结构改进:多尺度PAN与SE Layer协同提升小目标检测能力;
- 实验严谨性:跨数据集验证(COCO、ABODA、PETS2006),覆盖多样场景。

七、其他贡献
- 公开ABODA数据集标注细节,推动领域数据标准化;
- 提出动态分离阈值策略,可扩展至其他移动物体检测任务。

(注:全文术语首次出现均标注英文,如GhostModule(幽灵模块)、SE Layer(压缩激励网络层)等。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com