MIS-YOLOv8: 基于YOLOv8的无人机航拍小目标检测改进算法
1. 作者及发表信息
本文由Sun Tao(IEEE会员)、Yang Shengqi(IEEE学生会员)、Liu Haiying(IEEE高级会员)、Gu Jason(IEEE高级会员)、Deng Lixia(IEEE会员)和Liu Lida共同撰写,主要作者来自齐鲁工业大学(山东省科学院)信息与自动化工程学院,部分合作者来自加拿大达尔豪西大学电气与计算机工程学院以及山东润易智能科技有限公司。该研究发表于《IEEE Transactions on Instrumentation and Measurement》2025年第74卷。
2. 研究背景
科学领域:计算机视觉、目标检测、无人机(UAV)影像分析。
研究动机:
- 无人机航拍图像中的小目标检测(Small Object Detection,SOD)是当前目标检测领域的挑战之一,传统算法(如YOLOv8)在检测小目标时存在识别精度低和信息丢失问题。
- 无人机视角下,目标(如行人、车辆等)通常占图像极小像素,且受背景干扰、天气条件等因素影响较大,导致检测困难。
- 现有YOLO系列算法(如YOLOv9、YOLOv10)在计算效率或检测精度上尚未达到最优平衡。
研究目标:
提出MIS-YOLOv8(改进的YOLOv8算法),通过多级特征提取(MFE)、改进小目标检测头(IDDH)和空间深度可切换空洞卷积(SDA),提升无人机航拍图像中的小目标检测性能。
3. 研究方法与流程
3.1 算法改进框架
MIS-YOLOv8基于YOLOv8s进行优化,主要改进包括: 1. 多级特征提取模块(MFE)
- 替换原YOLOv8s中的C2F模块,设计了一个额外分支(1×1和3×3卷积组合),增强不同尺度的特征提取能力。
- 实验表明,MFE提高了特征表达的鲁棒性,使模型在小目标检测中的mAP@0.5提升0.7%。
改进的小目标检测头(IDDH)
- 调整检测头结构,移除20×20大目标检测头,新增160×160高分辨率检测头,以提升小目标定位能力。
- 引入自适应空间特征融合(ASFF)模块,通过动态学习不同尺度特征的权重,优化特征金字塔融合策略。
空间深度可切换空洞卷积(SDA)
- 结合空间到深度转换卷积(SPD)和可切换空洞卷积(SAC):
- SPD:替代传统池化层,减少信息丢失,增强小目标的细节提取能力。
- SAC:通过可切换的空洞率提升计算效率,降低模型参数量。
- 该设计在保持精度的同时,降低了计算复杂度。
3.2 实验验证
- 数据集:VisDrone2019(10,209张无人机航拍图像)、TinyPerson(1,610张图像)、CityPerson(2,766张图像)。
- 训练环境:Windows 11系统,NVIDIA GTX4060Ti显卡,PyTorch 2.3.1框架。
| 实验对比 | YOLOv8s | MIS-YOLOv8 |
|————-|————|—————|
| mAP@0.5 | 基准值 | +9% |
| mAP@0.5:0.95 | 基准值 | +6.2% |
| TinyPerson数据集 (mAP@0.5) | - | +9.5% |
4. 主要结果
VisDrone2019数据集上的性能提升
- mAP@0.5提升9%,表明MIS-YOLOv8在小目标检测上优于原YOLOv8。
- 行人、车辆等小目标的检测精度提升超过11%,尤其在高密集目标场景中表现突出(图8对比可视化结果)。
TinyPerson和CityPerson数据集验证
- 在TinyPerson数据集中,MIS-YOLOv8的小目标检测mAP@0.5提升9.5%,其中“海上行人”检测提升7.8%,“陆地行人”提升11.1%。
- 在CityPerson数据集中,mAP@0.5提升6.4%,证明了算法在复杂城市环境中的适应性。
消融实验(表VI)
- MFE模块单独提升mAP@0.5约0.7%。
- IDDH模块进一步增加6.2%。
- SDA模块在不显著增加计算负担的情况下优化检测效果。
5. 研究结论
科学价值
- MFE模块增强了多尺度特征提取能力,适用于不同分辨率的无人机图像。
- IDDH模块通过高分辨率检测头和ASFF机制提高了小目标定位精度。
- SDA模块结合SPD和SAC,在减少计算资源的同时提升检测性能。
实际应用价值
- 适用于无人机巡检(如交通监控、灾害救援、农业监测)中的小目标检测任务。
- 对嵌入式设备和低算力平台的适配性较好,未来可优化部署效率。
6. 研究亮点
创新性方法
- 首个结合SPD和SAC的无人机小目标检测框架,在保持轻量化的同时提升检测性能。
- 自适应特征融合(ASFF)优化多尺度检测任务,减少误检和漏检。
跨数据集的鲁棒性
- 在VisDrone2019、TinyPerson和CityPerson数据集上均表现优异,验证了算法的泛化能力。
计算效率的平衡
- 相比YOLOv9(参数量大)和YOLOv10(精度略低),MIS-YOLOv8在速度和精度上更均衡。
7. 潜在优化方向
- 目前算法在低配置硬件(如嵌入式设备)上的实时性仍可优化。
- 未来可结合更高效的注意力机制进一步提升复杂背景下的检测稳定性。
该研究为无人机航拍小目标检测提供了新的解决方案,相关代码和模型有望在实际场景中得到广泛应用。