分享自:

基于尺度改进U-Net的高速运动模糊图像实时恢复

期刊:现代电子技术DOI:10.16652/j.issn.1004-373x.2025.19.008

基于尺度改进U-Net的高速运动模糊图像实时恢复研究学术报告

作者及发表信息
本研究由北京师范大学珠海校区的陈静文(讲师,研究方向为运动生物力学)与康军(教授,同属运动生物力学领域)合作完成,发表于《现代电子技术》(Modern Electronic Technique)2025年第48卷第19期,文章编号1004-373X(2025)19-0047-05,属国家自然科学基金青年科学基金项目(12201051)资助成果。


学术背景与研究目标
在监控、军事侦察及科学研究等领域,高速运动导致的图像模糊严重干扰实际应用。传统方法如文献[5]融合FJBA、CNN去模糊和NFS-IE-CGAN增强策略,虽提升恢复质量,但复杂度高;文献[6]利用循环单元处理非均匀模糊,但模型冗余难以满足实时性需求。U-Net作为经典卷积网络,在高速运动模糊图像处理中存在空间信息丢失和长距离依赖捕捉不足的缺陷。为此,本研究提出基于多尺度改进U-Net的实时恢复方法,旨在通过多尺度特征提取与并行注意力机制,解决模糊程度不一致及细节丢失问题,实现高效、高精度的图像复原。


研究流程与方法
1. 网络结构设计
- 生成器-判别器对抗框架:生成器采用多尺度改进U-Net,输入256×256模糊图像,输出伪恢复图像;判别器通过多层卷积判断生成图像真实性,驱动生成器优化。
- 多尺度改进U-Net
- 编码部分:引入多尺度特征提取模块,包含4分支卷积(输出通道数分别为输入的1/4、1/8、1/2、1/8),通过1×1或3×3卷积融合特征,避免边缘信息丢失。
- 解码部分:加入并行注意力机制(位置注意力与通道注意力),差异化加权特征图,解决模糊区域不一致问题。位置注意力通过矩阵乘法融合全局特征(式1),通道注意力则基于特征图间相关性调整权重(式2)。

  1. 损失函数
    结合Wasserstein距离损失(式4)与感知损失(式5),前者提升训练稳定性,后者通过L2范数保持深层语义一致性。超参数λ平衡二者贡献。

  2. 实验验证

    • 数据集:采用GoPro数据集,包含高速运动模糊图像及清晰图像对。
    • 消融实验:对比基础U-Net、单独模块及完整模型的性能,以PSNR(峰值信噪比)、SSIM(结构相似性)和恢复时间为指标。
    • 实时恢复测试:输入模糊人体运动图像(图4),输出复原结果(图5),视觉对比清晰度提升效果。

主要结果
1. 模块性能分析(表1):
- 基础U-Net的PSNR为28.56,SSIM为0.85;引入多尺度特征提取后,PSNR提升至29.13。
- 单独添加位置或空间注意力机制时,PSNR略有下降(29.02/27.95),但二者结合后显著优化至29.68,SSIM达0.92,恢复时间缩短至3ms,证明并行注意力机制的有效性。

  1. 视觉复原效果:图5显示,复原图像细节(如运动肢体轮廓)显著清晰化,模糊区域纹理得到重建。

  2. 理论贡献

    • 多尺度特征提取模块通过分支卷积保留多级特征,克服了单一卷积的局限性。
    • 并行注意力机制通过位置与通道双维度加权,解决了传统U-Net对非均匀模糊的适应性不足问题。

结论与价值
1. 科学价值:提出了一种融合多尺度特征与注意力机制的U-Net改进架构,为高速运动模糊图像恢复提供了新思路,弥补了传统方法在实时性与精度上的不足。
2. 应用价值:可应用于监控、体育分析等领域,如健身动作质量评估(文献[7])或关节运动意图识别(文献[8])。


研究亮点
1. 方法创新:首次将多尺度特征提取与并行注意力机制集成于U-Net,显著提升模糊图像复原质量。
2. 技术突破:通过轻量化设计(如跳层连接、1×1卷积降维)实现实时处理(3ms/帧),优于文献[6]的复杂模型。
3. 实验严谨性:消融实验系统验证了各模块的协同作用,数据支持充分。

其他价值
本研究为后续动态场景图像处理(如虚拟现实模糊复原)提供了可扩展框架,文献[15]的多尺度空洞U-Net可进一步结合本方法优化性能。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com