学术研究报告:基于空谱双域自适应学习的水下图像增强方法 SS-UIE
第一, 研究者与发表信息
本研究的主要作者是北京理工大学的林涛彭(音译)和李恒边*(音译),通信作者为李恒边。研究论文《adaptive dual-domain learning for underwater image enhancement》已发表于人工智能领域的顶级学术会议AAAI(Association for the Advancement of Artificial Intelligence)在2025年举办的第三十九届会议(The Thirty-Ninth AAAI Conference on Artificial Intelligence)的论文集中。这表明该研究工作是经过同行评审并被国际顶级学术会议收录的创新性研究成果。
第二, 学术背景与研究动机
本研究的科学领域主要隶属于计算机视觉,具体聚焦于水下图像增强(Underwater Image Enhancement, UIE)。水下成像技术在海洋探索、资源勘察、环境监测等领域具有至关重要的作用。然而,由于水体介质对光的强烈吸收和散射效应,获取的水下图像普遍存在退化问题,如色彩偏差、对比度低、细节模糊等。这些问题严重制约了基于水下图像的自动化分析和理解。因此,提升水下图像质量的UIE技术研究具有重要的科学意义和应用价值。
现有的UIE方法主要分为基于物理模型的方法和基于学习的方法。传统物理模型方法依赖于手工设计的先验和参数,泛化能力差,难以适应复杂多变的水下环境。近年来,基于深度学习的方法展现出巨大潜力。早期的基于卷积神经网络(CNN)的方法虽然提升了泛化能力,但其有限的感受野难以捕捉图像的非局部相似性和长程依赖关系,导致增强效果不理想。近期,基于Transformer的方法因其强大的自注意力机制(Self-Attention)能有效建模长程依赖而获得优异性能,但其计算复杂度与图像尺寸呈二次方增长,计算负担沉重。更重要的是,现有的基于学习的UIE方法普遍存在两个关键挑战:1)它们通常平等地对待图像中的所有空间区域和光谱波段,忽略了水下图像在不同空间区域和不同颜色通道(光谱)上存在不一致的退化程度这一物理事实;2)它们对所有区域一视同仁,忽视了包含高频细节(如纹理、边缘)的区域更难重建的问题。
针对上述挑战,本研究旨在探索一种能够同时适应不同空间区域和不同光谱波段退化程度、且具备线性计算复杂度的自适应水下图像增强方法。其核心目标是:设计一个新颖的网络架构,使其能够捕捉全局的、与内容相关的退化模式,并优先关注退化严重或细节丰富的区域,从而以更低的计算和内存成本,实现优于现有方法的水下图像增强效果。
第三, 研究方法与技术流程的详细阐述
本研究提出了一种名为SS-UIE(Spatial-Spectral Dual-Domain Adaptive Learning for UIE)的网络模型。整个研究工作主要包含三个核心环节:网络架构设计、损失函数创新以及系统性的实验验证。具体工作流程如下:
SS-UIE 网络整体架构设计: SS-UIE网络遵循一个编码器-解码器风格的结构,主要由三个模块构成:浅层特征提取模块、深层特征融合模块和图像重建模块。
核心创新模块:空间-光谱块(SS-Block)的设计: SS-Block是整个网络实现自适应增强的关键,其创新性在于并行集成了两个具有线性计算复杂度的全局感受野模块:
创新损失函数:频域损失(FWL): 为了解决网络倾向于优先拟合低频信息而导致高频细节丢失的问题,研究者提出了一种频域损失函数。其核心思想是对预测图像和真实图像在频域上的差异进行动态加权监督。
实验设计与验证流程: 为了全面验证SS-UIE的有效性,研究团队进行了详尽的实验,主要包括:
第四, 研究主要结果与分析
实验结果表明,SS-UIE方法在多个方面均取得了领先的性能,并有效验证了其设计理念。
全参考数据集性能评估结果: 在UIEB和LSUI数据集上的定量比较(见表1)显示,SS-UIE在PSNR和SSIM这两个关键质量指标上均取得了最佳或次佳的成绩,同时在LPIPS和FID等感知质量指标上也表现优异。例如,在LSUI数据集上,SS-UIE的PSNR达到了28.87 dB,SSIM达到了0.952,显著优于其他对比方法。图1的性能-参数量-计算量对比图更直观地表明,SS-UIE在获得最高PSNR(性能)的同时,所需的浮点运算次数(FLOPs,计算成本)和参数量(Params,内存成本)均低于许多主流方法,实现了性能与效率的双重优势。视觉对比结果(见图4)进一步证实,SS-UIE增强后的图像在颜色保真度、对比度恢复和细节(如纹理、边缘)清晰度方面最接近真实参考图像,颜色失真和伪影最少。
非参考数据集泛化能力评估结果: 在U45数据集上的测试(见表1)表明,SS-UIE在UIQM和UCIQE这两个无参考质量指标上均取得了最高分,证明了其在未见过的真实水下场景中具有出色的泛化能力。视觉对比(见图5)显示,其他方法在处理高频局部细节时要么过于平滑、丢失纹理,要么产生不期望的斑点纹理,而SS-UIE则能更准确地恢复出清晰、自然的细节。这直接验证了FWL损失函数在引导模型关注和重建高频细节方面的有效性。
消融实验结果分析:
BL+MCSS的性能优于BL+SS2D,说明提出的多尺度循环选择性扫描策略比原始策略更有效。BL+MCSS+SWSA(串行)的性能优于仅使用MCSS,但不如BL+MCSS+SWSA(并行),且并行设计的计算和内存成本更低。这充分说明并行设计能够促进空间和光谱特征的交互,是实现高效、高性能双域自适应增强的关键。第五, 研究结论与价值
本研究提出并验证了一种新颖的、基于空谱双域自适应学习的水下图像增强方法——SS-UIE。其核心结论是:通过并行结合具有线性复杂度的空间域MCSS模块和光谱域SWSA模块构建SS-Block,网络能够同时、高效地建模水下图像在不同空间区域和不同光谱波段上的不一致退化程度,从而实现基于退化水平的自适应增强。同时,引入的频域损失函数FWL能够动态引导模型关注和恢复难以合成的高频细节,在不增加推理成本的前提下显著提升图像的细节质量。
该研究的科学价值在于:首次将状态空间模型(Mamba)与频域自注意力机制创新性地结合,并应用于UIE任务,为解决水下图像的不一致退化问题提供了一个高效且强大的双域建模框架。其并行设计思路为其他底层视觉任务(如去雾、去噪)的网络结构设计提供了新思路。
其应用价值显著:SS-UIE模型在多个基准测试集上均达到了最先进的性能,且在取得优异增强效果的同时,保持了较低的计算复杂度和内存占用。这意味着该方法更易于在实际的、资源受限的水下机器人、自主水下航行器(AUV)或边缘计算设备上部署,对于推动水下视觉技术的实际应用具有积极意义。
第六, 研究亮点
本研究的亮点主要体现在以下几个方面: 1. 问题导向的创新:研究紧扣现有UIE方法的两个核心痛点(忽略空谱不一致退化、平等对待所有区域),提出了针对性的解决方案。 2. 双域自适应学习框架:创造性地构建了空谱双域自适应学习框架,通过MCSS和SWSA模块分别在线性复杂度下捕获空间和光谱的全局依赖与退化模式。 3. 高效的并行架构:采用MCSS与SWSA的并联而非串联组合,是实现高效双域交互和自适应增强的关键设计,在保证性能的同时降低了计算开销。 4. 动态频域监督:提出了频域损失函数(FWL),通过动态加权方式强制模型优先恢复高频细节,这是一种新颖且有效的监督信号补充,对提升图像细节质量至关重要。 5. 性能与效率的平衡:实验证明,SS-UIE不仅在PSNR、SSIM等客观指标和主观视觉质量上超越了现有SOTA方法,同时在模型参数量(Params)和计算量(FLOPs)上也具有优势,实现了“又好又快”的目标(见图1)。
第七, 其他有价值的内容
此外,论文中对相关工作的综述部分(Related Work)系统梳理了基于物理模型、基于CNN和基于Transformer的UIE方法的发展脉络及其各自的局限性,为读者理解该领域的研究背景和本工作的创新定位提供了清晰的上下文。论文中展示的详细网络结构图(图2)和MCSS模块示意图(图3)使得方法的创新点和技术细节一目了然。全面而严谨的消融实验设计,为每一个提出的模块(MCSS, SWSA, 并联结构, FWL)的有效性提供了有力的数据支撑,增强了研究结论的可信度。