UIR-Net：一种用于水下图像恢复与增强的简单有效基准网络

分享自：
UIR-Net：一种用于水下图像恢复与增强的简单有效基准网络

期刊:Remote SensingDOI:10.3390/rs15010039
根据您提供的文本内容，这是一篇发表于学术期刊《Remote Sensing》上的研究论文，报告了一项名为UIR-Net的原创性研究工作。因此，我将按照类型a的要求，撰写一份详细的学术报告。
关于UIR-Net：一种用于水下图像复原与增强的简单有效基准网络的学术报告
本报告旨在向国内研究者介绍由Xinkui Mei、Xiufen Ye等人于2022年12月22日在《Remote Sensing》期刊上发表的一项研究成果。该研究题为“UIR-Net: A Simple and Effective Baseline for Underwater Image Restoration and Enhancement”，提出了一种新颖的、轻量化的水下图像处理网络。
一、 研究作者与发表信息 本研究的主要作者包括：Xinkui Mei（第一作者）、Xiufen Ye（通讯作者，邮箱：yexiufen@hrbeu.edu.cn）、Xiaofeng Zhang、Yusong Liu、Junting Wang、Jun Hou以及Xuli Wang。作者单位主要来自哈尔滨工程大学智能科学与工程学院，合作单位包括上海交通大学电子信息与电气工程学院以及英国布里斯托大学工程数学系。该研究于2022年12月22日正式发表在《Remote Sensing》期刊第15卷第1期（文章编号39），是一篇遵循知识共享CC BY许可协议的开放获取文章。
二、 研究的学术背景与目标 本研究属于计算机视觉与水下光学成像的交叉领域，具体聚焦于水下图像复原（Underwater Image Restoration）与增强（Underwater Image Enhancement）。由于水体对光线的吸收和散射作用，以及水中悬浮颗粒物（如浮游生物、泥沙、气泡等）和海洋“雪花”（Marine Snow）杂质的影响，直接获取高质量的水下图像十分困难。图像质量下降（如颜色失真、对比度低、细节模糊、存在斑点噪声）严重影响了后续的海洋探测、目标识别、生物研究等下游任务的性能。因此，对退化图像进行复原（去除杂质）和增强（颜色校正）是至关重要的预处理步骤。
现有的方法主要分为基于物理模型的方法和基于深度学习的方法。然而，这些方法面临几个关键挑战：首先，许多基于生成对抗网络（GAN）的方法忽略了水下图像的光学特性，容易引入颜色偏差和伪影；其次，基于卷积神经网络（CNN）的方法往往参数量巨大、训练时间长，难以部署在计算资源有限的水下平台上；第三，大多数方法将图像复原和增强视为两个独立的任务，缺乏一个统一的解决方案。
针对上述问题，本研究旨在提出一种名为UIR-Net的端到端、轻量化的自监督网络，其核心目标是同时实现水下图像的复原（去除颗粒杂质和光斑）与增强（颜色校正），并确保网络结构简单、参数量少，便于实际应用部署。
三、 研究的详细工作流程 本研究的工作流程主要包括方法设计、数据集构建、网络训练与评估三个核心部分。
1. 方法设计：UIR-Net网络架构 UIR-Net的设计灵感来源于DGUNet，其核心思想是将复原和增强任务视为一个“域到域”（domain-to-domain）的转换问题。网络整体采用编码器-解码器（Encoder-Decoder）结构，通过将高维特征映射到低维特征来实现高质量图像输出，同时保持图像的空间和颜色特征。网络主要由两大创新模块构成：
通道残差先验模块： 为了解决GAN方法在颜色校正上的不足，并借鉴何恺明等人提出的暗通道先验（Dark Channel Prior）思想，本研究提出了通道残差先验（Channel Residual Prior, CRP）。该模块通过计算输入图像RGB三通道中最大值与最小值之差（max-min）来生成一个先验图。这个先验图能够有效捕捉图像中缺乏斑点、气泡的背景结构信息，为后续的恢复过程提供引导。其数学表达式为：P_prior(x) = max_{c∈{R,G,B}} G_c(x) - min_{d∈{R,G,B}} G_d(x)，其中G(x)是归一化后的图像。CRP有助于在重建清晰图像时保持内容的结构和风格。
梯度策略模块： 为了降低网络参数量和训练时间，实现轻量化，本研究引入了一种基于梯度策略的更新方案。具体而言，它将传统的近端梯度下降算法与深度学习网络相结合。通过用深度网络替代已知的退化矩阵，并将梯度下降的步长设置为可学习参数，网络能够处理真实场景中未知的、复杂的退化过程。该模块的迭代过程被重新定义为包含可学习步长的梯度下降和结合了阶段间信息的近端映射操作，从而在保持算法可解释性的同时，增强了其处理复杂水下退化的能力。
此外，网络训练中采用了感知损失和边缘损失。感知损失通过预训练的VGG-19网络提取特征图并计算L1距离，约束生成图像在细节和语义信息上与参考图像的一致性；边缘损失则通过拉普拉斯算子提取图像边缘并计算差异，以保持图像的结构清晰度。最终损失函数是这两种损失的加权和。
2. 数据集构建 为了解决水下清晰-退化图像对数据集匮乏的问题，本研究构建并使用了三个数据集： * MSRB数据集： 已有的海洋雪花去除基准数据集，包含针对小尺寸杂质（Task 1）和多种尺寸杂质（Task 2）的两个子集。每个子集包含2300对训练图像和400对测试图像，分辨率为384x384。图像对包括原始水下图像和添加了合成海洋雪花杂质的图像。 * MSIRB数据集： 本研究新提出的海洋光斑杂质去除基准数据集。该数据集包含了合成的海洋光斑图像、对应的真实图像以及光斑掩膜。它旨在呈现真实世界海洋光斑颗粒多样的形态特征和复杂的场景构成，专门用于训练和测试去除光斑杂质的算法。 * UIEBD-Snow数据集： 为了验证方法在图像增强任务上的泛化能力，本研究在现有的水下图像增强基准数据集的基础上，融合了真实的海洋雪花颗粒形态特征，生成了一个新的数据集。该数据集包含890张带有相应参考图的水下图像，同时包含了颜色校正和杂质去除的挑战。
3. 网络训练与实验评估 * 训练设置： UIR-Net采用端到端训练。使用Adam优化器，初始学习率为2e-4，并采用热身策略。输入图像被随机裁剪为256x256的 patches，批量大小为16，共训练40万次迭代。实验在NVIDIA 3090 GPU上进行，训练时间约为4小时。 * 评估指标： 研究采用了全面的评估体系。包括全参考指标：峰值信噪比（PSNR）、结构相似性指数（SSIM）、均方根误差（RMSE）；以及无参考指标：水下彩色图像质量评估（UCIQE）和水下图像质量度量（UIQM）。UCIQE用于评估颜色偏移、模糊和低对比度，UIQM用于评估与人眼视觉感知的一致性。 * 对比方法： 研究将UIR-Net与多种先进的自然图像复原方法（如AIRNet、DB-ResNet、PReNet、DGUNet、MAXIM、Restormer、MPRNet）和水下图像增强方法（如PUIE、CWR、IFM、FUnIE-GAN）在三个数据集上进行了定量和定性比较。 * 消融实验： 为了验证所提模块的有效性，研究进行了消融实验，分别测试了仅使用梯度策略、仅使用通道残差先验以及两者结合的效果。同时，也对损失函数中的权重参数λ_perceptual进行了分析。
四、 研究的主要结果 1. 在水下图像复原任务上的表现（MSRB和MSIRB数据集）： 定量结果显示，在MSRB数据集上，UIR-Net在SSIM、RMSE和UCIQE指标上达到了最佳值，PSNR和UIQM位列第二。在MSIRB数据集上，UIR-Net在PSNR、SSIM和RMSE三个核心指标上均取得了最佳成绩，UIQM和UCIQE也接近最佳。定性分析（视觉对比）表明，AIRNet、PReNet等方法只能去除部分小斑点，且可能引入暗斑或导致图像整体变暗。DB-ResNet、MAXIM和Restormer能去除部分杂质并保留物体边界，但对大颗粒杂质处理效果不佳。UIR-Net与MPRNet、DGUNet类似，能够很好地去除大型海洋颗粒和光斑，并且在保持空间纹理和语义信息方面表现优异。
2. 在水下图像增强任务上的表现（UIEBD-Snow数据集）： 在同时需要颜色校正和杂质去除的UIEBD-Snow数据集上，UIR-Net在PSNR、SSIM和RMSE指标上全面优于其他对比方法（包括专门的增强方法和通用的复原方法）。视觉上，基于对比学习的CWR方法在存在光斑时表现不佳；PUIE在单独增强时有效，但对光斑处理效果有限；IFM在对比度提升上不足；FUnIE-GAN虽然颜色校正效果鲜艳且符合UIQM评判，但无法进行图像复原。MPRNet和DGUNet能实现一定程度的增强，但在复原（即修复光斑遮挡区域）方面效果不彰。UIR-Net则在两者之间取得了更好的平衡，结果看起来更干净、自然，且保留了细致的纹理。
3. 复杂度与效率对比： 研究对比了UIR-Net与表现较好的MPRNet和DGUNet在浮点运算次数和参数量上的差异。结果显示，UIR-Net的FLOPs（计算复杂度）约为MPRNet的十分之一，参数量相当。在相同的训练设置下，UIR-Net的训练时间（22，000秒）远少于MPRNet（41，400秒）和DGUNet（94，600秒），推理速度也更优，这证明了其轻量化和高效性，对实际应用部署极具价值。
4. 消融实验结果： 消融实验证实了所提模块的必要性。仅使用梯度策略或仅使用通道残差先验都能在基线模型上带来提升，但两者结合时才能达到最佳性能（PSNR: 34.464， SSIM: 0.984， RMSE: 2.649 on MSRB）。通道残差先验的加入显著提升了纹理特征。对感知损失权重的分析表明，当λ_perceptual设置为0.01时，所有评估指标达到最优，图像信息保留最完整。
五、 研究的结论与价值 本研究成功提出并验证了UIR-Net，这是一个首个将水下图像复原与增强任务相结合的端到端、轻量化基线网络。通过引入通道残差先验模块和可学习的梯度策略，UIR-Net能够有效处理包含大型颗粒杂质和海洋光斑的退化图像，同时进行颜色校正，并保持内容的风格和空间纹理。
其科学价值在于：1) 为水下图像处理提供了一个统一的任务框架，打破了复原与增强之间的界限；2) 提出的通道残差先验和梯度策略为轻量化网络设计提供了新的思路；3) 构建的MSIRB和UIEBD-Snow数据集为后续相关研究提供了宝贵的资源。
其应用价值尤为突出：与当前最先进的方法相比，UIR-Net能够以显著更少的参数量和更快的训练/推理速度，达到相当甚至更高的图像处理质量。这使得它非常适合于部署在计算资源有限的水下机器人、自主水下航行器等实际平台中，具有重要的工程应用前景。
六、 研究的亮点 1. 任务创新性： UIR-Net是首个明确提出并实现水下图像复原与增强联合任务的网络，是一项具有开创意义的研究。 2. 方法有效性： 结合了通道残差先验和梯度策略，在保证性能的同时，极大地降低了模型的复杂度和计算开销，实现了“简单而有效”的设计理念。 3. 性能优越性： 在多个公开及自建数据集上，其综合性能（包括复原、增强质量和计算效率）超越了众多先进的专用方法。 4. 实用性强： 轻量化的特性使其更易于在实际的水下探测系统中集成和部署，解决了深度学习模型在资源受限环境下的应用难题。 5. 数据集贡献： 发布了新的MSIRB和UIEBD-Snow数据集，促进了水下图像处理领域，特别是针对杂质去除任务的研究。
七、 其他有价值的内容 论文还对相关工作进行了系统的综述，详细梳理了水下图像复原和水下图像增强两大方向的主流方法，包括基于物理模型的方法、基于先验的方法以及基于深度学习（特别是GAN和CNN）的方法，并指出了它们各自的优缺点，为读者提供了清晰的领域背景。此外，论文开源了UIR-Net的源代码，便于其他研究者复现和进一步研究。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问