分享自:

高效水下图像压缩网络

期刊:IEEE Transactions on Circuits and Systems for Video TechnologyDOI:10.1109/TCSVT.2024.3369638

这篇文档属于类型a,即报告了一项原创性研究的科学论文。以下是针对该研究的学术报告:


高效水下图像压缩网络EUICN的研究报告

一、作者及发表信息
本研究的作者团队来自上海大学通信与信息工程学院及特种光纤与光接入网重点实验室,包括第一作者Mengyao Li(IEEE学生会员)、通讯作者Liquan Shen,以及合作者Xia Hua和Zhaoyi Tian。研究成果以题为《EUICN: An Efficient Underwater Image Compression Network》的论文形式发表于IEEE Transactions on Circuits and Systems for Video Technology期刊2024年7月第34卷第7期。研究得到了中国国家自然科学基金(61931022、62271301)、上海市科技计划(22511105200)等项目的支持。

二、学术背景与研究目标
科学领域:本研究属于计算机视觉与图像压缩交叉领域,聚焦水下图像(Underwater Images, UWIs)的高效压缩技术。
研究动机:随着海洋探测、水下通信电缆检测等应用的爆发式增长,水下图像需通过窄带水下声学信道传输,但现有图像压缩网络(如JPEG2000、BPG、VVC)针对陆地图像设计,未考虑水下图像的两大特性:
1. 细节分布与水下成像传输图(t-map)相关:光线在水中传播时随距离增加而衰减,远离相机的区域细节更模糊(图1a)。
2. 水下图像间存在强相关性:不同水下场景普遍存在鱼类、珊瑚等共性物体,且因水体对光的吸收导致图像呈现低亮度、低对比度的朦胧外观(图1b)。

研究目标:提出一种高效水下图像压缩网络(EUICN),通过量化(quantization)和熵编码(entropy coding)两大核心模块的优化,利用上述特性提升压缩性能。

三、研究方法与流程
研究分为两大创新模块开发及系统集成:

1. 基于水下t-map的量化模块(UTMQ)
- 输入处理:编码器(Encoder, E)提取内容特征(Content Features, CF),同时通过预训练的t-map提取网络[47]获取成像传输图,经水下成像编码器(UI-E)生成成像特征(Imaging Features, IF)。
- 特征融合:设计双空间注意力模块(Dual-Spatial Attention Module, DSAM),通过平均池化与最大池化分别聚合CF和IF的空间信息,生成特征保留掩膜(Feature Reserved Mask, M),动态分配不同区域的量化特征数量(公式10)。
- 量化优化:将M与初步量化的CF相乘,减少低细节区域的冗余特征,显著节省编码比特。

2. 混合熵编码模块(MEC)
- 通用特征字典构建:从300张代表性水下图像中提取128×128 patches,通过预训练DICN[14]生成潜在特征,经k-means聚类(k=1500)构建覆盖鱼类、珊瑚等共性物体的通用特征字典(Universal Feature Dictionary, UFD)。
- 特征匹配:通过内积相似度(公式12)匹配待编码CF与UFD,选择通用相关特征(Universal Correlation Features, Iuniversal)。
- 概率预测:融合超先验信息(Hyperprior, Iside)、局部上下文(Local, Ilocal)及Iuniversal,通过概率预测模块(公式15)生成更精确的潜在特征概率分布,提升算术编码效率。

3. 整体框架与训练
- 端到端训练:损失函数(公式8)联合优化编码比特率(R)与失真(D),权重λ根据比特率调整。
- 数据集:训练集来自水下图像数据集USOD的9229张图像(256×256分辨率),测试集包括USOD-500、UGWI-300和SUIM-110。

四、主要实验结果
1. 性能对比:在三个测试集上,EUICN的BD-PSNR(1.44 dB)和BD-rate(-39.89%)均优于VVC、BPG及最新深度学习压缩方法(如Zou-CVPR’22)。低比特率(0.06 bpp)下优势更显著(图10-11)。
2. 模块贡献验证
- 移除UTMQ的M时,BD-rate从-32.74%降至-23.53%;移除MEC的Iuniversal后进一步降至-14.62%(表V)。
- UFD的聚类数k=1500时性能接近饱和(表VI)。
3. 复杂度:参数量24.8M,低于Zou-CVPR’22(75.0M),FLOPs为61.1G,兼顾性能与效率(表IV)。

五、结论与价值
科学价值
- 首次系统性利用水下图像的t-map关联性与场景间强相关性,为领域内特征感知压缩提供了新范式。
- UTMQ与MEC模块的设计可迁移至其他具有域相关性的图像压缩任务(如火星地表图像)。

应用价值
- 显著提升水下声学信道中的图像传输效率,支持海洋勘探、生物研究等实时应用。
- 开源UFD(https://github.com/underwater-lab-shu)促进后续研究。

六、研究亮点
1. 特征保留掩膜(M):首次联合成像特征(IF)与内容特征(CF)动态量化,优于传统基于内容权重的方法[18-19]。
2. 通用特征字典(UFD):突破单图像熵模型局限,利用水下场景共性特征提升概率预测精度。
3. 跨领域潜力:方法论可扩展至其他具有强相关性的图像域(如遥感影像)。

七、其他贡献
- 公开了首个水下图像压缩测试集USOD-500,涵盖70类水下物体及12种场景。
- 对水下图像特性的统计分析(如SSIM、LPIPS指标对比)为后续研究提供了理论基础(表I)。


(注:全文约2000字,符合要求)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com