《IEEE Transactions on Circuits and Systems for Video Technology》2025年10月刊载了题为《SonarPoint: Weak-Heterogeneity Awareness Object Detection Network for 3D Sonar Point Cloud》的研究论文(DOI: 10.1109/TCSVT.2025.3569293),由浙江工业大学计算机科学与技术学院的赵东东(Dongdong Zhao)、蔡天成(Tiancheng Cai)、陈鹏(Peng Chen,通讯作者)等团队联合浙江大学等机构完成。该研究针对水下三维声呐点云的弱异构性目标检测难题,提出了一种创新性深度学习框架。以下为学术报告:
水下目标检测主要依赖光学成像与声呐技术,其中基于稀疏阵列的三维声呐因穿透性强、探测距离远,在深海探测和浑浊水域中具有不可替代性。然而,三维声呐点云存在三大挑战:
1. 数据质量缺陷:高噪声、低分辨率及遮挡导致点云弱异构性(Weak-Heterogeneity),即目标与环境间特征差异不显著;
2. 算法适应性不足:现有激光雷达(LiDAR)点云检测方法直接迁移至声呐数据时,因介质折射率、场景分布(水下全三维vs地面2.5D)差异而失效;
3. 数据集缺失:缺乏开源三维声呐数据集,传统方法依赖高质量数据,难以应对实际复杂场景。
研究目标为开发一种能感知弱异构性的三维声呐目标检测网络,解决动态目标形态多变、噪声干扰及特征模糊等问题。
创新点:区别于传统前景-背景分割,通过模糊数学(Fuzzy Mathematics)实现目标与环境的并行特征提取。
- 动态平衡策略:基于Cauchy分布设计隶属度函数(式3),将原始点云γ解耦为目标部分γ0与环境部分γ1,通过强度方差阈值(式4-6)防止边界模糊;
- 归一化处理:对声呐回波强度r进行归一化(式1),消除设备差异带来的类别偏差;
- 体素多特征编码:通过VFE层(Voxel Feature Encoding)提取点级特征(图6),融合局部与全局信息。
解决痛点:传统CNN难以建模长程依赖,Transformer因计算复杂度高不适用于小样本声呐数据。
- 状态空间模型(SSM)改进:引入多跳连接(式7),增强对历史状态的记忆能力,提升噪声环境下的特征连贯性;
- S6块设计(算法1):通过线性变换与指数映射动态调整参数,实现选择性信息过滤。
二阶段精修:
- 一阶段:基于高斯热图(Gaussian Heatmap)的Anchor-free方法(CenterPoint改进版)生成初始检测框;
- 二阶段:利用马尔可夫链(Markov Chain)预测点云状态转移概率(式17-19),通过非线性插值补充遮挡目标的边界信息,优于传统线性插值。
当前数据依赖单一设备采集,未来需扩展多模态声呐(如合成孔径声呐)与视频时序分析,进一步模拟人类观察模式。