分享自:

基于视觉的目标轮廓重建与平面轨迹测量的鲁棒方法

期刊:ieee transactions on instrumentation and measurementDOI:10.1109/tim.2025.3565061

本文档属于类型a,即报告了一项原创性研究的学术论文。以下是针对该研究的详细学术报告:


一、作者与发表信息

本研究由Sicheng HongYuyong Xiong(IEEE会员)、Yingjie GouQingbo He(IEEE高级会员)和Zhike Peng合作完成,作者团队来自上海交通大学机械与动力工程学院机械系统与振动国家重点实验室。论文《Robust Vision-Based Target Outline Reconstruction and In-Plane Trajectory Measurement》发表于IEEE Transactions on Instrumentation and Measurement期刊,2025年第74卷,文章编号3535812,DOI为10.1109/TIM.2025.3565061。研究得到中国国家自然科学基金(项目号12127801、52275117、12121002)的支持。


二、学术背景

研究领域与动机

该研究属于计算机视觉与结构健康监测(Structural Health Monitoring, SHM)交叉领域,聚焦于非接触式平面位移与姿态轨迹测量。现有技术(如光流法(Optical Flow)、数字图像相关法(Digital Image Correlation, DIC))在光照变化和噪声干扰场景下存在局限性,例如:
1. 光流法依赖像素灰度值恒定假设,易受光照不均影响(图1b);
2. DIC需目标表面具有散斑图案,对旋转目标或弱纹理区域适应性差;
3. 模板匹配法在目标姿态变化较大时易失效(图1a)。

研究目标

提出一种基于目标轮廓重建(Target Outline Reconstruction, TOR)的新方法,通过结合二值分割与新型直线拟合算法,实现高鲁棒性的平面位移与姿态(俯仰角、旋转角)测量,适用于复杂光照和噪声环境。


三、研究方法与流程

1. 目标轮廓重建(TOR)流程

步骤1:目标粗定位
- 采用归一化互相关(Normalized Cross Correlation, NCC)进行模板匹配,初步确定目标区域(ROI)。若匹配方差超过前5帧平均值的5倍,则判定为误匹配,改用前一帧位移预测当前帧位置。
- 创新点:引入动态阈值判定误匹配,提升初始定位鲁棒性。

步骤2:图像超分辨率与插值
- 使用双三次插值(Bicubic Interpolation)将ROI分辨率提升5倍,公式(2)-(5)计算4×4邻域加权像素值,保留边缘细节。

步骤3:目标-背景分离
- 应用Otsu全局二值化算法(公式6-8)最大化目标与背景的灰度方差,生成二值掩膜。通过四连通区域判别(公式9-11)合并目标主体并填充孔洞。

步骤4:轮廓提取与梯度计算
- 基于四连通邻域(公式14-15)提取目标轮廓点,采用高斯平滑滤波器(公式17)和Sobel算子(公式18)计算x/y方向梯度,构建梯度值坐标系(公式19)。

步骤5:边缘线拟合
- 核心创新:提出均值漂移(Mean Shift)算法(算法1)定位梯度值坐标系中的密集点集,过滤离群点(算法2),通过QR分解Vandermonde矩阵(公式21-22)拟合边缘直线,最终重建目标四边形轮廓(图2h)。

2. 位移与姿态参数测量

  • 位移转换:引入单应性矩阵(Homography Matrix)(公式24-27)将相机坐标系下的像素位移转换为世界坐标系下的物理位移,解决目标偏离视场中心时的尺度误差问题。
  • 姿态提取
    • 俯仰角(θp):通过顶部边缘斜率计算(公式28);
    • 旋转角(θr):基于平行边缘线距离比的反余弦函数(公式29-30),采用最短点距提升稳定性。

3. 实验验证

  • 测试场景:设计二维旋转滑台系统(图4),目标为带Charuco图案的方形铜板,背景含动态光影干扰。
  • 对比方法:与传统模板匹配、SURF特征点法、光流法对比。
  • 评估指标:均方根误差(RMSE)、频率估计误差(%)。

四、主要结果

  1. 大位移测量(图5):

    • X/Z轴单独运动时,RMSE分别为0.0555 mm和0.0762 mm;X-Z复合运动RMSE为0.1264 mm,误差主要源于动态光照导致的轮廓波动。
    • 模板匹配法在稳态下稳定性较差,振幅估计误差较高。
  2. 复杂运动跟踪(图6):

    • Z轴旋转:模板匹配法在目标旋转时失效,TOR法持续跟踪;
    • 俯仰运动:SURF法因特征点缺失出现断层,TOR法完整重建10°俯仰轨迹;
    • 频率识别:振动激励下,频率提取误差仅0.56%-2.52%。
  3. 抗干扰性能(图8):

    • 在高斯噪声和椒盐噪声干扰下,位移曲线仍保持一致性,仅极端噪声场景出现轻微不连续。

五、结论与价值

科学价值

  1. 提出首个融合二值分割梯度值坐标系映射的轮廓重建方法,解决了传统视觉测量在光照变化和噪声下的鲁棒性问题。
  2. 通过单应性矩阵均值漂移算法,实现了亚像素级位移与多自由度姿态的同步高精度测量。

应用价值

  • 工程监测:适用于大型结构(如桥梁、航天器)的动态形变监测;
  • 工业检测:可扩展至制造过程中的多目标位姿跟踪。

六、研究亮点

  1. 方法创新:TOR方法首次将轮廓重建与位移/姿态测量结合,支持复杂环境下的连续跟踪(图3b2 vs. Hough变换的误检)。
  2. 技术突破
    • 梯度值坐标系与均值漂移算法显著提升边缘拟合抗噪性;
    • 双三次插值将测量分辨率提升至10 mm级运动仅需5倍超分。
  3. 实验设计:通过铜板高反光背景模拟极端干扰,验证方法的实用性。

七、其他价值

  • 开源潜力:算法流程(图2)详细公开,便于移植至其他视觉测量场景;
  • 扩展性:作者指出未来可结合深度学习优化轮廓分割步骤,进一步提升效率。

(全文约2200字)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com