《行人重识别研究综述》是由南京邮电大学通信与信息工程学院的宋婉茹、赵晴晴、陈昌红、干宗良、刘峰合作撰写的综述性论文,发表于《智能系统学报》2017年第6期。该论文系统梳理了行人重识别(Person Re-identification)领域的研究进展,从技术框架、方法分类、数据集到未来趋势进行了全面分析。以下是论文的核心内容:
行人重识别是智能视频分析的关键技术,旨在非重叠视角的多摄像头网络中匹配同一行人目标。其核心挑战包括:低分辨率、视角变化、光照差异、遮挡以及服饰变化等(如图2所示)。该技术对公共安全、刑侦追踪等应用具有重要价值,但实际场景中的复杂因素使其仍面临巨大技术瓶颈。
论文将现有研究分为基于图像和基于视频的两大类,并从特征表达、度量学习和数据集三个维度展开分析:
特征表达方法
度量学习方法
传统欧氏距离难以应对视角差异,因此需学习马氏距离(Mahalanobis Distance)等度量空间。典型算法包括:
论文对比了主流数据集(见表3、表4):
- 图像数据集:VIPER(632人)、CUHK01(971人)、Market-1501(1501人,大规模)。
- 视频数据集:iLIDS-VID(300人)、PRID2011(200人)、MARS(1261人,多摄像头)。
- 评价指标:
- CMC曲线(累积匹配特性):Rank-1准确率反映首位匹配成功率。
- mAP(平均精度均值):综合考量排序质量,适用于大规模数据。
该论文不仅总结了行人重识别领域的技术脉络,还通过算法性能对比(如iLIDS-VID上Rank-1从23.3%提升至68.7%)揭示了技术进步的关键节点。其价值在于为学术界和工业界提供了技术路线图,并强调了跨学科融合(如计算机视觉与强化学习)对解决实际问题的必要性。