《道路行人行为轨迹预测研究综述》是由杨智勇、郭洁铷、郭子杭、张瑞祥、周瑜共同撰写的一篇综述性学术论文,作者分别来自重庆师范大学计算机与信息科学学院、重庆工程职业技术学院大数据与物联网学院以及财经与旅游学院。该文发表于期刊《计算机科学与探索》并于2024年10月21日进行网络首发。本文系统梳理了道路行人行为轨迹预测相关领域的研究进展,对核心概念、主要预测方法、关键数据特征、常用数据集与评价指标、现有挑战以及未来研究方向进行了全面总结,目标在于为该领域研究者提供可参考的全局视角以及理论与技术框架。
近年来,自动驾驶技术日益成为科技领域的热点话题,而精准、高效的行人轨迹预测被视为保障自动驾驶场景下道路安全的核心问题。行人行为轨迹预测在诸如减少交通事故风险、提高车辆路径规划效率及保障人车共存的智能交通系统中具有重要应用价值。本文总结了涉及该领域的最新进展与研究热点。论文的研究背景主要围绕以下几点展开: 1. 自动驾驶与行人交互的复杂性:行人轨迹预测不仅需要依赖历史行为数据,还需充分分析行人与车辆及交通设施间的复杂动态交互。 2. 解决轨迹预测困难的必要性:行人轨迹在时间和空间上高度随机,受行为意图、环境因素(如道路结构、天气变化等)影响显著。 3. 多模态传感器及深度学习的应用机会:近年来,激光雷达(LiDAR)、摄像头等传感器技术和基于深度神经网络的学习模型为轨迹预测提供了强大的感知能力与数据处理能力。
本文的主要目的在于总结现有研究成果,分析主流预测方法的优缺点,识别领域的关键问题,并提出未来的研究方向。
轨迹预测被定义为通过观测历史序列(如位置、速度、方向等状态信息)来预测未来一段时间内行人轨迹的位置信息。研究者通常使用两种表示方式: - 单点坐标:如(x, y)的二维坐标表示行人在平面上的位置。 - 边界框坐标:通过中心点、边界框的宽度和高度等参数描述行人的动态范围。
行人行为数据主要来源于现代传感器技术,如激光雷达(LiDAR)、摄像头、红外传感器等多模态感知设备。这些传感器不仅能够捕获丰富的环境信息,还能记录行人特征及其运动模式: 1. 摄像头数据:通过目标检测与跟踪技术捕获行人位置、速度等信息,支持基于视觉的行为分析。 2. 激光雷达数据:生成三维点云数据,弥补摄像头在光线变化下的感知不足,并在动态交互建模中表现优越。
特征提取是轨迹预测中的核心步骤,它直接决定了预测模型的性能。主要包括以下几个方面: 1. 行人基本特征:包含位置信息、速度、加速度及身体姿态等。不同特征对预测的贡献差异显著。 2. 上下文特征:行人所处的环境信息(如场景结构和障碍物位置)和其他行人的运动状态。上下文数据的引入提高了预测准确性。 3. 其他影响因素:包括行人个性、意图、周围交通环境的干扰(天气、时间等)。
为了在复杂环境中更有效地提取这些特征,近年来多模态融合技术及数据增强方法被引入,用以改善少见场景下的模型表现。
行人轨迹预测方法大致分为三类: 1. 基于物理模型的方法: - 社会力模型(Social Force Model,SFM):描述行人在目标吸引力和避障排斥力作用下的运动趋势,适合模拟简单的行为建模。 - 势场理论(Potential Field Theory):以引力和斥力场构建更灵活的力学模型,用于复杂动态交互场景。通过将多智能体交互建模为力场作用,提升了模型在复杂场景下的准确性。
基于数据驱动模型的方法: 数据驱动方法尤其是基于深度学习的模型,能够在大规模数据集中学习到行人的行为模式,展现了对高度非线性行为的强大适应力。这些方法包括:
基于强化学习的方法: 强化学习通过构造奖励机制,逐步优化轨迹决策,尤其在不确定性较高的动态交互建模中具有突出优势。
文章还对当前常用的数据集和评价指标进行了总结。常用的轨迹数据集涵盖不同类型的场景(如室内外、开放道路与拥挤环境等),评价指标包括平均误差、平均绝对误差及轨迹误差分布等。
本文在总结现有成果的基础上,提出了未来研究方向的思考,包括: 1. 应对复杂动态交互的挑战:如行人与多方向车辆及交通设施间的动态耦合。 2. 构建更高性能的预测模型:结合深度学习与物理建模的混合方法。 3. 实现更大的应用潜力:如智能交通系统优化、实现交通参与者间更高效的协同。
《道路行人行为轨迹预测研究综述》针对道路行人行为轨迹预测这一领域进行了全面而深入的分析,从背景意义出发到算法方法,总结了现有研究现状与问题。基于多模态感知技术及复杂交互模型的发展,该领域正在快速进步。未来研究者可结合本文提出的方向,探索适应性更强且具有高度解释力的新型模型,为自动驾驶及智能交通系统的发展提供更广阔的技术支撑与场景应用。