分享自:

环境感知的运动匹配技术

期刊:ACM Trans. Graph.DOI:10.1145/3763334

这篇题为“environment-aware motion matching”的论文是由Jose Luis Ponton(来自西班牙的Universitat Politècnica de Catalunya)、Sheldon Andrews(来自加拿大的École de Technologie Supérieure)、Carlos Andujar和Nuria Pelechano(均来自Universitat Politècnica de Catalunya)共同完成的原创性研究工作。该研究于2025年12月发表在计算机图形学领域的顶级期刊ACM Transactions on Graphics上。

该研究立足于计算机图形学和角色动画领域,旨在解决交互式应用(如视频游戏、虚拟现实)中一个长期存在的挑战:如何让虚拟角色在复杂、动态的环境中表现出自然而逼真的全身体姿与轨迹适应能力。传统的角色动画技术,如状态机,难以应对任意场景,常常导致动画与环境的割裂。近年来,基于运动捕捉(motion capture)数据、通过匹配预定义特征来动态选择动画的“运动匹配”(motion matching)技术,因其在角色移动上的有效性而备受关注。然而,当涉及到环境交互(如避障)和群体动画时,现有方法面临巨大挑战。这些挑战主要包括:1)环境交互往往依赖场景中预定义的手动触发点,缺乏灵活性和自然感;2)在群体模拟中,身体动画与轨迹规划(如局部避障)通常是两个独立的过程,这容易导致身体姿态与根运动(root motion)不一致,出现“脚步滑动”等视觉瑕疵。人类真实的互动是双向的:身体姿态影响轨迹选择,而环境和潜在的轨迹约束也决定了我们的身体姿态(如在狭窄走廊中选择侧身行走)。为了突破这些限制,研究者们提出了“环境感知运动匹配”这一创新的实时系统。该研究的目标是开发一个能够根据动态障碍物和其他智能体的存在,实时、双向地适配角色全身体姿和运动轨迹的框架,从而生成更加一致、自然且反应灵敏的角色动画。

该研究的工作流程主要分为两个核心阶段:预处理阶段和实时控制器阶段。

首先,在预处理阶段,研究团队从一个包含大量运动捕捉数据的动画数据库中提取特征。数据库由一系列按时间顺序排列的姿势(poses)组成,每个姿势定义了一个包含24个关节的人形骨架信息。研究者引入了一个额外的根关节,将臀部关节投影到地面平面上,以此定义角色的参考坐标系和2D位置。从每个姿势中,他们提取了三类特征:1)查询特征(query features),包括用于保证过渡平滑的姿势特征(如脚部和髋部关节的3D线速度、脚部关节的3D位置)和用于驱动运动的轨迹特征(未来20、40、60帧的2D角色位置和方向)。2)环境特征(environment features),这是本研究的创新核心。为了能够评估姿势在特定环境中的适用性,研究者使用2D椭圆来近似表示角色在未来三个时间点的身体投影形状。椭圆的长轴方向与角色移动方向对齐,其大小通过将骨架所有关节投影到两个轴上并取最大投影距离来确定。最终,每个姿势的特征向量由查询特征(27维)和环境特征(9维)拼接而成,形成一个36维的特征向量数据库,与原始动画数据库一一对应。

其次,在实时运行阶段,系统以不同的频率执行两个任务。每N帧(实验中N=10,对应60Hz应用),控制器执行一次特征搜索,以找到最适合当前情境的下一个姿势。搜索过程分为两步:第一步是构建查询向量。系统根据用户输入(如键盘或游戏手柄指令)生成目标轨迹,并结合当前角色姿态,构造出目标查询特征向量。第二步是遍历特征数据库进行匹配。对于数据库中的每个候选特征向量,系统先计算其查询特征与目标查询向量之间的加权欧氏距离。随后,关键的一步是进行“障碍物惩罚”计算:系统根据候选特征向量中的环境特征(即未来三个椭圆)和场景中动态障碍物的位置,计算它们之间的最小距离。如果距离小于预设阈值,则通过一个对数障碍函数施加惩罚值,距离越近惩罚呈指数级增长。这个惩罚机制确保了那些会导致碰撞的姿势序列在搜索中被“降级”。最后,将查询距离和所有惩罚值加权求和,得到该候选特征向量的总“分数”。系统选择分数最低的候选者,其对应的姿势即为最佳匹配姿势。选定姿势后,系统会计算一个变换,使该姿势能在当前角色空间内播放。在此后的每一帧,系统简单地播放动画数据库中该最佳匹配姿势之后的连续帧,直到下一次搜索被触发。若两次搜索间切换了姿势,则使用惯性化(inertialization)技术进行平滑过渡。

研究的主要结果通过一系列精心设计的实验和定量分析得到充分展示。首先,在功能验证方面,研究展示了该系统在多种场景下的卓越能力:在逐渐变窄的走廊中,角色能自动减速并转为侧身通过;在布满锥形障碍的“之”字形通道中,仅靠向前的用户输入,角色便能自动走出复杂的避障路径;在高密度静态人群中,角色能缓慢而谨慎地穿行。其次,在动态交互方面,系统对动态障碍物反应灵敏:当移动的立方体或汽车接近时,角色即使没有用户输入或输入方向与障碍物相同,也能自动调整姿态和轨迹(如前进几步或后退奔跑)以避免碰撞。再者,在多角色互动中,每个角色都运行独立的系统,通过互相考虑对方预测的未来椭圆形状,能够自然协调地侧身通过不同宽度的走廊,展示了双向适应的效果。此外,研究还证明了该框架的可扩展性:通过增加高度作为环境特征,系统能够驱使角色执行跳跃或下蹲动作以通过垂直障碍。与群体模拟算法的集成也验证了其应用价值,角色能根据基本的转向力产生完美同步的身体动画和根运动,解决了传统群体模拟中动画与规划脱节的问题。

在性能与消融分析中,研究者进行了严格的定量比较。在充满障碍的密集场景压力测试中,标准的运动匹配方法虽然搜索速度最快(平均每次搜索0.22毫秒),但完全无视环境,导致约30%的时间与障碍物相交。而本研究提出的完整方法(标记为“ours”)在引入了所有优化(包括基于时间一致性的分层搜索、提前拒绝机制等)后,将搜索性能提升至平均0.80毫秒,同时将碰撞时间大幅降低至仅约2%。尽管轨迹跟踪误差(0.14米)略高于标准运动匹配(0.09米),但这是系统为优先避障而进行合理绕路的必然结果。分析还显示,使用椭圆作为身体表征远优于简单的圆盘表征,后者因无法区分不同身体朝向(如侧身与正向),在狭窄通道中容易导致角色卡住,并产生更高的轨迹误差和碰撞时间。数据库规模扩展性分析表明,该方法具有良好的可扩展性,性能增长斜率远低于理论线性增长,这得益于高效的提前拒绝机制。

该研究的结论是,研究者成功提出并实现了一个名为“环境感知运动匹配”的数据驱动框架,它使角色动画能够自然、实时地适应包括动态障碍物和其他角色在内的环境条件。其核心贡献在于清晰地将与用户输入匹配的“查询特征”和用于实现无碰撞运动的“环境特征”分离。这种设计不仅捕捉了人体姿态与运动轨迹之间自然的双向关系,弥补了群体模拟中常见的脱节问题,还极大地简化了用户输入——系统能够自动选择最合适的运动模态(行走、侧身、跳跃、下蹲)并调整轨迹,甚至能在无用户输入时对逼近的威胁做出反应。该方法无需数据标注或训练,支持快速迭代和多样化的动画风格切换,在保证动画自然性的同时,通过一系列优化实现了近实时的性能,内存占用也极具竞争力(约50MB),使其非常适合集成到现有的游戏引擎和群体模拟器中。

本研究的亮点在于多个方面的重要创新与发现。首先,方法论上具有显著新颖性:提出了将简单碰撞代理直接集成到运动匹配算法中的新框架,通过环境特征和障碍惩罚机制,实现了对静态和动态环境约束的自然、耦合反应。其次,在结果上取得了重要突破:首次在运动匹配框架内同时解决了身体动画与轨迹规划的一致性问题,生成了完美对齐的身体姿态和根运动,从根本上改善了群体模拟中脱节的局部转向与动画问题。第三,实用性强:系统设计易于集成到现有管线,并通过大量优化确保了实时性能;数据要求简单,仅需单角色动画数据库,无需多角色捕捉或物体标注。第四,框架灵活可扩展:环境特征的抽象设计便于融入新的交互类型(如高度特征),展示了其广泛的适用潜力。最后,通过详尽的实验和对比,定量验证了该系统在避障效果、动画多样性、性能表现等方面均优于传统运动匹配和简化版本,并深入分析了不同身体表征和优化策略的影响,为后续研究提供了坚实的实证基础。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com