一种昆虫启发的自主导航模型：融合目标趋近与碰撞规避

分享自：
一种昆虫启发的自主导航模型：融合目标趋近与碰撞规避

信息科学
神经科学与心理学
生命科学
计算机科学
人工智能
期刊:Neural NetworksDOI:10.1016/j.neunet.2023.05.033
【点击此处】阅读全文、收藏及针对性提问
本文档介绍了一项由Xuelong Sun、Qinbing Fu、Jigen Peng和Shigang Yue合作完成的研究，题为“An insect-inspired model facilitating autonomous navigation by incorporating goal approaching and collision avoidance”。该研究于2023年5月发表在期刊 Neural Networks 上（第165卷，106-118页）。通讯作者为来自广州大学的Jigen Peng和来自莱斯特大学的Shigang Yue。Xuelong Sun和Qinbing Fu为共同第一作者。这项研究主要隶属于仿生计算、机器人学和神经科学交叉领域，旨在开发受昆虫启发的自主导航算法。
该研究的学术背景源于对机器人及动物自主导航能力——即同时实现目标趋近与碰撞避免——的长期探索。尽管昆虫大脑比哺乳动物小得多（神经元数量少于百万），但它们却展现出惊人的导航能力，这激励了研究人员从昆虫中寻找解决导航两大核心问题的灵感。然而，以往的仿生研究通常只孤立地关注目标趋近或碰撞避免中的一个问题，缺乏将两者合成并研究其在感知-运动闭环自主导航中交互作用的模型。因此，本研究的目标是填补这一空白，开发一个集成了昆虫目标趋近与碰撞避免机制的自主导航模型，并验证其在闭环环境中的有效性。
研究的工作流程和具体方法如下：
1. 模型构建与集成 研究提出的核心算法整合了两种受昆虫启发的神经计算模型： * 目标趋近机制： 灵感源自汗蜂的路径整合机制（Path Integration, PI）。这一机制作为“全局工作记忆”，通过整合行进过程中的方向和距离信息，持续计算并更新指向目标（如巢穴或食物源）的向量。研究者采用了Stone等人（2017年）提出的、具有解剖学约束的PI神经网络模型，并将其扩展用于基于向量的导航。该模型的核心是一组称为CPU4的神经元，其活动编码了“家园向量”（即目标向量），从而指导代理的运动方向。 * 碰撞避免机制： 灵感源自蝗虫的视叶巨型运动检测器（Lobula Giant Movement Detector, LGMD）模型。这一机制作为“局部即时线索”，负责从视觉输入中快速检测潜在的碰撞威胁。研究采用了Yue和Rind（2006年）提出的LGMD神经网络模型。该模型能够处理连续的视觉场景，对快速逼近的物体（即“迫近”刺激）产生峰值响应，从而提前预警碰撞风险。
研究者将这两个机制整合到一个统一的导航控制系统中。PI模型负责根据存储的向量记忆生成趋向目标的基本运动指令，而LGMD模型则实时监控视觉输入。当LGMD检测到碰撞风险时，它会触发一个中断信号，覆盖或修改当前的运动指令，执行规避动作（在静态环境中急转弯，在动态环境中短暂停止）。这种整合方式体现了一种简单的“子sumption”架构思想，即更基本、反应更快的避障行为可以中断更高级的目标趋近行为。
2. 仿真环境与代理定义 为了验证所提出的算法，研究构建了一个三维仿真环境，并使用Python进行实现。 * 仿真世界： 环境包含立方体障碍物、一个起始点（巢穴）和多个食物站点。障碍物的位置被策略性地布置在起点与各食物点连线、以及各食物点之间连线的等分点上，以创建具有挑战性的导航路径。研究设置了两种环境：静态环境（障碍物位置固定）和动态环境（障碍物垂直于其所在连线做周期性往复运动）。 * 导航代理： 代理被抽象为三维空间中的一个有向点，其状态由位置和航向角定义。代理装备了一个模拟相机，具有120度的水平视野和105度的垂直视野。代理的运动受物理模型约束，包括加速度、速度和阻力。 * 导航任务： 定义了一个两阶段的导航任务。 * 第一阶段（探索与记忆）： 代理在无障碍物的环境中随机探索，寻找所有食物站点。每当到达一个食物站点，它就会利用PI机制记录下从起点到该站点的“家园向量”，并将其作为该站点的向量记忆存储下来。此阶段完成后，代理拥有了所有目标点的位置记忆。 * 第二阶段（记忆导航与避障）： 代理从同一起点出发，需要依次访问第一阶段记忆中的所有食物站点，最后返回起点。此阶段环境中设置了障碍物。代理必须依靠存储的向量记忆进行目标趋近（基于向量的导航），同时利用LGMD模型实时避免与静态或动态障碍物发生碰撞。
3. 仿真实验与数据分析 研究通过大量仿真实验来评估集成算法的性能。主要步骤如下： * 实验设置： 在静态和动态环境中，分别改变障碍物的数量（从6个到42个），以测试算法在不同障碍物密度下的鲁棒性。对于每种环境配置，进行多次（例如15次）独立的仿真试验。 * 性能指标： 定义了三个关键量化指标来评估导航性能： 1. 路径长度： 代理完成第二阶段任务所行驶的总距离。较短的路径意味着更高的导航效率。 2. 完成时间： 代理完成第二阶段任务所需的时间步数。 3. 碰撞次数： 在导航过程中，代理实际与障碍物发生碰撞的次数（注意，这不同于LGMD预测的碰撞风险）。此指标直接衡量避障机制的有效性。 * 对比实验： 为了凸显LGMD模型的价值，研究设置了对照组：让代理在关闭LGMD避障功能的情况下执行相同的第二阶段任务，仅依靠PI进行目标趋近（此时代理会“穿过”障碍物，但记录碰撞次数）。通过比较有/无LGMD时碰撞次数的差异，来证明集成碰撞避免机制的必要性和效果。 * 数据记录与可视化： 记录每次试验的上述指标、代理的运动轨迹、LGMD的激活时刻与位置等。通过绘制轨迹图、热力图、小提琴图等对结果进行可视化分析。
4. 主要研究结果 仿真的结果详细回答了研究提出的问题，并验证了模型的效能：
任务完成能力： 仿真结果表明，集成PI和LGMD模型的代理能够成功地在静态和动态环境中完成定义的两阶段导航任务。代理能够利用存储的向量记忆规划大致朝向目标的路径，并在遇到障碍物时通过LGMD触发的规避行为（急转弯或暂停）绕开障碍物，最终无碰撞或低碰撞地访问所有目标点并返回。这直接证明了将昆虫启发的目标趋近与碰撞避免机制整合到一个控制系统中的可行性。
LGMD碰撞避免机制的有效性： 对比实验的结果非常显著。在静态环境中，尤其是在障碍物密度较低时（如6个或12个障碍物），配备LGMD的代理能够将碰撞次数的中位数降低100%（即实现零碰撞）。随着障碍物密度增加，避障成功率有所下降，但碰撞次数仍远低于无LGMD的对照组。在动态环境中，LGMD同样显著降低了碰撞次数（降低幅度在16.67%到100%之间）。此外，LGMD的引入还提高了导航的鲁棒性，降低了不同试验间性能的方差。这些数据强有力地支持了LGMD作为局部快速反应机制，能够极大地增强导航系统在复杂环境中的生存能力。
碰撞避免对目标趋近的影响： 这是研究的另一个关键发现。虽然集成避障机制后，代理的运动轨迹因为避障动作（如绕行）而变得更曲折、更长（在静态环境中路径长度增加），在动态环境中因为暂停等待而导致完成时间变长，但是，整体的目标趋近性能并未受到根本性破坏。代理仍然能够遵循向量记忆所指示的宏观任务顺序（例如，依次访问食物点1、2、3并返回起点）。轨迹热力图显示，尽管路径分散，但高概率通过的区域仍然连接着各目标点。这表明，PI作为全局工作记忆具有动态更新和补偿偏差的能力，能够与局部的、反应式的避障行为良好协作。这种协作在障碍物密度极高时可能变得不稳定，但在大多数情况下是有效的。
模型鲁棒性测试： 研究还测试了算法在不同视觉对比度下的表现（在动态环境中），结果发现性能差异不显著，表明模型在一定范围内对感官输入的变化具有鲁棒性。此外，研究者还尝试了另一种版本的LGMD模型，也取得了类似的积极结果，进一步支持了“昆虫启发的机制可以作为自主导航基础模块”这一核心理念。
5. 研究结论与价值 本研究得出结论：首次成功构建并验证了一个最小的、受昆虫启发的自主导航模型，该模型通过简单的控制策略，将分别负责全局目标趋近（汗蜂PI模型）和局部碰撞避免（蝗虫LGMD模型）的两个神经计算子系统整合在一起。该模型能够在感知-运动闭环的仿真环境中，驱动代理在静态和动态障碍物场景下，稳健且高效地完成多目标导航任务。
研究的价值体现在多个层面： * 科学价值： 为理解昆虫（可能也包括其他动物）如何协调不同导航策略（如基于记忆的向量导航与基于感官的快速反应）提供了一个可计算的理论模型和仿真验证平台。它表明，复杂的导航行为可能源于简单子系统的有效组合。 * 方法论价值： 展示了一种“从自然中学习”的仿生学方法，即剖析生物系统中高效、精简的神经计算原理，并将其转化为机器人可用的算法。本研究强调了对生物机制细节（如特定的神经环路模型）的借鉴，而非简单的行为模仿。 * 应用价值： 为移动机器人（尤其是计算和能源资源受限的微型机器人）的自主导航提供了一个极具潜力的解决方案框架。所使用的PI和LGMD模型均计算高效、对硬件要求相对较低，适合在嵌入式系统上实现。该研究为未来开发更复杂、更适应性的生物启发式机器人导航系统奠定了基础。
6. 研究亮点 * 首创性整合： 这是首个将昆虫的路径整合（全局记忆）和碰撞检测（局部反应）这两种功能不同的导航机制，系统性地整合到一个协调的自主导航控制模型中的研究。 * 最小化与功能性验证： 研究致力于构建一个“最小模型”，以探究实现基本自主导航所需的最简组件和交互方式，并成功验证了其功能。 * 闭环仿真验证： 研究在一个精心设计的、包含感知-运动反馈回路的3D仿真环境中进行验证，使实验结果更贴近真实机器人应用场景。 * 详尽的性能量化与分析： 通过设计对比实验、使用多个量化指标（路径长度、时间、碰撞次数）和统计方法（中位数、方差、小提琴图），全面、客观地评估了模型的性能、避障机制的贡献以及两者交互的影响，提供了坚实的数据支持。
7. 其他有价值内容 论文还讨论了研究的局限性（如在高密度障碍物下仍会发生碰撞，运动控制策略可能非最优）和未来的发展方向。这包括：在真实物理机器人平台（如论文中提到的Colias或AntBot机器人）上进行验证；引入基于视觉的场景记忆以增强目标识别与导航；探索PI与LGMD子系统之间更复杂的交互方式（如信息交换）；以及采用更先进的控制器来优化避障行为。这些讨论为后续研究指明了有价值的路径。研究的所有源代码已通过GitHub公开，促进了研究的可重复性和后续开发。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问