分享自:

利用循环神经网络揭开路径积分的黑箱:揭示带细胞与网格细胞的层级处理通路

期刊:39th conference on neural information processing systems (NeurIPS 2025)

本文档属于 类型a:关于一项单一原创研究的报告

基于循环神经网络路径整合黑箱展开的神经机制研究

一、 作者、机构与发表信息

本项研究的主要作者包括Tianhao Chu(褚天昊)、Yuling Wu(吴玉玲)、Neil Burgess、Zilong Ji(纪子龙)和Si Wu(吴思)。其中,Tianhao Chu和Yuling Wu为共同第一作者,Si Wu为通讯作者。参与机构包括北京大学心理与认知科学学院、机器感知教育部重点实验室(中国)、北京大学-清华大学生命科学联合中心、北京大学生物医学前沿创新中心、伦敦大学学院认知神经科学研究所、神经科学、生理学与药理学系(英国)、伦敦大学学院皇后广场神经学研究所(英国)、北京大学行为与心理健康北京市重点实验室、IDG/麦戈文脑科学研究所以及定量生物学中心。

该研究以“Unfolding the black box of recurrent neural networks for path integration”为题,发表在第39届神经信息处理系统大会(NeurIPS 2025)的会议论文集中。

二、 研究背景与目标

本研究属于计算神经科学与人工智能的交叉领域,聚焦于空间导航中的核心计算问题——路径整合(Path Integration)。路径整合是指生物体通过持续整合自身运动信息(如速度)来推算当前位置的过程,对于动物导航和机器人控制至关重要。实验神经科学已发现,内侧内嗅皮层(Medial Entorhinal Cortex, MEC)中的网格细胞(Grid Cell)与路径整合密切相关,其放电模式在二维空间呈周期性六边形网格状。此外,在内嗅皮层上游的旁下托(Parasubiculum)还发现了条带细胞(Band Cell),其放电场呈现为一系列平行条带,被认为可能在执行一维路径整合中发挥作用。然而,神经系统究竟如何精确执行路径整合计算,特别是网格细胞与条带细胞之间的功能关系,以及它们如何协同工作,仍然是未解之谜。

近年来,人工智能方法,特别是循环神经网络(Recurrent Neural Network, RNN),被用于训练模型执行空间导航任务,以探究网格细胞与路径整合的关联。然而,现有研究大多关注于网格细胞在何种条件下涌现,或其对于路径整合是否必要,而未能深入揭示训练好的RNN模型内部实现路径整合的具体机制,成为了一个“黑箱”。同时,条带细胞在此过程中的功能角色也未得到充分探讨。

因此,本研究的目标是双重的:第一,“为AI注入神经科学”:借鉴神经科学的先验知识和方法,系统地“打开”经过路径整合任务训练的RNN模型的“黑箱”,揭示其内部的计算机制和信息处理通路。第二,“为神经科学注入AI”:基于从RNN模型中获得的启示,构建一个解释大脑如何实现路径整合的神经环路模型,从而增进我们对生物神经网络工作机制的理解。

三、 详细研究流程

本研究包含两个主要且相互关联的工作流程:首先是基于RNN的探索性分析,其次是受此启发构建的神经环路模型。

流程一:基于RNN的“黑箱”展开与机制探索

  1. 模型训练与任务设定

    • 研究对象:研究者采用了一个经典的监督学习范式来训练RNN执行路径整合任务。模型结构为一个简单的循环神经网络。
    • 任务描述:在一个方形虚拟环境中,一个智能体(Agent)随机运动。RNN的输入是智能体每一时间步的二维速度向量(vt)。目标输出是重建智能体当前位置对应的“位置细胞”(Place Cell)活动模式(p̂t)。模型仅凭初始位置(通过一个来自“海马”的投影设定RNN初始状态)和后续的速度序列,来推断并输出后续所有时间点的位置。这模拟了生物体在没有外部地标线索时,仅依靠自身运动感进行的路径整合。
    • 训练细节:RNN包含4096个循环单元(神经元),使用反向传播通过时间(BPTT)算法进行训练,优化目标是使网络输出的位置细胞活动与真实活动之间的交叉熵损失最小化。训练后,模型在路径整合任务上表现出色。
  2. 运用神经科学方法解析训练好的RNN: 这是本研究的核心创新环节,研究者没有将RNN视为不可知的“黑箱”,而是主动运用神经科学的分析工具对其进行解剖。

    • 步骤A:神经元类型鉴定
      • 方法:让训练好的RNN在环境中进行随机行走,记录每个神经元在不同空间位置的活动,生成其空间调谐图(Spatial Tuning Map)。随后,借鉴神经科学中对网格细胞和条带细胞的鉴定标准,对RNN中的神经元进行分类。
      • 定量标准:对于网格细胞,计算其空间自相关图的网格分数(Grid Score),高分者被归类为网格细胞。对于条带细胞,研究者开发了一种新的光谱分析方法:计算其空间率图的二维傅里叶变换,将功率谱与二维高斯模型进行拟合,计算一个条带分数(Band Score),高分者被归类为条带细胞。其余既不满足网格也不满足条带特征的神经元被归类为未定义细胞(Undefined Cell)
      • 样本:在一个典型的训练好的RNN(nr=4096)中,识别出764个网格细胞、764个条带细胞和2568个未定义细胞。这三种细胞类型在多个随机种子训练的RNN中均稳健地涌现。
    • 步骤B:通过连接剪裁剖析信息流: 为了确定不同神经元群体在路径整合计算中的功能角色,研究者进行了一系列逐步的、有针对性的连接剪裁(Pruning)实验,并观察其对模型路径整合性能(以位置预测误差衡量)的影响。
      • 实验1:剪裁速度输入:分别剪裁掉通往条带细胞、网格细胞和未定义细胞群体的速度输入连接。结果发现,仅剪裁条带细胞的速度输入会导致路径整合误差显著增加,而剪裁其他群体的速度输入影响甚微。这表明速度信息主要由条带细胞接收和处理
      • 实验2:剪裁读出连接:分别剪裁掉从条带细胞、网格细胞和未定义细胞群体到输出层(位置细胞)的读出连接。结果发现,剪裁网格细胞的读出连接对性能损害最大。这表明网格细胞是位置信息的主要输出者
      • 实验3:剪裁细胞类型:等量地移除(剪裁其所有连接)条带细胞、网格细胞或未定义细胞。结果显示,移除条带细胞或网格细胞会严重损害性能,而移除未定义细胞影响较小。这表明条带细胞和网格细胞在路径整合中扮演着比未定义细胞更关键的角色
      • 实验4:剪裁条带与网格细胞间的连接:分别剪裁从条带细胞到网格细胞的前向连接,以及从网格细胞到条带细胞的反馈连接。结果发现,剪裁任一类双向连接都会对性能产生重大影响。这表明条带细胞与网格细胞之间的双向、协作性交互对于路径整合至关重要
  3. 分析条带细胞的内部结构与动力学: 在明确了条带细胞的关键作用后,研究者进一步深入分析了其群体特性。

    • 聚类分析:通过傅里叶分析提取每个条带细胞的间距(Spacing, λ)朝向(Orientation, θ) 参数。发现条带细胞可以根据(λ, θ)清晰地聚类成若干个模块(如四个主要集群)。每个模块内的细胞具有相似的间距和朝向。
    • 方向调谐分析:计算每个条带细胞的方向分数(Direction Score)偏好方向(Preferred Direction)。发现每个模块内的条带细胞大多具有明确的方向调谐,并进一步形成两个亚群,其偏好方向分别沿着模块朝向θ或其相反方向θ+π。
    • 群体动力学与连接模式分析
      • 动力学:对具有相同间距和方向调谐的条带细胞群体活动进行降维分析(Isomap)。发现其低维流形形成一个连续的环,这与一维连续吸引子神经网络(1D Continuous Attractor Neural Network, 1D CANN) 的周期性动力学特征一致。
      • 连接:分析同一模块内条带细胞之间的递归连接权重,发现其随细胞间相位差(Phase Difference, φ) 的变化呈近似对称的轮廓,权重随相位差增大而减小,类似于1D CANN中“中心-环绕”式的连接模式。

流程二:构建受启发的神经环路模型

基于RNN分析发现的层级通路(速度→条带细胞↔网格细胞→位置)以及条带细胞呈现的1D CANN特性,研究者构建了一个具体的生物物理模型。

  1. 模型结构:该模型包含条带细胞模块网格细胞模块

    • 条带细胞模块:每个模块负责一个特定朝向(θ)的一维路径整合。模块内包含三个亚群:纯条带细胞(构成1D CANN核心)、方向联合条带细胞v+(偏好方向为θ)和方向联合条带细胞v-(偏好方向为θ+π)。v+和v-细胞接收速度在其朝向轴上的投影分量,并通过具有固定相位偏移(δ)的连接去驱动纯条带细胞CANN中的活动“峰”移动,从而实现一维路径整合。
    • 网格细胞模块:网格细胞排列在一个二维环面流形上,形成一个二维连续吸引子神经网络(2D CANN)。为了生成六边形网格模式,研究者设计了一个特定的环面距离度量。
    • 层级交互多个(研究中以两个为例,朝向相差60°)条带细胞模块的输出,作为输入投射到网格细胞模块,将两个一维的路径整合结果融合为二维位置表征。同时,网格细胞模块反馈回条带细胞模块,起到纠正误差、稳定整合的作用。
  2. 模型仿真与验证

    • 方法:通过数值模拟,让模型智能体在环境中运动,给定速度输入。
    • 结果:在手工设计的参数下,模型中自发涌现出具有不同间距和朝向的条带细胞与网格细胞(图5c)。模型根据速度输入推断出的运动轨迹与真实轨迹高度吻合(图5d),证明了该神经环路模型具备实现二维路径整合的能力。

四、 主要研究结果

  1. 在训练好的RNN中发现了清晰的功能层级通路:综合剪裁实验的结果,研究者揭示出RNN内部存在一个层级化的路径整合通路速度信息首先被传递至条带细胞;随后,条带细胞与网格细胞通过双向连接进行协同计算,完成路径整合;最终,由网格细胞输出智能体的二维位置信息(图3a)。这一通路是模型实现路径整合功能的核心结构。
  2. 验证了层级通路的必要性与特异性
    • 必要性验证:研究者构建了一个新的RNN模型,将上述层级通路作为先验结构(即强制分为接收速度的“条带模块”和输出位置的“网格模块”,并双向连接)。训练后,该模型取得了与原始模型相当的性能,并且条带细胞和网格细胞自然地在对应模块中涌现(图3c)。这证明了该层级结构是实现路径整合的有效且可能最优的结构之一。
    • 特异性验证:当将训练任务从路径整合改为单纯的位置重建(输入是位置而非速度)时,训练出的RNN中只出现了网格细胞,而没有条带细胞。这说明了条带细胞的涌现与路径整合任务的需求密切相关,而非一般位置编码的副产品。
  3. 揭示了条带细胞的模块化与连续吸引子动力学:对RNN中条带细胞的深入分析表明,它们并非杂乱无章,而是组织成多个具有不同间距和朝向的功能模块。每个模块内的细胞进一步根据方向调谐分为两个亚群。更重要的是,每个模块的群体活动展现出1D CANN的动力学特征(环形流形),并且细胞间的连接模式也符合CANN的典型特征。这为条带细胞作为一维路径整合器的假说提供了计算模型层面的直接证据。
  4. 提出了一个由条带细胞和网格细胞层级协作的神经环路模型:受RNN发现的启发,研究者构建了一个数学上严谨的神经环路模型。该模型表明,由条带细胞构成的1D CANN模块可以执行一维路径整合,而多个此类模块(朝向不同)的输出,可以通过一个2D CANN(网格细胞)进行整合,从而完成二维路径整合。模型的仿真结果验证了其可行性。
  5. 挑战了传统观点并展示了计算效率优势:传统路径整合模型通常认为网格细胞是主要的(甚至是唯一的)速度积分器。本研究则支持并具体化了一个条带细胞-网格细胞层级模型。研究者指出,与仅依赖网格细胞的传统模型相比,他们的层级模型在实现相同功能的前提下,所需的神经元总数显著减少(从约5N²降至6N+N²),展现了更高的计算效率。同时,该模型避免了另一种需要速度信号即时调节网格细胞间连接权重的非生物似然模型。

五、 结论与意义

本研究得出结论:大脑可能通过一个由条带细胞和网格细胞构成的层级化神经环路来实现路径整合。在该环路中,条带细胞作为上游的一维路径积分器,接收并处理速度信息;网格细胞作为下游的二维积分与表征单元,整合来自多个朝向的条带细胞信息以形成空间地图并输出位置。两者通过双向连接进行协同和误差校正。

这项工作的科学价值在于: 1. 方法论创新:成功示范了如何将神经科学的分析工具(细胞类型鉴定、连接剪裁、吸引子动力学分析)应用于解释AI模型(RNN),实现了“为AI注入神经科学”,为理解复杂AI模型内部工作机制提供了范例。 2. 理论贡献:为路径整合的神经机制提供了一个新颖且具体的计算模型(条带-网格层级模型),挑战了网格细胞中心论的传统观点,将条带细胞的功能从假设提升到了具有详细计算架构的模型层面。 3. 预测与桥梁作用:基于计算模型提出了多项可实验验证的预测(如条带细胞的模块化组织、其CANN结构、以及其损伤对网格细胞和导航的影响),搭建了从计算模型到实验神经科学的桥梁,即“为神经科学注入AI”。 4. 跨领域启示:展示了AI与神经科学交叉研究的巨大潜力:AI模型可以成为发现神经计算原理的“计算显微镜”,而神经科学知识则可以指导我们打开AI模型的“黑箱”。

六、 研究亮点

  1. 系统性的“黑箱”展开方法:研究没有停留在观察RNN是否涌现出网格细胞,而是采用了一系列神经科学启发的、定量的、逐步深入的分析方法(分类、剪裁、动力学分析),系统地揭示了模型内部的信息处理通路和计算原理。
  2. 关键发现——条带细胞的核心作用:明确地将条带细胞定位为速度信息的主要入口和一维积分器,这是以往多数RNN导航研究中被忽视的关键环节。
  3. 从现象到机制:不仅发现了层级通路,还深入分析了条带细胞的内部结构(模块化、方向调谐、CANN动力学),使得对机制的理解更加深入和具体。
  4. 构建可解释的神经环路模型:将RNN中发现的抽象计算原理,转化成了一个具有明确生物物理意义和数学表达式的神经环路模型,完成了从“发现相关性”到“提出机制模型”的跨越。
  5. 强有力的交叉验证:通过构建先验结构模型和改变任务两种方式,验证了所发现层级通路的功能必要性和任务特异性,增强了结论的可靠性。

七、 其他有价值的内容

研究者在讨论部分指出了未来值得探索的方向,例如:未定义细胞是否具有头部方向细胞或边界向量细胞等空间调谐特性及其在通路中的作用;条带细胞与网格细胞之间相互作用的具体数学形式是否与提出的机械模型完全对应;以及该路径整合框架是否能推广到抽象空间(如社交网络、决策价值空间)的导航中。这些都为后续研究指明了道路。

这项研究通过巧妙的跨学科方法,不仅揭开了训练用于路径整合的RNN模型的内部奥秘,还由此提出了一个关于大脑如何执行路径整合的新的、具体的、可检验的神经环路模型,是AI与神经科学深度融合的一次成功实践。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com