分享自:

基于具有抑制性神经元的模块化循环神经网络模型的非提示任务切换机制

期刊:Nature CommunicationsDOI:10.1038/s41467-024-50501-y

神经网络模型揭示大脑内部引导任务切换的精细门控机制

本文旨在向中文读者介绍一项发表于《自然通讯》杂志的神经计算科学研究。该研究构建并分析了一个受生物学启发的递归神经网络模型,以揭示大脑在进行“威斯康星卡片分类测试”这类未提示任务切换时所依赖的精细神经回路机制。以下是关于这项研究的全面学术报告。

第一、研究基本信息

本项研究的主要作者为Yue Liu和Xiao-Jing Wang,他们均来自美国纽约大学神经科学中心。该研究以题为“flexible gating between subspaces in a neural network model of internally guided task switching”(内部引导任务切换的神经网络模型中子空间之间的灵活门控)的论文形式,于2024年发表在《自然通讯》杂志上。

第二、学术背景

本研究的科学领域属于计算神经科学与认知科学的交叉领域。行为灵活性依赖于大脑在多个任务之间快速切换的能力,即便任务规则没有被外部线索明确提示,而必须通过试错来推断。经典的威斯康星卡片分类测试是评估这种未提示任务切换能力的金标准。然而,其背后精确的神经回路机制尚不清楚。

在先前的研究中,科学家们已识别出与规则、反馈等认知变量相关的神经活动关联,并知道不同类型的抑制性神经元(如表达小清蛋白的中间神经元,PV;表达生长抑素的中间神经元,SST;表达血管活性肠肽的中间神经元,VIP)在神经计算中扮演不同角色。例如,SST和VIP神经元被认为构成了一个解除抑制微环路,可能实现大脑信息灵活路由的门控机制。但迄今为止,尚缺乏对这些神经表征和细胞类型特异性机制如何协同工作以实现未提示任务切换的机理性理解。

因此,本研究的主要目标是:利用计算建模来形式化和发现潜在的机制假说。具体而言,研究者使用受生物学信息约束的递归神经网络模型,通过对一个模拟任务进行训练和系统剖析,旨在阐明未提示任务切换背后涉及的详细神经回路架构和动力学原理。

第三、详细研究流程

本研究采用了“训练-剖析”的计算神经科学范式,其工作流程可分为几个主要阶段:

1. 模型构建与训练阶段 * 研究目标:构建一个能执行模拟WCST任务、且结构上具有生物学合理性的RNN模型。 * 模型结构:构建的RNN模型由两个双向连接的模块组成:“前额叶皮层”(PFC)模块和“感觉运动”(sensorimotor)模块。每个模块均包含兴奋性神经元和三种主要的抑制性神经元。这是模型的关键生物学约束部分:兴奋性神经元具有胞体和两个树突区室;三种抑制性神经元(PV, SST, VIP)的输入与输出连接模式受到实验数据的约束(例如,SST神经元主要靶向树突,VIP神经元靶向SST神经元等)。 * 任务设计:网络被训练执行一个在猴子实验中使用的WCST变体。在每次试验中,网络会看到一个参考卡和三张测试卡,需要根据一个隐藏的规则(颜色或形状)来选择匹配的测试卡。规则会随机切换,且无外部提示。网络必须根据前一次试验的反馈(正确或错误)来推断当前规则。 * 训练过程:网络在多个试验中连续运行(不重置动力学),使用监督学习通过随时间反向传播算法调整所有可修改连接的权重,最小化两个模块输出与期望输出(规则和选择)之间的误差。为了探索树突非线性对功能的影响,研究者训练了两类模型:一类具有减法型树突非线性,另一类具有除法型树突非线性。每个模型配置使用多个随机种子进行训练以确保结果的稳健性。 * 样本/网络数量:研究训练并分析了数十个不同的网络,具体数量取决于超参数组合。例如,对于每种树突非线性类型,使用了50个随机种子进行模型训练。对于探索SST连接稀疏性的实验,每个稀疏性水平训练了10个随机种子的模型。

2. 模型性能验证与初步分析 * 验证过程:训练收敛后,通过让网络连续运行包含随机规则切换的80个试验来测试其性能。 * 结果:训练成功的网络在每次规则切换后通常只犯一次错误,之后能迅速切换到新规则并保持良好的表现。研究者还观察到了与猴子神经记录相似的、持续多个试验的规则调控的持续活动。

3. 系统性模型剖析阶段 这是研究的核心部分,研究者像实验神经科学家一样,通过多种“虚拟干预”和连接分析来“打开黑箱”。

  • PFC模块的吸引子动力学:通过初始化网络在不同状态并让其自主演化,研究者发现PFC模块的群体活动会稳定在两个不同的吸引子状态之一,分别对应两种任务规则。有趣的是,在许多网络中,这两个吸引子状态的维持依赖于PFC模块与感觉运动模块之间的长程相互作用,而非仅靠局部连接。
  • PFC模块中的神经元亚群:分析发现PFC模块中自发涌现出两类兴奋性神经元:“规则神经元”(Rule Neurons),其活动在不同规则下持续差异;“联合错误×规则神经元”(Conjunctive Error x Rule Neurons),其活动在接收到错误反馈后出现短暂的、依赖于规则的发放。这与猴子前额叶和顶叶皮层的神经记录结果一致。研究者量化了这些神经元的输入权重和活动调制,清晰地分离了这两类群体。
  • PFC模块内的结构化连接:研究者计算了不同神经元亚群之间的平均连接强度。他们发现规则神经元之间形成了经典的“赢家通吃”吸引子网络结构。更重要的是,他们揭示了规则神经元与联合错误×规则神经元之间存在一种特定的连接结构:例如,偏好某一规则的兴奋性规则神经元更强烈地投射到偏好相反规则的联合神经元。这种结构化的连接模式构成了一个简化的、可解释的电路图,能够解释网络如何在正确反馈下维持规则状态,以及在错误反馈下切换到对立规则状态。研究者计算了一个“连接偏向性”指标,证实这种电路基序在多个不同超参数训练的网络中具有一致性。
  • 规则信息的自上而下传播:研究者分析了PFC模块如何通过长程连接将规则信息传递到感觉运动模块。他们发现存在三种结构化的通路:1)单突触兴奋性通路:PFC兴奋性规则神经元优先投射到感觉运动模块中偏好相同规则的兴奋性神经元;2)涉及SST和VIP神经元的三突触解除抑制通路;3)涉及PV神经元的双突触通路。这三种通路协同作用,将规则信号传递至感觉运动模块。
  • 感觉运动模块的输入输出连接结构:为了理解感觉运动模块如何实现规则依赖的刺激-反应映射,研究者分析了其输入和输出连接的权重模式。发现感觉运动模块的兴奋性神经元接收更强的输入,这些输入编码了与其偏好的规则、反应位置和共享特征相匹配的刺激特征。同时,这些神经元也向与其偏好反应位置对应的输出神经元发送更强的投射。这种结构化的输入输出连接是实现正确选择的基础。
  • 感觉运动模块的群体动力学与子空间:对感觉运动模块群体活动的分析显示,在不同任务规则下,神经活动轨迹占据了几乎正交的“子空间”(subspaces)。这种子空间的分离是实现不同规则下不同感觉运动映射的群体水平特征。
  • SST神经元在树突门控中的关键作用:研究者利用模型的生物学细节,深入探讨了SST神经元的功能。他们发现,感觉运动模块中兴奋性神经元的不同树突分支对规则的编码通常是相似的(即采用群体水平门控策略),但这种“树突分支特异性编码”的程度受到SST神经元到树突连接稀疏性的调控:连接越稀疏,同一神经元的不同树突分支越可能编码不同的规则。更重要的是,虚拟“光遗传学抑制”(将SST神经元活动设为零)会显著损害任务表现,降低规则子空间之间的夹角,并削弱感觉运动模块神经元对规则和刺激的非线性混合选择性编码。这直接证明了SST神经元在传递自上而下规则信息和重构感觉运动模块动力学中的因果性作用。

第四、主要研究结果

  1. 网络成功模拟了未提示任务切换行为:训练后的RNN能够像动物一样,在无外部提示的情况下,通过试错学习和利用反馈信号,快速地在两种任务规则之间切换,表现出与某些猴子实验数据一致的行为模式。
  2. PFC模块涌现出可解释的双吸引子动力学和神经元亚群:PFC模块自发形成了对应两种规则的稳定吸引子状态,其维持需要模块间相互作用。模块内自然分化出“规则神经元”和“联合错误×规则神经元”,与实验观察到的神经元类型吻合。连接分析揭示了一个具有特定连接偏好的简化电路图(图3c),该图不仅解释了规则维持,还清晰阐明了如何利用单一的错误反馈信号触发向对立规则的切换。
  3. 规则通过多条结构化通路进行自上而下传播:规则信息并非通过单一通路,而是通过协同作用的单突触、双突触(PV介导)和三突触(SST/VIP介导)通路,以结构化的连接模式从PFC模块传递到感觉运动模块。
  4. 感觉运动模块的输入-输出结构支持规则依赖的选择:模块内兴奋性神经元根据其功能特性(偏好的规则、位置、特征)接收结构化的感觉输入,并投射到结构化的运动输出。这种连接模式是实现正确感觉-运动转换的基础。
  5. 群体活动表征为分离的子空间:感觉运动模块在不同规则下的神经群体活动轨迹占据近乎正交的子空间,这是任务切换在群体动力学水平上的体现。
  6. SST神经元是子空间分离和树突门控的关键:这是研究的核心发现之一。对SST神经元的虚拟抑制直接破坏了任务性能、缩小了规则子空间夹角、并削弱了关键的混合选择性编码。这为“子空间”这一现象学描述提供了具体的、细胞类型特异性的回路机制解释。研究还发现,树突门控策略(群体水平 vs. 分支特异性)受到SST到树突连接稀疏性的影响。

这些结果层层递进:从网络成功模拟行为(结果1),到剖析出其内部工作机制(结果2-5),最后聚焦于特定细胞类型(SST)的关键因果性作用(结果6)。结果2和3解释了规则如何被内部表征和更新,结果4和5解释了规则信息如何被用来配置感觉运动映射,而结果6则通过虚拟干预,将宏观的“子空间分离”现象与微观的特定抑制性神经元功能联系起来,完成了从现象到机制的闭环论证。

第五、结论与价值

本研究通过构建和剖析一个受生物学约束的、功能化的RNN模型,为未提示任务切换(以WCST为例)提供了一个详尽的、从细胞类型到网络动力学的多层级神经回路机制假说。

  • 科学价值:该研究将人工智能的机器学习工具与神经生物学知识相结合,成功地“反向工程”了一个能执行复杂认知任务的神经回路。它不仅重现了在动物实验中观察到的多种单神经元响应特性(如规则神经元、联合编码神经元),更重要的是,它预测了这些特性如何通过特定细胞类型(PV, SST, VIP)之间以及脑区模块之间的结构化连接来实现。特别是,它首次在任务优化的网络中,明确了SST神经元在介导规则相关的子空间分离和树突门控中的关键因果作用,为连接“子空间”这一群体水平现象与特定微环路机制架起了桥梁。
  • 应用与启发价值:该方法展示了“任务优化-模型剖析”这一计算范式的强大潜力,可用于生成关于其他高级认知功能的可检验的神经机制假说。模型预测的详细连接模式(如规则神经元与联合神经元之间的特定连接偏向)可以为未来的实验研究(例如使用光遗传学和双光子成像结合行为学)提供具体的、可验证的预测目标。此外,研究中对慢速切换网络的分析(训练未达完美精度时出现)也为理解行为变异性提供了洞见。

第六、研究亮点

  1. 多层次机制阐明:研究从行为模拟、单神经元特性、局部微环路连接、跨模块长程投射、群体活动子空间等多个层次,完整地描绘了未提示任务切换的神经机制图景。
  2. 连接现象学与机制:研究的一个突出亮点是成功地将高维群体活动空间的“子空间分离”这一相对抽象的现象学描述,归因于对特定类型抑制性神经元(SST)活动的依赖,提供了从网络动力学到具体生物基质的解释。
  3. 生物学约束与功能涌现的结合:模型并非完全黑箱,其架构(模块划分、细胞类型、连接约束)融入了大量已知的神经生物学知识。在此约束下,通过训练让网络功能(任务解决)自发涌现,再对其进行详细解剖,这使得发现的机制具有更高的生物学合理性和解释力。
  4. 稳健性与可解释性:研究强调所发现的机制(如PFC模块的简化电路图、SST的关键作用)在数十个使用不同随机初始化和树突非线性训练的网络中保持一致,表明这很可能是一个解决此类任务的稳健、高效的电路方案,而非个别网络的特殊解。

第七、其他有价值内容

研究在讨论部分还提出了模型各组件与大脑区域的潜在对应关系(如PFC模块对应前额叶和前扣带回皮层,感觉运动模块对应顶叶皮层或基底节等),并探讨了模型发现与更多生物学背景的联系,例如分布式吸引子、其他行为状态切换的普适性电路原理、以及模型的局限性(如VIP神经元在特定约束下功能不明显),为未来的研究指明了方向。这些讨论将计算模型的发现置于更广阔的神经科学语境中,增强了其启发价值。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com