关于《神经环路模型用于通过选择特异性序列进行证据积累》研究的学术报告
本文报告了一项由Lindsey S. Brown(第一作者)、Jounhong Ryan Cho、Scott S. Bolkan、Edward H. Nieh、Manuel Schottdorf、David W. Tank、Carlos D. Brody、Ilana B. Witten(共同通讯作者)和Mark S. Goldman(共同通讯作者)共同完成的研究。研究人员主要来自普林斯顿大学神经科学研究所、霍华德·休斯医学研究所、加州大学戴维斯分校神经科学中心等单位。该研究于2026年发表在《自然-通讯》(*Nature Communications*)期刊上。
一、 研究背景与目标
本研究属于计算神经科学与认知神经科学的交叉领域。传统上,决策被认为是由通过持续性活动积累证据的神经元介导的。然而,近期在啮齿类动物决策实验中发现,全脑范围内许多神经元并非持续放电,而是以序列方式激活,且序列中的神经元子集取决于动物的最终选择。这一观察挑战了传统决策模型的核心前提。因此,本研究旨在解决一个关键问题:神经元如何通过瞬时的、选择特异性的序列活动,而非持续性活动,来实现精确的证据积累和跨神经元群体的信息传递?
研究团队的目标是构建并验证能够解释上述现象的神经环路模型,并利用在证据积累任务中获得的大规模神经成像数据来检验模型的预测,从而揭示不同脑区可能采用的不同证据积累机制。
二、 研究流程与实验设计
本研究是一个结合了理论建模与实验数据分析的综合性工作,主要包含以下几个关键步骤:
1. 理论模型构建: 针对“通过序列活动积累证据”这一核心计算需求,研究团队提出了两类候选神经环路模型。 * 竞争链模型: 该模型由两条竞争的神经元链组成。动物当前位置由链中活动升高的位置表示,而累积的证据则由该位置对应的两条链上神经元活动幅度的相对差异来编码。模型的核心在于,只有接收到“位置门控信号”的神经元对(每条链上一个)才能活跃并整合证据。当动物移动时,门控信号激活下一对神经元,通过前馈连接将当前积累的证据“传递”给新激活的神经元对。这样,随着动物前进,形成了一条选择特异性的神经元激活序列。证据在每条链的神经元活动水平上被单调地编码(直至饱和)。研究探讨了该模型的两种变体:基于相互抑制的链模型和基于非耦合(前馈抑制)的链模型。 * 位置门控的吸引子模型: 该模型中,证据被编码在一个神经元群体中特定位置上的、刻板形状的单峰活动“隆起”的网络位置。每一层神经元对应一个空间位置,层内的神经元沿着证据轴排列。局部的兴奋性连接和长程的抑制性连接维持着“隆起”的形状。外部证据输入通过“移位神经元”非对称地作用于当前活动隆起附近,使其沿证据轴向左或右移动,从而实现证据积累。与竞争链模型类似,一个位置门控信号控制哪一层神经元处于活跃状态,并通过层间的前馈连接在位置变化时传递信息。在该模型中,单个神经元对证据的调谐是狭窄的、非单调的(即只对特定的证据值范围有最佳反应),整个神经元群体则通过其活动隆起的离散位置来编码连续的证据值。
2. 行为任务与神经数据采集: 研究使用了一个名为“累积塔”的虚拟现实导航任务来获取实验数据。在该任务中,小鼠在一个T型迷宫中奔跑,在提示区会随机在左右两侧出现视觉线索(塔)。小鼠需要在延迟区记住哪一侧的线索更多,并在迷宫末端转向线索多的一侧以获得奖励。这要求小鼠整合线索数量并在工作记忆中保持该信息。 研究分析了在此任务中从小鼠四个脑区获取的大规模钙成像数据,总计14,247个神经元,来自26只小鼠。这些数据包括: * 新采集的数据: 来自前扣带回皮层(ACC,3只小鼠,7个会话,1720个神经元)和背内侧纹状体(DMS,8只小鼠,11个会话,804个神经元)。 * 已发表的数据: 来自海马体(HPC,7只小鼠,7个会话,3144个神经元)和压后皮层(RSC,8只动物,41个会话,8579个神经元)。 所有钙成像数据均经过处理(使用Suite2p进行运动校正、ROI提取、神经毡信号校正),并进一步通过尖峰推断算法转换为连续的 firing rate 信号,以便于跨数据集比较。
3. 模型预测与数据分析验证: 研究团队将模型模拟结果与神经记录数据进行系统比较,重点是检验两类模型对神经元证据调谐特性的不同预测。 * 模型预测: 竞争链模型预测,神经元对证据的调谐曲线应是单调的(活动随偏好证据的增加而增加或减少),并且在群体水平上,调谐是分级(graded) 的,覆盖一定范围的证据水平。吸引子模型则预测,神经元应表现出狭窄的、非单调的(单峰) 证据调谐,且这些调谐曲线的峰值应广泛分布于整个证据范围。 * 数据分析方法: 为了准确刻画神经元对位置和证据的联合调谐,并避免由于这两个变量采样不均衡(例如,迷宫早期位置只能积累少量证据)造成的伪影,研究人员采用了一个联合拟合模型:将神经元的 firing rate 建模为关于位置的 Gaussian 函数和关于证据的 Gaussian 函数的乘积。通过这种方法,可以识别出具有显著证据调谐的神经元,并量化其调谐曲线的峰值位置(μe)和宽度(σe)。单调调谐表现为峰值位于证据范围的极端值附近且宽度较大,而非单调调谐则表现为峰值位于中间且宽度较窄。 * 补充分析: 为了进一步探究证据编码的性质,研究还进行了:1) 群体线索编码模型分析,提取了神经元群体对左右线索的响应核,以检验是否存在符合积分器特性的持续、恒定的阶跃响应;2) 证据与选择的单神经元编码分析,在每个位置bin上使用回归模型区分神经元是编码连续证据还是编码二元选择;3) 线性证据解码分析,评估从神经元群体活动中解码连续证据水平的能力。
三、 主要研究结果
1. 不同脑区表现出不同的证据编码模式,与不同模型类别相符: 对四个脑区中具有显著证据调谐的神经元进行分析后,发现了明显的区域差异: * 新皮层区域(ACC和RSC): 神经元主要表现出单调的、相对宽泛的证据调谐。这与竞争链模型的预测一致。在ACC中,这种单调调谐尤为明显。RSC虽然也以单调调谐为主,但存在一部分调谐曲线相对较窄的神经元,可能反映了其作为海马体与皮层其他区域信息中转站的角色。 * 海马体(HPC): 神经元主要表现出狭窄的、非单调的(单峰)证据调谐,并且这些调谐曲线的峰值广泛分布于整个证据范围。这与位置门控吸引子模型的预测高度一致。这种编码方式支持海马体可能构建了一个整合了空间位置和任务证据的“认知地图”。 * 背内侧纹状体(DMS): 主要表现为单调证据调谐,但具有显著证据调谐的神经元数量较少,且多数在延迟期活动,其调谐更倾向于二元的“选择”编码,这与纹状体在动作选择中的作用相符。
2. 证据编码在任务进程中发生动态转变: 在ACC和RSC中,虽然早期表现出与证据积累模型一致的单调调谐,但进一步分析揭示了更复杂的动态: * 从分级证据编码到二元选择编码的转变: 单神经元编码分析和群体解码分析均表明,在迷宫的提示区早期,神经元活动编码的是连续分级的证据信息。然而,随着任务进程推进到提示区后期和延迟区,编码逐渐转变为更偏向于最终的二元行为选择。群体平均调谐曲线显示,早期对证据的平滑、分级响应在后期锐化为类似阶跃函数的选择调谐。 * 线索响应核符合积分特征: 从群体活动中提取的线索响应核显示,对左右线索的响应是持续的、近似恒定的阶跃式反应,符合理想积分器的输入特性。然而,响应幅度会随着已积累证据的增加而减小,表明存在饱和或向决策承诺的过渡。
3. 模型扩展以解释动态转变: 基本的竞争链模型设计为完美积分器,本身不产生从证据到选择的转变。研究提出了两种可能的扩展机制来解释这一现象: * 增加选择读出细胞: 在模型的每个位置引入一个独立的“选择读出”神经元群体,该群体比较两条链的活动并做出二元判决。随着迷宫进程,该群体的神经元数量可以增加,从而在群体活动中表现出从证据到选择的转变。 * 引入不稳定的积分器: 调整模型参数(如增加自兴奋强度),使积分器在迷宫后期变得不稳定,活动迅速发散至饱和状态,从而模拟出决策承诺或“紧迫性”信号,导致活动表现为二元选择模式。
四、 研究结论与意义
本研究的主要结论是:大脑可能通过选择特异性的神经序列来实现证据积累,但不同脑区采用了截然不同的电路机制和编码策略。 新皮层区域(如ACC、RSC)可能采用类似“竞争链”的机制,将证据编码为神经元活动幅度的单调函数;而海马体则可能采用类似“位置门控吸引子”的机制,将证据编码为特定神经元群体的空间活动模式。此外,在涉及行动选择的新皮层区域,证据的累积表征会随着时间向更二元的决策表征过渡。
这项研究的科学价值在于: 1. 提供了新的理论框架: 它提出了首个能够解释如何通过瞬时的、序列化的神经活动(而非传统的持续性活动)来实现精确证据积累和跨位置传递的机械性神经环路模型。 2. 揭示了脑区特异性的计算原理: 研究表明,即使表现出相似的宏观活动模式(选择特异性序列),不同脑区也可能采用根本不同的微观编码方案和电路机制来执行相似的计算功能。这强调了在研究神经表征时,不仅要看“是否”编码,更要探究“如何”编码。 3. 连接了计算模型与实验数据: 研究通过将模型预测与大规模神经记录数据系统对比,为理论模型提供了实证支持,并利用数据区分了不同的候选机制。 4. 提出了可检验的因果预测: 研究基于不同模型(如相互抑制链 vs. 非耦合链;竞争链 vs. 吸引子)做出了不同的光遗传学扰动预测。这为未来通过功能靶向的扰动实验来因果性验证这些电路机制提供了明确的路线图。
五、 研究亮点
六、 其他有价值的内容
研究还讨论了这些模型更广泛的适用性,指出“位置”可以广义地理解为动物任何顺序推进的内部状态(如时间),因此模型也适用于非导航的决策任务。此外,研究建议可以将类似的模型和分析方法应用于训练好的循环神经网络,以揭示在更少明确结构约束的网络中,证据积累是如何实现的,这可能有助于发现新的计算原理。最后,研究提及近期电子显微镜研究提示后顶叶皮层中存在相互抑制的突触连接模式,这为竞争链模型提供了潜在的解剖学基础,并可通过针对性扰动进一步验证。