本文介绍了一项发表于第35届神经信息处理系统大会 (NeurIPS 2021) 的原创性研究,题目为《决策的机制性多区域循环网络模型》。该研究的主要作者为来自加州大学洛杉矶分校的 Michael Kleinman 和 Jonathan C. Kao,以及来自波士顿大学的 Chandramouli Chandrasekaran。本研究利用计算建模的方法,旨在阐明大脑多个区域如何协同工作以完成复杂认知任务。
研究的学术背景 行为与认知,如决策、感觉整合和运动控制,并非单一脑区独立完成的,而是源于多个互连脑区的协调计算。尽管单个脑区的神经活动可能包含与行为相关的信号,但我们通常难以区分这些信号是在该脑区内产生的,还是从上游脑区“继承”而来的。因此,理解这些行为背后的神经基础,需要理解神经活动在脑区内(区内)和脑区之间(区间)的动态演化过程。然而,目前我们缺乏清晰的假设来解释不同的脑区动力学和连接性如何与特定的计算功能相关联。循环神经网络 (Recurrent Neural Networks, RNNs) 作为强大的计算模型,已被广泛用于模拟和理解单个脑区如何执行特定任务。通过训练,RNN 能将实验设计的任务输入转化为行为相关的输出,其人工神经元的活动模式常常与执行类似认知或运动任务的大脑区域中观察到的神经活动相似。RNN 的一个关键优势在于其内部所有单元的活动及其循环连接性是“完全可观测的”,这为深入剖析计算机制提供了可能。然而,大多数现实任务涉及多个脑区,而对多区域计算的基本原则,我们的理解仍然有限。
为了填补这一空白,本研究提出了一个创新的方法:使用具有神经科学启发的架构约束的多区域循环神经网络 (multi-area RNNs),来探究多区域计算的原理。具体而言,研究者们旨在利用这种模型来理解一个特定的决策任务——“棋盘格任务” (checkerboard task),在该任务中,已知背侧前运动皮层 (dorsal premotor cortex, PMd) 及其上游脑区执行着不同的计算。研究的目标是:1)构建一个能模拟 PMd 在任务中观察到的动态特性的多区域 RNN 模型;2)利用该模型的可观测性,深入剖析不同区域的计算机制,以及信息如何在区域间选择性传播;3)提出关于大脑如何进行分布式计算的可检验假说。
详细的研究工作流程 本研究主要包含以下几个关键环节:
任务定义与数据准备: 研究对象是猴子执行“棋盘格任务”的行为和神经数据,以及用于模拟该任务的 RNN 模型。在任务中,猴子首先看到随机分配为红色或绿色的左右目标,随后观察一个由红绿方块组成的静态棋盘格,并判断其主要颜色,然后伸手触摸颜色匹配的目标。该任务巧妙地将颜色判断(色彩决策)和伸手方向判断(方向决策)分离开来。 研究分析了猴子在执行此任务时,背侧前运动皮层 (PMd) 的神经元活动记录数据(样本量未明确给出,但提到了对多个记录会话的分析)。这些数据作为评估 RNN 模型生物合理性的“金标准”。分析包括对群体活动轨迹的主成分分析 (Principal Component Analysis, PCA)、解混主成分分析 (demixed PCA, dPCA)、解码精度计算以及单个神经元的发放时间直方图 (Peri-Stimulus Time Histogram, PSTH) 和选择概率 (Choice Probability, CP) 分析。结果显示,PMd 的神经活动主要编码最终的方向决策,而对棋盘格颜色或目标配置等信息的编码很弱或接近随机水平。
多区域 RNN 模型设计与训练: 这是研究的核心部分。研究者设计了一个三区域的 RNN 模型。模型架构受到神经解剖学和生理学的严格约束:
模型分析与机制探索: 训练出能够成功执行任务且其最后一个区域(区域3)的活动与真实 PMd 数据高度相似的多区域 RNN 后,研究进入深入的机制分析阶段。这一部分充分利用了 RNN 完全可观测的特性,采用了多种分析方法:
主要研究结果 1. 生物学合理的多区域 RNN 成功模拟了 PMd 活动:研究发现,只有当 RNN 模型同时包含多个区域(至少三个)、遵循戴尔定律、并具有解剖学合理水平的前馈抑制时,其最后一个区域(区域3)的活动才会表现出与真实 PMd 数据相似的“最小充分”表征。具体表现为:区域3的神经轨迹(图2e)、dPCA 方差解释量(图2f)、t-SNE 可视化(图2g)、解码精度(图2h)、单单元 PSTH(图2i)和选择概率(图2j)都显示,该区域主要编码方向信息,而对颜色和上下文信息的编码接近随机水平。这一结果在广泛的机器超参数设置下是稳健的(图3f)。相比之下,传统的单区域 RNN 无法产生这种与 PMd 相似的表征。
多区域 RNN 揭示了上游区域的计算组织:对区域1的分析表明,虽然该区域同时表征了颜色、上下文和方向信息,但这些信息的编码并非完全独立。方向信息被清晰地分离到一个近乎正交的“方向轴”上,而颜色和上下文信息则混合在另外的轴上(图4)。重要的是,这个方向轴对颜色和上下文的输入投影接近于零,这意味着区域1已经构建了一个对下游决策至关重要的、相对纯净的方向信号表征。
区域间连接选择性地传播任务相关信息:对区域间前馈连接矩阵的分析揭示了信息传播的关键原理。研究发现,从上游区域活动定义出的“方向轴”与连接矩阵的潜能空间(尤其是顶部奇异向量)高度对齐,而“颜色轴”则与零空间的对齐方式类似于随机向量(图5a,b)。这表明,学习过程使得区域间连接被“调整”为优先传播与最终输出(方向决策)最相关的信息(方向轴活动),同时衰减或过滤掉任务后期不再需要的信息(颜色信息)。这种选择性传播并非简单地传递上游区域中方差最大的维度(如前两个主成分),而是对准了特定的信息内容。
输出区域采用赢家通吃机制实现决策:对区域3的详细分析显示,其内部结构支持一个简单的决策机制。读出权重是稀疏的,人工单元被分为两组,分别专用于左或右决策变量的输出。循环连接矩阵在经过排序后,显示出两个相互竞争的自兴奋池(左/右),它们通过一个共享的抑制池相互抑制(图6c-f)。这种结构使得网络能将一个渐进的方向证据输入,转化为一个明确的、二选一的决策输出。扰动实验证实了该机制的功能:增加对某一兴奋池的抑制,会系统性地将网络的选择偏向另一侧(图6g)。
研究的结论与意义 本研究构建并分析了一个受神经科学严格约束的多区域 RNN 模型,成功模拟了在感知决策任务中观察到的多脑区计算现象。其主要结论是:大脑皮层可能通过模块化计算和区域间连接的选择性调谐,来生成任务的“最小充分”表征。这意味着,在多阶段的信息处理流程中,当某些信息(如颜色)对于后续计算不再必要时,它会被逐步过滤或丢弃,而仅保留完成任务所必需的信息(如方向)。这种策略既简化了输出脑区的计算负担(如 PMd 仅需执行简单的赢家通吃决策),也体现了信息处理的效率原则。
该研究的科学价值在于: * 提供机制性见解:它超越了简单的相关描述,为多脑区如何协同工作提供了具体的、机制上的计算假说。模型的可观测性允许研究者深入剖析传统神经记录难以窥见的内部动态和连接性。 * 提出可检验假说:研究基于模型分析提出了多项可供未来实验验证的假说,例如:1)PMd 的上游脑区(如背外侧前额叶皮层 DLPFC)应表现出对颜色和方向信息的混合选择性,且其群体动力学具有特定的组织结构(方向轴正交于混合的颜色/上下文轴);2)这些上游脑区中方向轴的活动,应比其高方差的主成分更能预测下游 PMd 的活动。 * 建立方法论框架:本研究展示了一种将计算建模与神经科学约束紧密结合的新框架。它表明,在 RNN 训练中引入生物学合理的架构约束(多区域、戴尔定律、解剖连接比例),对于引导模型学习到生物上 plausible 的解决方案至关重要。这一框架可推广用于研究其他涉及分布式神经计算的认知和行为。
研究的亮点 1. 创新性的建模方法:首次系统性地将多区域架构、戴尔定律和特定水平的前馈抑制等多项神经解剖与生理约束,同时整合到用于研究高级认知功能的 RNN 模型中,并验证了这些约束对于产生生物合理性表征的必要性。 2. 对信息传播机制的精妙揭示:通过分析连接矩阵的潜能/零空间与信息轴的对应关系,清晰阐明了大脑区域间连接可能通过“通信子空间”选择性地传播任务相关信息,而非简单地传递高方差信号,这为理解脑区间信息流提供了新的计算视角。 3. 从建模到预测的闭环:研究不仅用模型拟合了已有数据,更利用模型的透明性深入挖掘出潜在的机制,并基于此提出了具体、可操作的实验预测,推动了计算神经科学与实验神经科学之间的深度对话。 4. 对“最小充分表征”计算原则的验证:通过模型展示了大脑如何在多阶段处理中实现有效的信息压缩和筛选,这一原则可能具有普适性,对理解智能系统的信息处理具有启发意义。