一项基于前额叶皮层表征几何推断行为策略的神经科学研究报告
一、 研究团队、发表期刊与时间
本研究的主要作者为Yichen Qian、Roger Herikstad和Camilo Libedinsky,他们来自新加坡国立大学(National University of Singapore)的心理学系和N.1健康研究所。这项研究工作于2026年发表在《自然-通讯》(*Nature Communications*)期刊上,文章编号为2850。
二、 学术背景与研究动机
本研究隶属于认知神经科学领域,具体聚焦于工作记忆(working memory)与行为策略(behavioral strategy)的神经机制。生物体在面对相同刺激时,能够采用不同的内部状态或策略来产生相似的行为反应,这种能力称为行为灵活性。然而,有些策略在行为层面上无法被直接区分,即它们会导致完全相同的外部可观察行为,这类策略被称为隐性策略(latent strategy)。例如,人类在执行工作记忆更新任务时,可能采用两种不同的策略:1)回想时检索策略(Retrieve at Recall strategy, R@R),即先以非注意形式编码记忆,在需要回忆时才将其转移到“注意”格式;2)复述并更新策略(Rehearse and Update strategy, R&U),即在线复述并随着新信息出现实时更新记忆内容。在动物模型中,这两种策略何者被采用,仅凭行为数据无法判断。
近年来,有研究开始利用训练来解决特定任务的循环神经网络模型(Recurrent Neural Network, RNN),通过对比模型与动物神经活动表征的相似性,来推断其可能使用的策略。这为探究隐性策略提供了新途径。在此背景下,本研究旨在利用这种“模型-神经数据对比”的方法,通过分析猴子在执行工作记忆更新任务时,其大脑两个前额叶皮层区域——外侧前额叶皮层(Lateral Prefrontal Cortex, LPFC)与前弓状皮层(Pre-Arcuate Cortex, PAC)——神经活动的表征几何(representational geometry),并将其与使用不同策略(R@R 或 R&U)训练的RNN模型活动几何进行比对,从而推断猴子在执行该任务时所采用的隐性行为策略。
三、 详细研究流程与方法
研究流程可分为几个核心部分:实验任务设计与动物训练、神经网络模型训练与策略定义、神经电生理数据采集、以及多层次的神经表征分析。
1. 实验对象与任务设计: 研究使用了两只成年雄性猕猴(*Macaca fascicularis*)。它们被训练执行一个双项目延迟眼跳工作记忆更新任务。每个试次开始于一个固定点注视期,随后依次呈现两个视觉项目(Item 1 和 Item 2),每个项目呈现后有1秒的记忆延迟期(Delay 1 和 Delay 2)。关键点在于:第一个项目(Item 1)始终是红色的目标方块;第二个项目(Item 2)则可能是新的红色目标(Target-Target, T/T试次)或绿色的干扰物(Target-Distractor, T/D试次)。在第二个延迟期后,固定点消失作为“执行”信号,猴子需做出眼跳运动至最后一个呈现的目标的位置(T/T试次是Item 2, T/D试次是Item 1)。任务要求猴子根据Item 2的类型,动态更新或维持其工作记忆内容。
2. 神经数据采集: 研究人员在每只猴子的左脑LPFC(布罗德曼9/46区)和PAC(8a区)慢性植入了多个微电极阵列,共记录了来自LPFC的89个神经元和PAC的129个神经元(总计11个记录会话)。神经信号通过128通道的Grapevine系统记录。分析仅基于正确(受奖励)试次。
3. 循环神经网络模型构建与训练: 研究者构建了具有输入层、循环层和输出层的RNN模型。为了模拟不同的行为策略,他们通过改变训练时的损失函数来“强制”模型学习特定的策略: * R&U策略模型:训练时要求网络在Delay 1期间输出Item 1的位置,在Delay 2期间输出最终目标(T/T为Item 2, T/D为Item 1)的位置。这迫使网络在线复述并更新信息。 * R@R策略模型:训练时要求网络在Delay 1期间所有输出单元保持平均活动,仅在Delay 2期间输出最终目标的位置。这模拟了早期非注意编码、后期选择性提取的机制。 研究者为每种策略训练了100个具有不同初始权重的RNN模型,直至其任务准确率达到95%以上。
4. 数据预处理与伪群体构建: 对于神经数据,首先计算了每个神经元的发放率并进行Z-score标准化。由于不同猴子实验时间参数略有差异,进行了时间对齐处理。为了获得足够的统计样本量,研究者通过从每次记录会话中为每个条件抽取等量试次,并将所有神经元的反应组合起来,构建了100个伪群体(pseudo-population)活动数据集,用于后续分析。
5. 多层级表征几何分析: 这是本研究的核心方法学部分。研究者将神经群体活动或RNN循环层活动降维后,进行了多层次、多指标的几何比较。 * 降维:首先对每个伪群体或RNN的活动进行主成分分析(PCA),选取前15个主成分(解释>90%方差)定义“全状态空间”(full state space)。 * 全空间解码与代码动态分析: * 跨时间解码:训练线性判别分析(Linear Discriminant Analysis, LDA)解码器,分析目标位置信息在不同时间点的可解码性。 * 代码稳定性:计算延迟晚期(最后500毫秒)同一延迟期内不同时间点解码准确率的比值,衡量神经编码随时间的稳定性。 * 代码形变:针对T/D试次,计算目标位置编码在Delay 1和Delay 2之间的可迁移性,比值低表示编码跨时间不变(即未发生形变)。 * 子空间几何分析: * 子空间估计:对于特定项目和延迟期(如Delay 1的Item 1),使用一种适配的方法估计其神经活动所在的二维子空间。这个方法参考了Panichello & Buschman (2021)的工作,通过两次PCA过程找到最能区分不同位置信息的2D平面。 * 几何关系度量: * 共面性:计算两个子空间法向量夹角的余弦值,衡量它们是否在同一平面。 * 对齐度:计算将一个子空间中的位置表征配置旋转至与另一个子空间配置对齐所需的最小旋转角的余弦值,衡量两个子空间中表征模式的相似性。 * 代码可转移性比率:在一个子空间上训练的解码器,在另一个子空间上测试的性能,与在相同子空间上测试的性能之比。 * “读出”子空间轨迹分析: * 定义了一个“读出”子空间,该子空间基于Delay 2晚期所有试次中最终目标位置的信息进行估计。 * 漂移比:计算在“读出”子空间中,Delay 1晚期到Delay 2晚期群体活动轨迹的欧几里得距离。然后比较T/T试次和T/D试次的漂移距离之比。该比值低意味着只有当信息需要更新(T/T试次)时,活动轨迹才发生显著变化;若信息不需更新(T/D试次),轨迹保持稳定。 * 统计检验:所有度量的显著性均通过将观察到的分布与标签随机重排(shuffle)生成的基线分布进行比较来确定。此外,还使用Kolmogorov–Smirnov检验和Kullback–Leibler散度来量化不同模型与大脑区域之间分布相似性。
四、 主要研究结果
分析结果在多方面一致地表明,LPFC和PAC的神经活动表征几何与采用R&U策略训练的RNN模型高度相似,而与R@R策略模型显著不同。
1. 代码动态性结果: * 代码稳定性:在Delay 2期间,两个大脑区域和两种RNN模型都表现出稳定的编码(稳定性比值接近1)。然而,在Delay 1期间,R&U模型、LPFC和PAC的编码同样稳定(与Delay 2无显著差异),但R@R模型在Delay 1的编码则显著更不稳定。这表明R@R模型的早期编码可能处于一种与后期输出不同的、更动态的状态。 * 代码形变:在T/D试次中,目标位置信息(Item 1)需要在Delay 1和Delay 2中保持。分析发现,R&U模型、LPFC和PAC中,目标编码在两个延迟期间可迁移性高(形变比值低,不显著),表明编码未发生显著改变。相反,R@R模型在两个延迟期间的编码则发生了显著形变。这与R@R策略预测的早期非“读出”格式编码、后期转换的机制相符。
2. 子空间几何结果: * 在T/T试次中,比较了编码Delay 1期间Item 1位置的子空间与编码Delay 2期间Item 2位置的子空间。 * 共面性与对齐度:在LPFC、PAC和R&U模型中,这两个子空间高度共面且对齐,表明它们是同一个或极度相似的子空间。相反,在R@R模型中,这两个子空间既不共面也不对齐。 * 代码可转移性:在R&U模型和两个大脑区域中,两个子空间间的代码可转移性比率高(不显著低于基线),而在R@R模型中该比率显著降低。 * 这些结果强有力地支持,在使用R&U策略时,新旧目标信息被编码在相同的“读出”子空间中;而使用R@R策略时,信息在早期被存储在一个与后期读出不同的子空间中。
3. 读出子空间轨迹结果: * 分析发现,LPFC、PAC和R&U模型共享一个在Delay 2期间编码最终目标信息的“读出”子空间。 * 漂移比:R&U模型、LPFC和PAC表现出非常低的漂移比(接近0),意味着在T/D试次(信息不变)中,从Delay 1到Delay 2的活动轨迹几乎无变化;而在T/T试次(信息更新)中,轨迹则发生显著漂移。相反,R@R模型的漂移比接近1,意味着无论信息是否需要更新,其活动轨迹在两个延迟期之间都发生了相似程度的变化。这直观地展示了R&U策略的“在线更新”特性与R@R策略的“格式转换”特性。
4. 综合对比: 所有的统计比较(K-S检验、KL散度)均一致显示,LPFC和PAC的神经活动分布在各项指标上均更接近R&U模型,而与R@R模型存在显著差异。即使分析表现仅达到~70%准确率的RNN模型,或分别分析单只猴子的数据,主要结论仍然稳健。
五、 研究结论与意义
本研究的核心结论是:猴子在执行该工作记忆更新任务时,采用了隐性策略中的“复述并更新”策略,而非“回想时检索”策略。 尽管LPFC(主要负责工作记忆维持)和PAC(更多涉及眼动准备)在功能和时间动态上有所不同,但两者在任务中的表征几何均共同指向了R&U策略,表明这是动物整体采用的任务解决策略。
科学价值: 1. 方法学创新:本研究成功示范了如何通过精细比较生物神经网络与人工神经网络(RNN)的表征几何,来推断无法从行为直接观测的隐性认知策略。这为认知神经科学研究提供了一种强大的新工具。 2. 策略推断:首次在动物模型中,利用神经信号明确推断出其在使用哪种工作记忆更新策略,揭示了猕猴在该任务下的特定认知操作模式。 3. 跨区域一致性:发现功能侧重不同的前额叶亚区(LPFC和PAC)在表征几何上表现出策略层面的一致性,强调了在探究高级认知策略时,需要从网络或整体行为策略的层面进行理解。 4. 连接计算模型与神经机制:深化了对RNN作为认知策略计算模型的理解,并展示了如何利用模型的可解释性来洞悉大脑的工作机制。
应用价值与未来方向:该研究框架为探索策略学习过程、以及在多种可行策略并存时生物体如何选择和决策的神经机制开辟了道路。未来可应用于研究学习过程如何导致特定策略的形成,或探索决策系统如何在不同策略间进行权衡与选择。
六、 研究亮点
七、 其他有价值的内容
研究在讨论部分还指出,R&U和R@R策略可能由不同的神经机制(如持续活动、活动静默的短时程可塑性、动态编码等)或表征格式(注意与非注意)来实现。本研究的目标并非探究工作记忆的具体神经实现机制,而是关注更高层次的策略识别。此外,研究承认这并不意味着R&U是猴子能使用的唯一策略,人类研究显示策略选择可能受任务条件和学习阶段影响。这为后续研究留下了空间,例如探索为何动物在特定任务中偏好某一策略,以及这种偏好是如何通过学习和决策形成的。