该研究的主要作者包括Andrei Khilkevich、Michael Lohse、Ryan Low、Ivana Orsolic、Tadej Bozic、Paige Windmill和Thomas D. Mrsic-Flogel,他们主要来自英国伦敦大学学院萨恩斯伯里威康神经回路与行为中心。这项研究成果以“Brain-wide dynamics linking sensation to action during decision-making”为题,于2024年10月24日发表在国际顶级学术期刊《自然》(*Nature*)上。
这项研究属于系统神经科学和认知神经科学领域,聚焦于感知决策的基本神经机制。感知决策依赖于将感觉证据与适当行为联系起来的学习关联,涉及对相关输入的过滤和整合,以准备和执行及时的反应。尽管任务相关的表征具有分布式特性,但感觉输入、证据整合、运动计划和执行之间的转换是如何在大脑多个区域和神经活动维度上协调进行的,此前仍不清楚。特别是在面对模糊感觉信息时,大脑被认为会随时间逐渐积累相关输入,形成一个决定后续选择的整合神经表征。传统观点认为证据积累主要发生在前额叶-前运动皮层和后顶叶皮层等特定区域。然而,近期研究揭示,在受过训练的动物大脑中,感觉输入、选择和动作的表征广泛分布,这引发了一个关键问题:感觉输入究竟在哪里以及如何被转化为引导行动的整合任务相关表征?这些表征的分布有多广泛?此外,特定大脑区域是否因其固有特性而专门负责感觉证据整合,还是学习过程塑造了这一计算的本质?本研究旨在解决这些问题,探究在决策过程中,整合的感觉证据是如何被转化为选择和最终行动的。其核心目标是理解感觉输入到动作的全脑转化过程,揭示大脑如何在分布式网络中协调证据积累、行动准备和执行。
本研究采用了严谨的实验工作流程,主要包括行为任务训练、全脑神经活动记录、数据分析与建模以及多维度验证等环节。研究使用小鼠作为模型动物,共21只雄性C57BL/6J小鼠,其中15只用于训练后的电生理记录,6只作为未训练对照组。
1. 行为任务设计与训练: 研究采用了一项视觉变化检测任务,要求小鼠在头部固定的同时观察一个漂移光栅刺激。该光栅的速度(时间频率,temporal frequency, TF)在1赫兹的几何平均数附近每50毫秒随机波动。小鼠的任务是报告其速度的持续增加(变化期),并通过舔舐奖励管来获得奖励。任务设计的关键在于将持续的感觉证据观察与运动相关活动分离开来。在长达3至15.5秒的基线期内,小鼠必须保持静止(任何舔舐或跑轮运动都会导致试验中止),持续追踪模糊的感觉刺激。变化发生的时机和幅度是随机且不可预测的,这迫使小鼠必须整合一段时间内的感觉证据才能做出准确判断。小鼠的表现随刺激变化幅度的增大而提高,反应时间也随之缩短,符合需要时间整合的反应时任务特征。对基线期内“过早舔舐”的分析表明,在舔舐前约0.3到1秒,平均刺激速度有所增加,证明感觉信息在数百毫秒的时间尺度上影响着小鼠的判断。
2. 全脑电生理记录: 在训练后的小鼠执行任务时,研究人员使用高密度硅电极(Neuropixels探针)进行了大规模电生理记录。记录覆盖了51个大脑区域,包括皮层、基底节、海马、丘脑、中脑、小脑和后脑,共获取了15,406个神经元单元的数据(在12,772个来自记录良好稳定神经元的区域)。同时,还通过高速摄像记录了小鼠面部、瞳孔以及跑轮的运动。为了进行比较,研究人员还在6只未训练的小鼠(6,215个神经元单元)暴露于相同刺激但接受随机奖励(即未学习刺激-奖励关联)的情况下进行了记录。
3. 数据分析与建模方法: 为了识别编码视觉证据(刺激TF)、舔舐准备和舔舐执行的神经元,研究采用了单细胞泊松广义线性模型。该模型拟合了来自任务相关事件、刺激和行为的试次间神经活动,并通过交叉验证的嵌套测试来评估不同预测变量对神经活动的贡献。这种方法能够可靠地区分感觉、决策和运动信号。 为了量化感觉证据在全脑的传播和整合,研究人员分析了神经元对基线期内瞬时TF脉冲(快速或慢速)的反应,测量了其峰值时间和反应持续时间。他们还设计了分析来检验两个连续快速TF脉冲之间是否存在反应促进(即整合效应)。此外,通过构建模拟小鼠行为策略(整合策略与异常值检测策略)的模型,并结合对行为数据的分析,证实了小鼠确实使用了时间尺度约为0.25秒的证据整合策略。 为了理解运动准备和执行期间的神经动力学,研究采用了基于子空间的分析框架。通过将群体活动分解到由口面部运动核活动定义的“运动”维度(movement dimensions)及其正交的“运动无关”维度(movement-null dimensions)上,来检验准备期活动是存在于运动子空间还是与其正交。这一方法新颖地应用于全脑多个区域的分析中。
4. 结果与发现: (1)感觉证据的全脑广泛表征: 研究发现,在训练过的小鼠中,编码行为相关感觉输入(刺激TF波动)的神经元虽然稀疏,但分布极为广泛,几乎遍布除控制口面部运动的脑干核团外的所有脑区。这些“TF响应单元”不仅在视觉系统(视觉皮层、视觉丘脑、上丘浅层)中大量存在,在前额叶-运动皮层、基底节、海马、中脑和小脑中也有显著比例(5-25%)。相比之下,运动(舔舐执行)信号在全球范围内由超过50%的神经元编码,舔舐准备活动也在全球分布。未训练小鼠仅在视觉系统和部分中脑区域表现出显著的TF响应,而在前额叶-运动皮层、小脑、纹状体等区域则没有,这表明非视觉区域的证据表征在很大程度上是随着学习而出现的。
(2)感觉反应时间尺度的跨脑区演变: 早期视觉系统(如外侧膝状体背侧复合体、初级视觉皮层)对快速TF脉冲的反应最早、最短暂,能忠实跟踪刺激变化。相反,视觉系统外含有TF响应单元的脑区(如前额叶-运动皮层、基底节、小脑、中脑和丘脑的部分区域)反应显著延迟,且反应持续时间更长,通常持续数百毫秒,远超过触发反应的刺激样本本身(50毫秒)的时长。这种延长的反应为整合多个连续的证据样本提供了神经基础。
3. 前运动区的并行感觉整合: 行为分析证实小鼠使用了时间尺度约为0.25秒的“泄漏性”证据整合策略来引导行为。神经数据分析显示,在非视觉脑区,特别是前额叶-运动皮层、基底节、小脑、中脑和特定丘脑核团,连续快速TF脉冲能引起反应的显著促进(即第二个脉冲的反应因第一个脉冲而增强),这种促进效应在约0.2-0.4秒的脉冲间隔时最明显,与行为整合时间尺度相符。反应促进的程度与单个脉冲反应持续时间跨脑区相关。在刺激变化期,这些具有整合能力的区域(如次级运动皮层,MOS)的神经活动呈现斜率随变化幅度增加的“斜坡”式上升,且这种斜坡活动主要由TF响应亚群驱动,其开始和达到峰值的时间显著早于非响应群体。使用广义线性模型分离出的视觉响应成分进一步证实,这些区域的TF响应神经元在变化期表现出斜坡式的整合活动,而早期视觉区域则只表现出阶梯式的持续反应,表明其只传递变化信号而不进行整合。
4. 学习塑造广泛的感覚整合: 关键发现是,感觉证据在视觉系统外的表征和整合能力主要依赖于学习。未训练小鼠的这些脑区没有表现出显著的TF响应或整合特性。此外,研究检验了“内在时间尺度”假说,即每个脑区神经活动的自相关时间常数决定了其任务相关反应的持续时间。然而,研究发现,无论是在跨脑区水平还是在单个神经元水平,在无任务和运动的试次间期测量的内在时间尺度,都无法预测对TF脉冲的反应持续时间或整合时间。并且,内在时间尺度在训练和未训练小鼠中是相似的,表明它是脑区的固有属性,不受学习影响。因此,证据整合的时间尺度独立于区域的固有动力学,而是由任务经验塑造的。
5. 证据编码细胞启动准备活动: 研究发现,在能够整合感觉证据的脑区(如前额叶-运动皮层、基底节、小脑、中脑),TF响应神经元群体对快速TF脉冲的反应模式与它们在舔舐准备期的活动模式高度一致(即群体向量对齐)。这意味着对感觉证据反应增强的神经元,在动作准备期也倾向于活动增强。而在不整合证据的区域(如早期视觉区)则没有这种对齐关系。更重要的是,在刺激变化期、动物决定舔舐之前,TF响应神经元亚群的活动开始显著早于非响应亚群,且这种启动时间的早晚与脑区整合证据的时间尺度(脉冲反应持续时间)呈负相关:整合时间越长的区域,其TF响应群体启动准备活动越早。这表明证据的积累直接推动了多个脑区准备活动的建立。
6. 环绕动作的全脑正交动力学: 通过子空间分析,研究揭示了一个普遍的计算特征:在大多数关联和前运动脑区,舔舐准备期的神经群体活动主要占据与运动执行子空间正交的“运动无关”子空间。在舔舐开始后,活动几乎同时在全脑范围内从运动无关子空间过渡到运动子空间。这种状态转换部分源于运动无关子空间内的活动在动作开始后达到峰值并急剧下降。进一步分析发现,TF响应亚群对运动无关子空间内的准备活动有不成比例的贡献。一旦动作开始,即使刺激变化仍在持续,TF响应单元对运动无关子空间的贡献迅速下降到随机水平,表明证据积累过程在动作承诺后“重置”。最后,研究证实,在早期视觉系统之外的区域,对TF脉冲的群体反应主要与第一运动无关维度对齐,并且连续证据脉冲的整合也主要发生在这个维度上。这解释了感觉证据如何能够在广泛脑区招募活动,而不直接驱动运动执行。
本研究的结论是,它描绘了证据整合、运动准备和执行——这些决策核心过程——的全脑神经实现机制,揭示了将模糊感觉证据转化为目标导向行为的全局性神经原理。证据整合是一种随着学习而出现的广泛现象,由遍布大多数前运动脑区的稀疏神经元群体并行实现。在这些神经元中,整合时间尺度独立于区域的固有动力学,由任务经验塑造。关键的是,证据整合和运动准备在全脑范围内编码于群体活动的同一正交子空间(运动无关子空间)中,与运动执行动力学分离。该子空间的活动由整合证据的神经元驱动,并在动作开始时崩溃,使整合过程得以重置,随后活动同步转换到不同的子空间以执行运动。这项工作在全脑尺度上将证据积累与运动动力学联系起来,将运动控制和决策领域的核心概念统一到一个共同框架中,用于理解感觉证据如何通过全局神经机制控制行为。
这项研究的科学价值和亮点十分突出。首先,它揭示了证据整合并非局限于少数“高级”皮层区域,而是一个高度分布式、多区域的并行计算过程,由学习塑造并在稀疏神经元群体中实现。这改变了我们对决策神经基础的传统认识。其次,研究明确区分并关联了证据整合、运动准备和运动执行这三个关键阶段的神经动力学,首次在全脑尺度上展示了它们如何通过正交的子空间架构进行协调和转换。这种正交化架构允许证据积累在不直接引发运动的情况下进行,为理解灵活的行为控制提供了机制性解释。第三,研究通过严谨的对照实验(未训练动物)和创新的分析方法(分离内在时间尺度与任务相关整合时间),有力论证了学习在塑造广泛分布式感觉-运动转换中的决定性作用,而非仅仅依赖脑区的固有属性。第四,方法学上,结合了复杂的感知决策行为范式、高密度全脑神经记录、精细的广义线性模型以及先进的群体子空间分析,为在自然行为背景下解析全脑动力学设立了新的标杆。这些发现不仅深化了我们对感知决策基本机制的理解,其揭示的广泛分布式计算和正交动力学原则,对于构建更接近生物现实的脑启发人工智能模型、以及理解相关神经精神疾病(如决策障碍)的病理机制也具有重要的启示意义。