本文档介绍了一项由英国剑桥大学计算与生物学习实验室的研究人员Marine Schimel、Ta-Chu Kao和Guillaume Hennequin(部分工作期间任职于Meta Reality Labs)主导的研究。该研究于2024年发表于开放获取期刊《eLife》,具体版本为2024年8月13日修订的第三版。这是一篇神经科学领域的原创性研究论文,旨在探讨运动皮层在延迟性弹道式(ballistic)伸够运动(reach)中,其内部出现准备期活动(preparatory activity)的深层计算原理。
本研究试图解决一个核心科学问题:在延迟性伸够运动中,大脑初级运动皮层(M1)在运动开始前就出现与特定运动相关的活动模式,这种现象为何会产生?尽管传统观点认为这些“准备期活动”为运动的自主展开提供了初始神经状态“种子”,但近期的实验表明,在运动执行期间,持续的输入对M1同样重要,这削弱了对精确初始化的依赖。因此,运动准备在计算层面的必要性变得模糊。本研究从一个规范(normative)的视角出发,将M1建模为一个由外部输入驱动的动力学系统,并探究:为了最优地(以最小控制成本)完成快速延迟伸够任务,系统应如何控制?其核心目标是揭示运动准备活动出现的根本原因和条件。
研究的详细工作流程可以概括为以下几个主要步骤:
首先,研究者构建了一个用于模拟伸够运动的两层控制器模型。底层是一个经典的二关节机械臂生物物理模型,其运动由扭矩控制。上层则是一个包含200个神经元的循环神经网络(Recurrent Neural Network, RNN),用以模拟M1的群体动力学。该RNN的动力学由标准速率方程描述,其连接权重矩阵W被构造成具有抑制稳定网络(Inhibition-Stabilized Network, ISN)特性,这种网络已被证明能模拟猴子M1活动的主要特征。RNN的活动通过一个随机生成的读出矩阵线性解码为驱动机械臂的扭矩。至关重要的是,该RNN接收来自一个假设的“高级控制器”的外部输入u(t)。整个模型的关键在于,网络参数(W,读出矩阵等)并非为任务专门优化,而是固定的;但外部输入u(t)被设定为可通过优化计算得出。
其次,研究者将延迟伸够任务形式化为一个最优控制问题。他们定义了一个包含三个分量的成本函数:𝒥_target惩罚手部最终未能准确、快速到达目标;𝒥_null惩罚在指令信号(go cue)出现前手部有任何过早运动;𝒥_effort则惩罚整个任务期间外部输入的总能量(即输入幅度的平方和)。通过最小化这个总成本,可以求解出最优的时空输入轨迹u(t)。研究者特别强调,输入被允许出现在指令信号之前(准备期)和之后(运动期)的一个连续时间窗口内。这意味着优化算法可以自主地决定是采用“纯准备”(输入只在准备期)、“纯运动期驱动”(输入只在运动期),或是介于两者之间的任何混合策略。为了求解这个非线性动力学系统下的最优控制问题,研究采用了迭代线性二次型调节器算法(iLQR)。
第三,在确立了优化框架后,研究首先在一个高维ISN模型上进行验证。他们系统地改变任务中强制延迟的时间长度(δ_prep),并观察最优控制策略如何变化。为了量化策略对准备期的依赖程度,他们定义了一个“准备指数”(preparation index),即准备期输入能量与运动期输入能量之比。
第四,为了深入理解网络连接的哪些特性导致了最优准备策略的出现,研究者转向了更易于解析分析的低维(二维)线性网络模型。他们分别研究了两种反映M1动力学关键特征的连接模式:由前馈(feedforward)连接驱动的“非正态”(nonnormal)瞬态放大,以及由反对称(anti-symmetric)连接驱动的振荡动力学。他们构建了包含这两种模式的简化二维网络,并同样将其置于最优控制框架下,研究其准备行为如何随网络连接强度和读出方向的变化而改变。
第五,基于对低维模型的洞察,研究者希望将结论推广到高维网络。他们借助控制理论工具,提出了两个预测准备程度的标量指标:输出零空间的可观性(observability of the output nullspace, α)和读出方向的能控性(controllability of the readout, β)。直观上,α衡量了那些暂时不引起运动(处于输出零空间)但后续能有效驱动运动的神经活动模式的存在性;β则衡量了不依赖网络内部动力学、纯粹通过外部输入驱动读出方向的难度。他们在一系列参数各异的高维线性网络上计算了α和β,并通过回归分析检验它们对准备指数的预测能力。
第六,研究者将模型应用于更复杂的连续伸够运动序列。他们修改了成本函数,以模拟猴子实验中包含两个连续目标的“双重伸够”(double reach)和“复合伸够”(compound reach)任务。他们采用与实验数据分析相同的方法(子空间分析),识别模型网络活动中的“准备子空间”和“运动子空间”,并观察在执行运动序列时,准备子空间的占用率如何随时间变化。
本研究的主要结果如下:
在核心验证部分,研究者发现,对于ISN模型,最优控制策略确实涉及显著的运动准备。即使延迟时间δ_prep为零,最优输入也会在运动开始前出现。随着允许的准备时间增加,准备指数迅速上升并在约300毫秒后达到平台期(约1.3),同时任务总成本下降。这表明,拥有一个准备期改变了最优控制策略,并提升了任务表现。成本下降主要源于更快的运动执行和更小的控制输入能量。有趣的是,当准备时间超过300毫秒后,最优控制器并不会均匀地使用整个准备期,而是倾向于在运动开始前几百毫秒才集中输入,神经活动轨迹在不同延迟时长下高度相似。这被认为是网络动力学固有时间尺度导致的结果:过早的输入会被系统“遗忘”。
在对低维网络的分析中,结果清晰地展示了网络动力学与读出方向的交互如何决定准备策略。在非正态网络中,当读出方向与网络的“汇”(sink)模式对齐时,准备活动会沿着“源”(source)模式展开,从而利用网络自身的瞬态放大特性来高效驱动运动,此时准备指数较高。反之,若读出与“源”模式对齐,则准备无法带来益处,准备指数接近零。在振荡网络中,由于其旋转对称性,准备行为与读出方向无关,优化控制器总是通过准备将网络状态置于输出零空间中,以便在运动开始时利用网络的旋转流,从而也产生了较高的准备指数。
预测性分析取得了成功。在高维ISN网络中,一个简单的线性模型(准备指数 = k0 + k_α α + k_β β)能够极好地预测不同连接强度和 timescale 网络的准备指数(交叉验证R² = 0.93)。更重要的是,这一基于ISN拟合的模型,同样能够预测其他类型网络(如随机网络、振荡网络)的准备指数(R² = 0.69),证明了α和β作为通用预测因子的效力。结果确认了准备指数随α增大而增大、随β增大而减小的趋势,表明当网络存在易于观测的零空间且读出方向难以直接控制时,准备策略最为有利。
在运动序列建模中,模型成功地复现了关键的实验发现。对于有停顿的双重伸够,准备子空间的占用率在每次运动开始前都出现一个独立的峰值。更令人惊讶的是,对于无停顿的复合伸够,尽管可以视其为一个长时程运动,但最优控制策略依然导致了两个分离的准备高峰,一个在第一次运动前,另一个在第二次运动前。这为解释猴子M1在类似任务中观察到的“独立准备”现象提供了新的计算原理:由于网络动力学的时间尺度有限,为了在第一次运动减速后重新加速执行第二次运动,最优策略是在两次运动前分别进行输入驱动下的准备。
本研究的结论是:运动准备活动可以从运动皮层回路水平上的最优控制角度得到解释。当存在对控制输入的成本惩罚时,最优控制策略会利用准备期,提前将网络状态驱动到一个有利位置,以便在运动指令发出后,能更高效地利用网络自身的丰富动力学来生成运动指令,从而降低总体控制代价。准备的必要性和程度,可以由网络输出零空间的可观性(α)和读出方向的能控性(β)来预测。此外,最优控制框架也自然地解释了在运动序列中观察到的多次独立准备现象。
本研究的科学价值在于,它首次为运动准备提供了一个规范性的、基于最优控制的计算解释,弥合了“准备作为自主运动种子”和“运动期持续输入驱动”两种观点之间的间隙。它超越了以往研究中人为预设输入时间窗口的做法,让“是否准备”以及“如何准备”成为优化问题的解,从而揭示了其背后的计算逻辑。应用上,该框架为理解其他认知任务中的神经准备活动提供了新的思路和方法论。所提出的α和β指标,为从网络连接属性预测其计算功能提供了简洁有力的工具。
本研究的亮点包括:1) 核心发现的新颖性:为运动准备这一经典现象提供了全新的、基于最优控制的规范性解释。2) 方法的创新与系统性:结合了高维非线性网络模拟、低维模型解析、控制理论分析和任务序列建模,从多角度验证了核心假设。3) 预测模型的成功:成功提炼出两个控制理论指标(α, β),它们能够跨不同网络架构可靠地预测准备行为,建立了网络结构特性与计算功能之间的定量联系。4) 对复杂实验现象的解释力:模型不仅解释了单次运动的准备,还成功复现并解释了运动序列中“独立准备”这一非直觉的实验观察,增强了理论的说服力。
其他有价值的讨论包括作者对模型局限性的坦诚分析,例如:对输入施加二次型成本惩罚的数学便利性 versus 潜在的生物学合理性;模型中假设延迟时长已知,与实际任务中延迟不确定性的差异;以及将M1动力学与上游脑区输入严格区分的困难。作者也简要探讨了可能的扩展,如惩罚输入的时间变化率而非其幅度、或将模型推广至延迟不确定的情况(模型预测控制),并报告了初步实验结果,显示了框架的灵活性。这些讨论为后续研究指明了方向。