小脑内部模型校准感觉运动控制中的反馈控制器

分享自：
小脑内部模型校准感觉运动控制中的反馈控制器

期刊:Nature CommunicationsDOI:10.1038/s41467-021-26988-0
关于小脑内部模型校准感觉运动控制中反馈控制器的研究报告
本研究由来自德国马克斯·普朗克神经生物学研究所的Daniil A. Markov、Luigi Petrucco、Andreas M. Kist以及慕尼黑工业大学系统神经科学研究所的Ruben Portugues共同完成，相关论文于2021年发表于《自然-通讯》（*Nature Communications*）期刊。
一、 学术背景 本研究属于神经科学与行为学交叉领域，聚焦于动物如何适应环境变化以维持精确运动控制这一核心问题。动物主要通过两种机制实现行为适应：反馈控制和基于内部模型的控制。反馈控制器能在不同环境条件下，通过实时监测误差并做出反应，将动物的感觉状态维持在期望水平。而内部模型则通过学习运动输出与其感觉后果之间的关系，能够预测性地调整行为，实现长期校准。小脑被广泛认为是脊椎动物中编码内部模型的关键脑区，但其具体作用机制以及与在线反馈控制系统的交互关系尚不完全清楚。
研究团队以幼年斑马鱼为模型，利用其视动反应（Optomotor Response, OMR）——一种动物向感知到的全场视觉运动方向转向和移动的本能行为——作为研究范式。OMR可被理解为一个试图将视觉光流（optic flow）归零的反馈控制系统。前人研究表明，当幼鱼在游泳时接收到比预期少的视觉反馈（即视觉重传入，visual reafference）时，它们会通过延长游泳持续时间（bout duration）来做出“急性反应”（acute reaction）。有假设认为这种急性反应依赖于小脑内部模型对预期感觉的预测。本研究旨在重新审视这一假设，探究OMR及其对感觉反馈扰动的反应究竟是由简单的反馈控制实现，还是依赖于内部模型，并阐明小脑在长期行为适应中的具体作用。
二、 详细研究流程 本研究包含一系列紧密衔接的行为学实验、计算建模和神经功能成像实验，流程如下：
急性反应的行为表征与反馈控制模型构建
研究对象与样本量：使用野生型（TL品系）6-8日龄斑马鱼幼鱼。在急性反应实验中，对大量幼鱼（n=100条模型拟合数据点，代表多次实验）进行了测试。
实验方法与处理：采用头部固定的闭环实验装置。幼鱼被包埋在琼脂糖中，尾部可自由摆动。前方屏幕显示向后移动的条纹（光流），诱发其向前游泳的OMR。通过高速相机实时追踪尾部运动，并估算其“虚拟前进速度”。关键创新在于，研究者可以程序化地控制这个估算速度如何从刺激速度中减去，从而人为制造视觉重传入的扰动。他们设计了三种扰动模式：(i) 增益变化：改变闭环增益，使幼鱼游泳时获得多于或少于正常的视觉反馈；(ii) 延迟：在游泳行为与其视觉反馈之间引入人为时间延迟；(iii) 增益骤降：在游泳过程中特定时间段内将反馈增益设为零。
数据分析：测量在不同扰动条件下游泳持续时间（bout duration）和间歇期持续时间（interbout duration）的变化，并分析尾部摆动幅度（bout power）的时间动态。
模型开发：基于“OMR旨在将积分后的光流归零”这一核心思想，研究者构建了一个反馈控制计算模型。该模型包含三个部分：感觉部分（加权处理前向/后向光流速度）、感觉整合部分（对加权后的感觉输入进行时间积分，产生“感觉驱动力”）、以及运动输出生成部分（当感觉驱动力达到阈值时产生运动指令，并通过一个“疲劳度”积分器确保游泳的终止）。模型参数通过拟合正常重传入条件下的行为数据进行优化。
验证反馈控制模型的关键假设：光流整合的神经基础
研究对象与样本量：使用在全神经元表达GCaMP6s钙指示剂的转基因斑马鱼幼鱼（n=6条），进行全脑功能成像。
实验方法与处理：在定制搭建的光片显微镜结合行为装置的平台上，记录幼鱼执行OMR时的全脑神经元活动。通过分析神经元在光流刺激开始和游泳开始时的钙活动，将感兴趣区域（ROIs）分为感觉相关和运动相关两类。
数据分析：特别关注感觉相关ROIs，对其钙信号轨迹拟合泄漏积分器模型，以估计其整合时间常数，从而寻找执行光流时间积分的神经基质。
长期行为适应及其小脑依赖性验证
研究对象与样本量：使用野生型斑马鱼幼鱼进行长期适应行为实验（正常重传入对照组n=103，延迟训练组n=100）。使用表达硝基还原酶（NTR）的转基因品系（Purkinje细胞特异性）进行小脑浦肯野细胞（Purkinje Cells, PCs）消融实验（治疗对照组和PC消融组，每组约85-90条）。
实验方法与处理： 长期适应协议：实验分为校准、适应前、适应期、适应后四个阶段。适应期持续大量试次，对延迟训练组施加持续的视觉反馈延迟（225毫秒）。通过分析每个试次中第一次游泳的持续时间，来评估长期适应性变化，避免单次试次内短期记忆的影响。
PC消融：利用NTR/MTZ（甲硝唑）药理学遗传学方法，特异性消融表达NTR的PCs。通过共聚焦显微镜成像验证消融效率（细胞肿胀、消失，神经纤维结构破坏）。
数据分析：比较不同组别在适应期开始时（急性反应）、适应期结束时（急性反应减弱）、以及适应后阶段（后效，after-effect）的游泳持续时间变化。同时，分析游泳初期“弹道期”（ballistic period，约220毫秒内，尾部摆动不受当前反馈影响）的尾部摆动幅度，作为神经元控制器状态变化的读数。
小脑内部模型活动的在体成像
研究对象与样本量：使用在PCs中特异性表达GCaMP6s的转基因斑马鱼幼鱼（n=25条），在光片显微镜下进行小脑功能成像。
实验方法与处理：执行修改版的长期适应实验（缩短适应期，延长适应后期以稳定记录），同时记录PCs的钙活动。
数据分析：计算每个PC ROI在每次试次中第一次游泳触发后的反应幅度。通过衡量其在四个关键实验转换期（如延迟反馈首次出现、适应期、反馈恢复正常、适应后期）的反应变化，为每个ROI分配一个四位数三元条形码（如“0-0+”表示在适应期反应逐渐下降，在适应后期逐渐回升）。通过比较不同行为表现组（正常对照组、延迟训练但未适应组、延迟训练且适应组）中具有特定活动模式的PCs比例，寻找可能代表内部模型输出的神经元群体。
长期适应过程中感觉整合特性的变化
研究对象与样本量：使用全脑成像的转基因鱼（正常对照组n=12，延迟训练未适应组n=13，延迟训练适应组n=6）。
数据分析：分析在长期适应实验过程中，感觉整合ROIs的时间常数如何变化，探究小脑内部模型的校准是否影响了前脑反馈控制器中感觉整合器的特性。
三、 主要研究结果 1. 急性反应可由反馈控制器实现，无需内部模型：行为实验表明，幼鱼对所有类型的意外视觉反馈扰动都表现出复杂的急性反应，例如增益降低或反馈延迟会延长游泳时间。关键发现是，行为改变发生在扰动开始约220毫秒后，这与视觉反馈处理的延迟时间一致，提示了一个基于延迟反馈的控制机制。计算模型成功复现了所有观察到的精细行为模式（如增益变化的非线性效应、延迟与分流延迟对间歇期的不同影响、增益骤降时机的影响等）。这表明，OMR的急性反应可以通过一个整合光流的简单反馈控制器来解释，而无需调用内部模型进行在线预测。 2. 幼鱼脑内存在光流整合的神经基质：全脑功能成像发现，位于背侧中缝核、顶盖前区和丘脑等脑区的感觉相关神经元表现出对光流刺激的整合特性，其活动可以用泄漏积分器模型很好地拟合。这为上述反馈控制器模型中的“感觉整合器”提供了生物学证据。 3. 幼鱼能对长期持续的反馈扰动进行行为适应，且该过程依赖小脑：长期适应实验显示，经历持续延迟反馈的幼鱼，其急性反应幅度会随着时间逐渐减弱（适应），并在反馈恢复正常后表现出明显的后效（游泳时间缩短）。更重要的是，游泳初期弹道期的尾部摆动幅度在适应后显著增加，表明控制器的内部状态发生了持久改变。PC消融实验提供了关键证据：消融PCs并不影响幼鱼对意外扰动的急性反应能力（甚至反应更强），但完全破坏了长期适应过程——适应期内的急性反应减弱现象和弹道期摆动幅度的增加均消失。这证明小脑对于长期适应至关重要，但对于在线反馈控制本身并非必需。 4. 小脑中存在活动模式符合内部模型输出的神经元群体：PC功能成像发现，仅在成功适应延迟的幼鱼组中，显著富集了一类具有特定活动模式（条形码为“0-0+”）的PCs。这类PCs的活动在适应期逐渐降低，在适应后期逐渐恢复至基线水平。这种活动模式与预期感觉反馈信号的变化一致：当动物学会预测延迟（即更新了内部模型）后，预期与实际反馈的失配减少，因此编码“预期误差”或“感觉预测”的信号减弱。该活动模式不能简单地用运动输出本身来解释，强烈提示其代表了校准中的内部模型的输出。 5. 长期适应伴随感觉整合时间常数的改变：全脑成像分析进一步发现，成功适应的幼鱼，其脑内感觉整合神经元的时间常数倾向于减小。这提示小脑内部模型可能通过校准反馈控制器中感觉整合器的时间常数等参数来实现长期行为适应。
四、 研究结论与意义 本研究系统性地阐明，斑马鱼的视动反应及其对意外感觉扰动的快速调整，主要由一个小脑非依赖的反馈控制机制实现。然而，当环境变化（感觉-运动关系）持久且可预测时，小脑依赖的内部模型会被调用，用于校准该反馈控制器的状态或参数，从而实现长期行为适应。小脑内部模型通过监测运动指令副本和感觉后果，学习其传递函数，并在检测到持续偏差时进行更新，进而调整下游运动控制回路（如改变感觉整合时间常数或运动增益）。
科学价值： 1. 厘清了两种控制机制的界限与协作：清晰区分了在线反馈控制与基于内部模型的预测性校准在不同时间尺度上的作用，并揭示了它们之间的层级关系——内部模型作为“校准器”作用于反馈控制器。 2. 确立了小脑在感觉运动学习中的具体角色：通过精密的损失性功能实验和活体成像，直接证明了小脑对于长期感觉运动适应是必需的，但对于在线反应性控制不是必需的，并首次在活体动物中识别出具有内部模型预期信号特征的小脑神经元活动。 3. 提供了从行为到环路的多层次证据链：结合定量行为分析、计算建模、全脑及特定细胞类型功能成像、以及细胞特异性消融，构建了一个从算法（反馈控制vs内部模型）、到实现（特定脑区与神经元类型）、再到功能（行为输出）的完整论证体系。 4. 提出了新的神经环路框架：将OMR的反馈控制环路映射到斑马鱼脑区：视网膜方向选择性细胞→顶盖前区（感觉整合器）→中脑内侧纵束核及后脑运动前区。小脑则通过其输出（可能经由顶盖前区或直接作用于运动前区）来校准该环路的参数。
五、 研究亮点 1. 精巧的实验设计：利用闭环虚拟现实系统，能够精确、灵活地操控视觉重传入的增益、时序和模式，为定量研究感觉运动控制提供了强大工具。 2. 计算模型与实验的紧密结合：提出的反馈控制模型不仅复现了复杂的行为现象，还做出了可验证的预测（如感觉整合的存在），并指导了后续的神经科学研究。 3. 关键性的因果验证：使用PC特异性消融实验，提供了小脑对于长期适应必要而非对于急性反应必要的强有力因果证据，这是区分两种机制的核心。 4. 在体神经活动记录与行为关联：在动物执行适应性行为的同时，记录全脑及小脑特定神经元的活动，并解码出与内部模型校准过程相关的特定活动模式，将抽象的计算概念与具体的神经活动联系起来。 5. 跨层次整合：研究成功地将行为定量分析、计算理论、系统神经科学和分子遗传学工具结合在一起，形成了一个非常完整和具有说服力的故事。
六、 其他有价值的内容 研究还发现，即使在从未经历扰动反馈的“正常重传入”对照组中，弹道期游泳功率也会随着实验进行而增加。作者推测，这可能是因为实验中的“正常”闭环条件与幼鱼在自由游泳时接收的多模态感觉反馈（如前庭觉、侧线觉）仍有差异，因此内部模型即使在“正常”实验条件下也在进行持续的微调。这提示了内部模型校准行为的普遍性和持续性。此外，作者讨论了小脑可能作为通用的“学习机器”，其架构使其能够对各种可预测的模式（不仅是自身运动-感觉关系，也包括环境规律甚至社会互动）进行建模，这为理解小脑更广泛的功能提供了启示。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问