分享自:

利用跨试验和行为会话相关性改进神经解码

期刊:NeuronDOI:10.1016/j.neuron.2025.10.026

本文档是一项发表于2026年2月4日《Neuron》期刊(卷114,页1-16)的原创性研究论文。该研究由Yizi Zhang(哥伦比亚大学)、Hanrui Lyu(西北大学)、Cole Hurwitz(哥伦比亚大学)、Shuqi Wang(洛桑联邦理工学院)、Charles Findling、Yanchen Wang、Felix Hubert、International Brain Laboratory、Alexandre Pouget、Erdem Varol及Liam Paninski(哥伦比亚大学)等作者合作完成。通讯作者为Yizi Zhang和Liam Paninski。

研究的学术背景与目的 本研究属于计算神经科学和神经解码(Neural Decoding)领域。神经解码旨在通过分析神经活动(如神经元放电)来预测动物的行为,是理解大脑功能与行为关系的关键工具。传统的神经解码模型通常在单个实验试次(trial)或单个实验会话(session)内进行分析,忽略了跨试次和跨会话之间神经活动与行为数据中存在的相关性。这种限制使得模型无法充分利用现代大规模神经科学数据集(涵盖多个动物、多个脑区、多个会话)所蕴含的丰富结构信息。事实上,动物在执行相同任务时,其神经活动模式在不同会话间具有相似性;同时,动物的行为也受到过往经验的影响,表现出跨试次的关联。因此,本研究旨在开发新的计算方法,通过利用神经活动和行为数据中存在的跨会话和跨试次相关性,来显著提升从神经活动预测动物行为的准确性。具体目标包括:1)开发能够捕捉跨会话共享神经结构的模型;2)开发能够捕捉跨试次行为动态的模型;3)确保模型具有可扩展性(能处理大规模数据)、高效性和可解释性(与深度学习黑箱模型形成对比);4)应用模型揭示行为相关的神经表征、关键神经元以及全脑范围的神经激活时间尺度。

研究流程与方法详述 本研究提出并验证了两种互补的模型方法:用于共享神经数据的“多会话降秩回归模型”(Multi-session Reduced-Rank Regression, RRR (m)及其变体)和用于共享行为数据的“多会话状态空间模型”(Multi-session State-Space Models)。整体工作流程可分为模型构建、数据准备、模型评估、结果解释与泛化验证几个主要部分。

  1. 模型构建与原理

    • 多会话降秩回归模型 (RRR):核心思想是对传统全秩回归模型的权重矩阵施加低秩约束,将其分解为神经基(U)和时间基(V)。U 捕捉神经元对行为的贡献,V 捕捉行为相关的神经活动随时间变化的模式。在标准单会话RRR的基础上,研究者发展了多会话RRR模型(RRR (m)),其关键创新在于跨会话共享时间基 V,同时允许每个会话有其特定的神经基 Ui。这使得模型能够学习跨会话一致的神经激活时间模式,同时适应不同会话中记录到的不同神经元群体。进一步,考虑到不同脑区可能具有不同的功能激活时间,研究者提出了多区域RRR模型(RRR (mr)),将时间基进一步分解为区域特异性部分(Aj)和跨区域共享部分(B),从而能捕捉脑区特异性的时间动态。
    • 多会话状态空间模型:该模型旨在利用行为数据中的序列相关性(跨试次关联)来改善单试次解码器的输出。对于连续型行为(如“先验信念”),研究采用线性高斯一阶自回归模型(LG-AR1),将单试次解码输出视为对潜在行为状态的含噪声观测,并通过卡尔曼平滑(Kalman smoothing)来推断更平滑、更准确的行为轨迹。对于二值选择行为(如左/右决策),研究开发了Beta混合隐马尔可夫模型(BMM-HMM)。该模型假设观测到的解码器输出(行为概率)来源于一个由潜在隐状态(例如,任务处于“左侧偏向”、“右侧偏向”或“随机切换”区块)控制的Beta分布混合。通过期望最大化(EM)算法,模型可以同时推断出潜在的区块状态和更准确的决策输出。为了克服单会话数据不足的问题,研究者进一步发展了这些模型的多会话版本,其核心是利用训练会话中观察到的行为数据来学习模型参数的经验先验分布(Empirical Priors),从而在推断测试会话时约束参数更新,实现更稳健的估计。
  2. 数据处理与研究客体

    • 主要数据集:研究主要使用了国际脑实验室(International Brain Laboratory, IBL)发布的小鼠神经像素(Neuropixels)数据集。该数据集规模庞大,包含433个实验会话,覆盖270个脑区。每个会话记录小鼠在执行视觉决策任务时的神经元放电活动(尖峰排序并分箱计数)以及四种行为变量:1)选择(Choice,二值,左/右);2)先验(Prior,连续值,小鼠对刺激出现侧的实时信念估计);3)轮子速度(Wheel speed,连续时间序列);4)胡须运动能量(Whisker motion energy,连续时间序列)。
    • 数据预处理:神经活动被分割为2秒的试次,并以20毫秒为时间窗进行分箱(每个试次100个时间点)。行为数据也进行同步对齐。
    • 基准模型:为了公平比较,研究评估了多种基准模型,包括单会话L2正则化线性解码器、单会话多层感知机(MLP)、以及专门构建的多会话全秩线性模型和MLP模型(通过会话特定读入层处理不同神经元数量)。
  3. 模型评估与分析流程

    • 解码性能基准测试:在IBL数据集中,选取了五个具有高神经元产量和解剖学多样性的脑区(PO, LP, DG, CA1, VISa),分别评估各模型对四种行为的解码性能。评估指标包括:对于二值选择使用AUC(曲线下面积),对于连续行为使用Pearson相关系数或R²。
    • 模型特性分析
      • 神经表征分析:比较了主成分分析(PCA)与RRR学得的低维子空间在分离不同行为条件(如左/右选择)上的能力,使用调整兰德指数(Adjusted Rand Index, ARI)进行量化。
      • 关键神经元识别:基于RRR神经基U中各神经元的权重幅度,进行“神经元修剪”实验,验证模型识别任务相关神经元的能力。
      • 脑区时间尺度映射:利用RRR (mr)模型为每个脑区学得的区域特异性时间基Vj,提取其第一秩成分,分析其峰值激活时间和激活持续时间,从而绘制全脑行为相关时间尺度图谱。
    • 泛化能力验证:为了证明方法的普适性,研究将模型应用于三个额外数据集:1)IBL非试次对齐数据(包含任务期和自发活动期);2)艾伦研究所神经像素视觉编码数据集(小鼠观看视觉刺激,任务不同);3)灵长类随机目标抓取任务数据(猴子执行自我定速的连续运动,使用犹他阵列记录)。在这些数据集上解码相应的行为变量(如奔跑速度、手指速度等),以检验模型跨数据结构、物种和任务的泛化能力。

主要研究结果 1. 多会话RRR显著提升解码性能: * 在IBL数据集上,无论是单会话RRR还是多会话RRR (m),在所有四种行为(选择、先验、轮速、胡须能量)的解码上都显著优于传统的L2正则化线性模型和单会话MLP基准。 * 关键发现是,多会话RRR (m) 持续优于单会话RRR,证明了利用跨会话共享结构(特别是时间基 V)的有效性。对于选择解码,结合了RRR (m)和BMM-HMM的“组合解码器”达到了最佳性能。 * 控制实验证明增益源自模型结构:与使用相同多会话数据但结构不同的全秩线性模型和多会话MLP相比,RRR (m)仍然表现更优,这表明性能提升不仅源于数据量的增加,更得益于其低秩分解的模型设计,能更有效地捕捉共享的神经动态。

  1. RRR提供了可解释的神经洞察

    • 学习行为相关的神经表征:与无监督的PCA相比,RRR学习到的低维子空间能更清晰地区分不同的行为条件(如左/右选择),ARI更高,表明其专注于捕捉与行为预测最相关的神经变异。
    • 识别任务关键神经元:“神经元修剪”实验证实,根据RRR神经基U的权重定义的“最重要神经元”被移除时,解码性能急剧下降;而移除“最不重要神经元”则影响甚微。可视化显示,这些“最重要神经元”确实表现出与任务相关的选择性放电模式(如在左/右选择试次中活动不同),而“最不重要神经元”则无此模式。
    • 绘制脑区行为相关时间尺度图谱:通过RRR (mr)模型,研究首次绘制了全脑范围在解码“选择”和“先验”时的激活时间尺度图。结果显示,不同脑区具有不同的激活峰值时间和持续时间。例如,在解码选择时,大部分脑区在刺激出现后1.5秒内达到峰值(与行为反应时间一致),而嗅球和小脑激活较晚(可能与接受水奖励相关)。在解码先验时,皮层区域激活较早,持续时间较长。这为理解不同脑区在特定行为中的功能时序贡献提供了新视角。
  2. 状态空间模型有效利用行为动态

    • BMM-HMM:能够仅从单试次解码器的噪声输出中,准确地推断出任务中潜在的区块结构(左偏、右偏、随机状态),而无需事先知道真实选择或区块切换时间。通过整合跨试次的关联信息,其输出的行为预测(p(zk=1 | d))比原始单试次解码输出(dk)更平滑、更准确,AUC显著提高。
    • LG-AR1:能有效地平滑和校正对连续“先验”变量的单试次解码估计,使其更贴近真实、缓慢变化的先验信念轨迹,Pearson相关系数大幅提升。
    • 多会话版本的优势:多会话BMM-HMM和LG-AR1模型的参数估计和输出更接近“神谕模型”(使用真实行为信息训练的模型上限),优于其单会话版本,证明了利用跨会话行为结构学习经验先验的有效性。
  3. 模型展现出色的泛化能力

    • 在IBL非试次对齐数据、艾伦研究所视觉编码数据集以及灵长类运动皮层数据上,RRR模型(尤其是多会话版本)均能稳定提升对奔跑速度、手指速度等行为的解码性能,证明了其对不同实验范式、记录硬件(神经像素阵列 vs. 犹他阵列)和物种(小鼠 vs. 猴子)的适应性。

研究结论与价值 本研究成功开发并验证了一套创新、高效且可解释的计算框架,用于提升大规模神经数据的行为解码。其核心价值在于: * 科学价值:研究突破了传统单试次解码的局限,系统性地提出并证明了利用神经和行为数据中跨会话与跨试次相关性对提升解码精度的重要性。所提出的模型不仅作为性能更优的解码工具,更成为了发现神经科学新知识的引擎:它们能够识别对特定行为至关重要的神经元群体,并首次在全脑尺度上量化了与特定行为变量相关的神经激活时间动态,加深了我们对不同脑区在行为中功能时序组织(Temporal Organization)的理解。 * 方法论价值:研究提供了一种深度学习方法之外的替代路径。与复杂的“黑箱”深度学习基础模型相比,这些基于降秩回归和状态空间模型的线性或轻度非线性方法在保持高计算效率的同时,提供了宝贵的可解释性。模型参数(如U, V, 隐状态)具有明确的物理或统计意义,使研究者不仅能“预测”行为,还能“理解”预测是如何做出的,以及大脑是如何编码行为的。 * 应用价值:该方法可直接应用于日益增长的大规模标准化神经数据集(如IBL、艾伦研究所的数据),帮助神经科学家从中提取更多可靠的行为-神经关联。其代码已公开,具有良好的可复用性。

研究亮点 1. 核心创新方法:提出了多会话降秩回归(RRR (m/mr))多会话状态空间模型(BMM-HMM, LG-AR1),新颖地将共享结构学习与神经解码问题相结合。 2. 重要的研究发现:首次利用解码模型绘制了全脑行为相关神经激活时间尺度图谱,揭示了不同脑区在决策和信念更新过程中不同的时间贡献模式。 3. 方法学的优越性:在多个大规模数据集上证明了所提模型在解码精度、计算效率和结果可解释性三方面的综合优势,为神经解码领域提供了强有力的新工具。 4. 卓越的泛化能力:研究系统地验证了模型在跨数据结构(试次对齐/非对齐)、跨任务(决策、感知、运动)、跨记录技术和跨物种上的鲁棒性与有效性,表明其具有广泛的适用潜力。

其他有价值内容 论文在“讨论”部分将所提模型与相关领域的工作(如典型相关分析CCA、解混PCA Demixed PCA、优先子空间识别PSID、张量回归等)进行了清晰对比,阐明了本工作的独特定位。同时,也展望了未来方向,如将模型扩展至神经编码、跨脑区预测、整合多模态数据、处理学习阶段差异以及应用于未排序尖峰特征解码等。这些都为后续研究指明了道路。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com