分享自:

利用跨试验和行为会话的关联改进神经解码

期刊:NeuronDOI:10.1016/j.neuron.2025.10.026

本文由来自哥伦比亚大学、西北大学、瑞士洛桑联邦理工学院、纽约大学、日内瓦大学以及国际脑实验室等多个机构的Yizi Zhang, Hanrui Lyu, Cole Hurwitz, Shuqi Wang, Charles Findling, Yanchen Wang, Felix Hubert, Alexandre Pouget, Erdem Varol, 以及Liam Paninski共同完成,并于2026年2月4日发表在《Neuron》期刊上。

本研究属于计算神经科学与系统神经科学领域。传统的神经解码器通常针对单一实验试次或单一行为学环节(session)内的神经活动与行为之间的关系进行建模,忽略了跨试次和跨环节的神经活动与行为之间普遍存在的相关性。然而,动物在执行相同任务时,会表现出相似的神经活动模式,并且其行为决策会受到过往经验的影响。因此,利用这些跨试次、跨环节的共享结构,有望提升从大规模神经数据中解码行为的准确性和效率。现有的一些方法,如深度学习方法,虽然功能强大,但通常计算成本高昂且缺乏可解释性,无法清晰地揭示神经活动与行为之间关系的具体机制。基于此背景,本研究旨在开发一套轻量级、可解释的模型框架,通过有效利用跨试次和跨行为环节的相关性来提升神经解码性能,并借此揭示与行为相关的神经表征模式和脑内神经激活的时间尺度。

本研究的核心工作流程围绕两个互补的模型展开:用于共享神经活动结构的多环节降秩回归模型,以及用于捕捉行为结构相关性的多环节状态空间模型

研究流程与模型构建: 1. 数据准备与基线模型定义:研究首先基于国际脑实验室(International Brain Laboratory, IBL)发布的大规模小鼠神经像素(Neuropixels)数据集开展。该数据集包含433个行为环节,横跨270个脑区。研究选取了四种行为变量进行解码:二元的选择(choice,左或右)、连续的先验信念(prior,小鼠对刺激出现位置的估计)、跑轮速度(wheel speed)以及胡须运动能量(whisker motion energy)。神经数据被处理为经尖峰排序的、在时间上分箱的尖峰计数,并按2秒一个试次进行分割。 传统的单环节解码器(如全秩线性模型)使用一个未加约束的权重矩阵W来预测行为。然而,对于神经元数量n和时间步t都很大的情况,参数数量(n×t)巨大,容易导致过拟合。

  1. 降秩回归模型系列的构建

    • 单环节降秩回归:为了解决过拟合问题并提取核心结构,研究者引入了降秩回归模型。其核心思想是将庞大的权重矩阵W分解为两个低秩矩阵的乘积:神经基础矩阵 U时间基础矩阵 V(即 W = UV^T)。U ∈ ℝ^(n×r) 用于捕获与行为相关的神经元间协变模式,V ∈ ℝ^(r×t) 用于捕获跨时间的共享激活模式,其中秩 r << min(n, t)。这大大减少了参数数量至 r(n + t),增强了模型的泛化能力。该模型可被视为一种潜在变量模型,U 定义了最能预测行为的神经活动子空间。
    • 多环节降秩回归:为了利用不同动物或环节间共享的神经活动结构,研究者进一步提出了多环节降秩回归模型。该模型的关键创新在于共享时间基础矩阵 V 跨环节,同时允许每个环节拥有自己特定的神经基础矩阵 U_i。这使得模型能够在不同环节(可能记录的是完全不同的神经元群体)中识别出共通的、与行为相关的时间动态模式,从而提升单环节的解码性能,尤其是在神经信号有限的条件下。
    • 多脑区降秩回归:考虑到不同脑区可能在不同的时间尺度上参与行为任务(例如感觉区响应更早),研究者又设计了多脑区降秩回归模型。它在多环节模型的基础上,进一步将共享的时间基础 V 分解为两部分:一个捕获区域间共享时间结构的矩阵 B,和一组区域特异性的矩阵 A_j。这样,每个脑区 j 拥有自己灵活的时间基础 V_j = A_j^T B,从而能够建模脑区特异性的激活时间进程,同时仍从共享结构中受益。
  2. 状态空间模型系列的构建

    • 这部分模型旨在利用行为数据本身存在的试次间相关性来改善单试次解码器的输出。
    • 对于连续的先验信念变量,研究者采用了线性高斯一阶自回归模型。该模型假设观察到的单试次解码器输出 d_k 是由一个潜在的行为状态 z_k 生成的,而 z_k 自身按照一阶自回归过程演化。通过卡尔曼平滑算法,可以利用所有试次的信息来推断每个试次更准确的潜在状态估计,从而平滑和校正单试次解码器的噪声输出。
    • 对于二元的选择变量,由于解码器输出是概率值,研究者设计了一个更复杂的贝塔混合隐马尔可夫模型。该模型假设解码器输出 d_k 服从一个由潜在状态 z_k 决定的贝塔混合分布,而 z_k 的状态转移则遵循一个由离散隐藏状态 s_k 控制的 HMM。这个 HMM 能够捕捉到行为策略的切换,例如在IBL任务中,从随机切换状态到向左或向右偏好的状态。模型可以从单试次解码器的输出序列中推断出这些隐藏状态和更优的二元行为估计。
    • 多环节状态空间模型:为了提高在数据有限的特定环节中状态空间模型参数的估计精度,研究者提出了多环节版本。其核心思想是利用多个训练环节的行为数据来学习模型参数的经验先验分布,然后在测试环节的推断中,用这些先验来约束参数更新。这种方法借鉴了经验贝叶斯的思路,有效地利用了跨环节的行为模式信息。
  3. 模型评估与比较:研究采用严格的基准测试来评估模型性能。比较的基线包括传统的L2正则化线性解码器、单层或多层感知机,以及单环节版本的RRR、LG-AR1和BMM-HMM。评估指标根据任务类型而定,如分类任务的受试者工作特征曲线下面积(AUC)和连续预测的皮尔逊相关系数或确定系数R²。评估在IBL数据集的多个代表性脑区(如后丘脑核、外侧后核、齿状回、海马CA1区、前视皮层)上分别进行,以避免使用所有脑区带来的天花板效应。此外,为了验证模型的通用性,研究者还在其他数据集上进行了测试,包括:IBL的非试次对齐数据(包含自发活动)、艾伦研究所的神经像素视觉编码数据集(不同视觉刺激任务),以及一项灵长类动物随机目标抓取任务的犹他阵列数据。

主要研究结果: 1. 多环节降秩回归显著提升解码性能:在解码二元的“选择”行为时,多环节RRR模型生成的神经活动低维投影,比主成分分析或单环节RRR能更清晰地区分左右选择相关的神经活动模式,其聚类调整兰德指数和解码准确率均显著更高。对于连续的“先验信念”、“跑轮速度”和“胡须运动能量”,多环节RRR的预测准确率也全面超越了脊回归和单环节RRR。重要的是,对比实验表明,这种提升并非仅仅源于使用了更多训练数据,而是模型低秩结构本身有效捕获了跨环节共享的、与行为相关的神经动态。 2. 行为数据共享模型有效平滑和校正解码输出: * BMM-HMM模型能够仅从单试次解码器的输出中,准确地推断出与IBL任务中刺激概率块状切换相对应的隐状态(左偏好、右偏好、随机切换),而无需预先知道真实的块结构。 * 利用这些推断的隐状态和试次间相关性,BMM-HMM输出的行为概率估计比原始单试次解码器输出更平滑、更准确,AUC显著提升。 * 同样,LG-AR1模型能有效地平滑连续“先验信念”的解码轨迹,使其与真实先验的轨迹更吻合,皮尔逊相关系数大幅提高。 * 多环节版本的状态空间模型通过共享参数先验,其参数估计和最终输出均更接近“神谕模型”(使用真实行为辅助推断的理想模型)的结果,显著优于单环节版本。 3. 综合解码器达到最优性能:将多环节RRR的初始预测结果,再用多环节BMM-HMM或LG-AR1进行后处理优化,形成的“组合解码器”在“选择”和“先验信念”的解码上达到了所有模型中最高的性能。 4. 模型具备优异的可解释性: * 识别关键神经元:RRR模型中的神经基础矩阵U可以量化每个神经元对解码的贡献度。通过“神经元剪枝”实验验证,按照U指示的重要性顺序移除神经元,对解码性能的影响远小于随机移除或先移除最重要的神经元。那些被标记为最重要的神经元在左右选择试次中显示出明显的差异化放电模式,而被标记为最不重要的神经元则缺乏这种任务相关性。 * 绘制脑区行为相关时间尺度图谱:利用多脑区RRR模型,研究者提取了每个脑区与解码“选择”和“先验信念”相关的特异性时间基础。分析其第一主成分,可以获得两个关键指标:峰值激活时间激活持续时间。研究首次在全脑范围内绘制了这两个行为相关时间尺度的功能图谱。结果显示,不同脑区在行为任务中表现出不同的激活时间进程。例如,对于“选择”解码,大多数脑区的峰值激活出现在刺激后1.5秒内(与运动反应时间一致),但嗅球和小脑等区域激活较晚(可能与接收水奖励有关)。对于“先验信念”解码,皮层区域激活较早,而小脑激活延迟;皮层和丘脑区域的激活持续时间较长。 * 此外,与基线线性解码器相比,多脑区RRR模型在几乎所有脑区都提升了解码准确率,表明常规线性模型可能未能充分提取每个脑区中蕴含的决策相关信息。 5. 出色的跨数据集、跨物种、跨任务通用性:本研究提出的模型不仅在IBL核心数据集上表现优异,在非试次对齐的IBL数据、艾伦研究所的视觉编码数据集(不同视觉刺激、多分类任务)以及灵长类动物运动皮层解码任务中,均展现出稳定的性能提升。这证明了模型框架对于不同数据采集结构、实验任务乃至物种的鲁棒性和普适性。

结论与意义:本研究成功开发并验证了一套高效、可解释的神经解码框架。该框架通过创新的多环节降秩回归模型和多环节状态空间模型,系统地利用了神经活动与行为中存在的跨试次、跨环节相关性,从而在多个行为变量、多个脑区上显著提升了解码性能。其科学价值在于:第一,为处理和分析日益增长的大规模、跨环节神经数据提供了一种强有力的计算工具。第二,模型的可解释性特征(识别关键神经元、绘制时间尺度图谱、推断行为状态)为理解大脑如何在群体神经活动层面编码行为、不同脑区如何以特定时间动态协同工作提供了新的视角和量化手段。第三,与当前流行的、计算复杂且难以解释的深度学习“基础模型”相比,本研究提出的线性方法在保持竞争力的同时,强调了计算效率与机制透明性,为神经科学领域提供了一种有吸引力的替代方案。其应用价值则体现在为脑机接口、行为状态监测以及神经精神疾病的机制研究与诊断提供了潜在的新算法基础。

研究亮点: 1. 方法学创新:提出了“多环节降秩回归”和“多环节状态空间模型”两个核心创新模型,巧妙地将跨环节的数据共享与模型降维、状态推断相结合。 2. 性能卓越:在IBL等大规模真实神经数据集上,新模型在解码多种行为时,性能显著超越传统线性方法和单环节模型,甚至媲美或优于某些非线性多层感知机。 3. 可解释性突出:模型不仅能预测行为,还能直接输出对科学发现至关重要的中间结果,如关键神经元、脑区特异性的行为相关时间动态、动物内部的行为决策状态等。 4. 通用性强:模型在多种实验范式、不同物种(小鼠、猴子)和不同记录技术(神经像素阵列、犹他阵列)的数据集上均验证有效,展示了其作为通用解码工具的潜力。 5. 资源开放:研究所用代码已公开,促进了该领域的方法复现和进一步研究。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com