本文档是一项发表于2026年2月4日《Neuron》期刊(卷114,页1-16)的原创性研究论文。该研究由Yizi Zhang(哥伦比亚大学)、Hanrui Lyu(西北大学)、Cole Hurwitz(哥伦比亚大学)、Shuqi Wang(洛桑联邦理工学院)、Charles Findling、Yanchen Wang、Felix Hubert、International Brain Laboratory、Alexandre Pouget、Erdem Varol及Liam Paninski(哥伦比亚大学)等作者合作完成。通讯作者为Yizi Zhang和Liam Paninski。
研究的学术背景与目的 本研究属于计算神经科学和神经解码(Neural Decoding)领域。神经解码旨在通过分析神经活动(如神经元放电)来预测动物的行为,是理解大脑功能与行为关系的关键工具。传统的神经解码模型通常在单个实验试次(trial)或单个实验会话(session)内进行分析,忽略了跨试次和跨会话之间神经活动与行为数据中存在的相关性。这种限制使得模型无法充分利用现代大规模神经科学数据集(涵盖多个动物、多个脑区、多个会话)所蕴含的丰富结构信息。事实上,动物在执行相同任务时,其神经活动模式在不同会话间具有相似性;同时,动物的行为也受到过往经验的影响,表现出跨试次的关联。因此,本研究旨在开发新的计算方法,通过利用神经活动和行为数据中存在的跨会话和跨试次相关性,来显著提升从神经活动预测动物行为的准确性。具体目标包括:1)开发能够捕捉跨会话共享神经结构的模型;2)开发能够捕捉跨试次行为动态的模型;3)确保模型具有可扩展性(能处理大规模数据)、高效性和可解释性(与深度学习黑箱模型形成对比);4)应用模型揭示行为相关的神经表征、关键神经元以及全脑范围的神经激活时间尺度。
研究流程与方法详述 本研究提出并验证了两种互补的模型方法:用于共享神经数据的“多会话降秩回归模型”(Multi-session Reduced-Rank Regression, RRR (m)及其变体)和用于共享行为数据的“多会话状态空间模型”(Multi-session State-Space Models)。整体工作流程可分为模型构建、数据准备、模型评估、结果解释与泛化验证几个主要部分。
模型构建与原理:
U)和时间基(V)。U 捕捉神经元对行为的贡献,V 捕捉行为相关的神经活动随时间变化的模式。在标准单会话RRR的基础上,研究者发展了多会话RRR模型(RRR (m)),其关键创新在于跨会话共享时间基 V,同时允许每个会话有其特定的神经基 Ui。这使得模型能够学习跨会话一致的神经激活时间模式,同时适应不同会话中记录到的不同神经元群体。进一步,考虑到不同脑区可能具有不同的功能激活时间,研究者提出了多区域RRR模型(RRR (mr)),将时间基进一步分解为区域特异性部分(Aj)和跨区域共享部分(B),从而能捕捉脑区特异性的时间动态。数据处理与研究客体:
模型评估与分析流程:
U中各神经元的权重幅度,进行“神经元修剪”实验,验证模型识别任务相关神经元的能力。Vj,提取其第一秩成分,分析其峰值激活时间和激活持续时间,从而绘制全脑行为相关时间尺度图谱。主要研究结果 1. 多会话RRR显著提升解码性能: * 在IBL数据集上,无论是单会话RRR还是多会话RRR (m),在所有四种行为(选择、先验、轮速、胡须能量)的解码上都显著优于传统的L2正则化线性模型和单会话MLP基准。 * 关键发现是,多会话RRR (m) 持续优于单会话RRR,证明了利用跨会话共享结构(特别是时间基 V)的有效性。对于选择解码,结合了RRR (m)和BMM-HMM的“组合解码器”达到了最佳性能。 * 控制实验证明增益源自模型结构:与使用相同多会话数据但结构不同的全秩线性模型和多会话MLP相比,RRR (m)仍然表现更优,这表明性能提升不仅源于数据量的增加,更得益于其低秩分解的模型设计,能更有效地捕捉共享的神经动态。
RRR提供了可解释的神经洞察:
U的权重定义的“最重要神经元”被移除时,解码性能急剧下降;而移除“最不重要神经元”则影响甚微。可视化显示,这些“最重要神经元”确实表现出与任务相关的选择性放电模式(如在左/右选择试次中活动不同),而“最不重要神经元”则无此模式。状态空间模型有效利用行为动态:
p(zk=1 | d))比原始单试次解码输出(dk)更平滑、更准确,AUC显著提高。模型展现出色的泛化能力:
研究结论与价值 本研究成功开发并验证了一套创新、高效且可解释的计算框架,用于提升大规模神经数据的行为解码。其核心价值在于: * 科学价值:研究突破了传统单试次解码的局限,系统性地提出并证明了利用神经和行为数据中跨会话与跨试次相关性对提升解码精度的重要性。所提出的模型不仅作为性能更优的解码工具,更成为了发现神经科学新知识的引擎:它们能够识别对特定行为至关重要的神经元群体,并首次在全脑尺度上量化了与特定行为变量相关的神经激活时间动态,加深了我们对不同脑区在行为中功能时序组织(Temporal Organization)的理解。 * 方法论价值:研究提供了一种深度学习方法之外的替代路径。与复杂的“黑箱”深度学习基础模型相比,这些基于降秩回归和状态空间模型的线性或轻度非线性方法在保持高计算效率的同时,提供了宝贵的可解释性。模型参数(如U, V, 隐状态)具有明确的物理或统计意义,使研究者不仅能“预测”行为,还能“理解”预测是如何做出的,以及大脑是如何编码行为的。 * 应用价值:该方法可直接应用于日益增长的大规模标准化神经数据集(如IBL、艾伦研究所的数据),帮助神经科学家从中提取更多可靠的行为-神经关联。其代码已公开,具有良好的可复用性。
研究亮点 1. 核心创新方法:提出了多会话降秩回归(RRR (m/mr)) 和多会话状态空间模型(BMM-HMM, LG-AR1),新颖地将共享结构学习与神经解码问题相结合。 2. 重要的研究发现:首次利用解码模型绘制了全脑行为相关神经激活时间尺度图谱,揭示了不同脑区在决策和信念更新过程中不同的时间贡献模式。 3. 方法学的优越性:在多个大规模数据集上证明了所提模型在解码精度、计算效率和结果可解释性三方面的综合优势,为神经解码领域提供了强有力的新工具。 4. 卓越的泛化能力:研究系统地验证了模型在跨数据结构(试次对齐/非对齐)、跨任务(决策、感知、运动)、跨记录技术和跨物种上的鲁棒性与有效性,表明其具有广泛的适用潜力。
其他有价值内容 论文在“讨论”部分将所提模型与相关领域的工作(如典型相关分析CCA、解混PCA Demixed PCA、优先子空间识别PSID、张量回归等)进行了清晰对比,阐明了本工作的独特定位。同时,也展望了未来方向,如将模型扩展至神经编码、跨脑区预测、整合多模态数据、处理学习阶段差异以及应用于未排序尖峰特征解码等。这些都为后续研究指明了道路。