Anand Pathak, Scott L. Brincat, Haris Organzidis, Helmut H. Strey, Sageanne Senneff, Evan G. Antzoulatos, Lilianne R. Mujica-Podi, Earl K. Miller, Richard Granger. 本研究由来自美国达特茅斯学院(Dept. of Psychological and Brain Sciences, Dartmouth College)、麻省理工学院皮考尔学习与记忆研究所(The Picower Institute for Learning and Memory, Massachusetts Institute of Technology)、纽约州立大学石溪分校生物医学工程系(Dept. of Biomedical Engineering, State University of New York at Stony Brook)等机构的研究团队合作完成。研究成果以题为《Biomimetic model of corticostriatal micro-assemblies discovers a neural code》的论文形式,于2026年发表在《自然·通讯》(Nature Communications)期刊上。
本研究属于计算神经科学与系统神经科学的交叉领域,其核心是构建一个多尺度、生物机理准确的脑回路计算模型。长久以来,神经科学面临一个根本性挑战:如何将微观层面的生理活动(如神经元放电、场电位)和生物化学过程(如神经递质与受体作用)与宏观层面的高级认知功能(如决策、工作记忆)及其相关障碍直接联系起来。传统的计算模型往往侧重于一端,要么追求生物机理的准确性(能模拟癫痫发作等大规模生理现象但无法生成认知),要么追求高级认知功能的涌现(如基于人工神经网络的模型能“学习”但缺乏细胞尺度的生物真实性)。因此,构建一个能够整合多个尺度,从突触可塑性到行为输出,并能产生可验证预测的生物模拟模型,对于理解大脑如何产生认知以及探索神经精神疾病的机制至关重要。本研究旨在填补这一空白,通过构建一个基于皮质-纹状体(corticostriatal)回路生物物理和生理细节的模型,直接模拟从刺激输入到行为决策的完整链条,并利用未经训练的模型预测全新的神经现象。
本研究的详细工作流程围绕构建、验证和应用一个名为“生理计算”(physiological computation)的多尺度生物模拟模型展开。模型构建并非基于对特定实验数据的拟合,而是完全依据已发表的关于神经元类型、解剖连接、生理特性和突触可塑性规则的广泛文献知识。
第一步:模型设计与生物模拟计算基元构建 研究首先定义了模型的解剖学核心——皮质-纹状体回路,包括皮层(模拟视觉皮层svcr和前额叶皮层antc)、纹状体(基质matrisome、小体striosome、强直性活跃神经元TANs)、黑质致密部(SNc)、苍白球(GPe, GPi)、丘脑等区域。每个区域被建模为由特定类型神经元按照解剖学布局排列而成的“微组装体”。模型的关键创新在于提出了“生物模拟计算基元”(Biomimetic Computational Primitives, BCPs)的概念。BCPs是不可再简化的基础功能单元,由特定解剖结构的神经元集群实现,其计算功能(如侧向抑制、动作选择、奖赏预测等)并非自上而下预设,而是自下而上从模拟的生理活动中涌现出来的。例如,模型中一个核心的BCP是“局部反馈侧向抑制回路”(local-feedback lateral inhibition circuit, L-FLIC),它模拟了皮层浅层由4-5个兴奋性神经元和1个抑制性神经元构成的微电路。该电路的连接方式(兴奋性细胞密集投射到抑制性细胞,后者再反馈抑制所有局部兴奋性细胞)产生了“软赢家通吃”的非线性选择功能,这对于感官编码和类别表征的形成至关重要。
第二步:模型实现与多尺度生理活动模拟 模型在多个尺度上模拟生理活动:1) 神经元尺度:采用霍奇金-赫胥黎(Hodgkin-Huxley)形式的点神经元模型模拟单个动作电位发放。2) 突触尺度:模拟离子型突触电流和依赖于放电时序的可塑性规则。3) 局部场尺度:通过定义“局部放电总和”(Local Spike Summation, LSS)指标来近似模拟局部场电位(Local Field Potential, LFP)的某些方面,用于与实验数据对比。4) 区域间同步尺度:计算不同脑区(如皮层与纹状体)活动之间的相位锁定值(Phase-Locking Value, PLV),以评估功能连接。模型还包括一个简化的上行系统(ascending system, Asc1),作为中央模式发生器,产生约16 Hz的节律性输入,驱动皮层产生β节律振荡。
第三步:任务模拟与行为学习 模型被赋予一项在非人灵长类动物(macaque monkeys)研究中广泛使用的视觉分类任务。任务中,模型(如同动物一样)会看到由点阵构成的视觉刺激(属于A类或B类),经过一段延迟后,需要做出“向左”或“向右”的模拟眼动(saccade)来选择刺激所属类别。选择正确会获得模拟的“奖赏”(强化信号),错误则获得“惩罚”(无奖赏)。模型内部通过基于文献的突触可塑性规则(涉及谷氨酸能、多巴胺能、胆碱能信号的协同作用)调整其突触连接权重。这一过程完全是自发的、基于生理计算的强化学习,模型并未接受任何关于动物行为或神经数据的训练。
第四步:模型验证与实验数据对比 这是验证模型有效性的关键步骤。研究团队将模型在任务中的表现与真实的猕猴实验数据(来自MIT团队先前的研究)进行多维度、直接的比较。比较内容包括:1) 行为学习曲线:模型学习分类任务的速度和准确率是否与猕猴相似。2) 神经生理活动:比较模型产生的LSS与实验记录的LFP在时空模式上的异同。3) 区域间同步性:比较模型和猕猴大脑中皮层-纹状体在β频段的相位锁定值及其随学习进程、任务阶段(刺激呈现期vs延迟期)、试次正确性(正确vs错误)的变化规律。4) 突触权重变化:分析模型内部不同连接(如皮层-皮层、皮层-纹状体、丘脑-皮层)的突触强度在学习和不同试次类型下的动态变化。
第五步:模型预测与新神经编码的发现 在模型验证的基础上,研究人员深入分析模型内部的神经元活动模式,以期发现可能被先前实验分析所忽略的新现象。他们特别关注在学习后期,前额叶皮层神经元在试次早期(刺激呈现后200ms内)的放电模式。
第六步:预测验证与干预模拟 为了验证在模型中发现的“不一致神经元”是否真实存在于生物大脑中,研究团队回溯分析了猕猴的实验数据。他们使用与模型分析相同的简单分类方法(根据神经元在试次早期对四种条件:A-正确、A-错误、B-正确、B-错误的放电偏好进行分类),在猕猴记录到的少量皮层神经元中寻找类似模式。此外,他们还在模型中进行了一项“实时干预”的思想实验:假设一个设备能实时监测ICN的活动,并在其预测到错误选择时中止试次,观察这种干预是否能提高行为准确率。
本研究取得了多方面的重要结果,系统性地验证了模型的有效性并揭示了新机制。
关于行为学习和突触可塑性的结果:模型成功学会了视觉分类任务,其学习曲线(正确率随试次增加而上升,并在约450个试次后达到并维持在80%的稳定平台期)与猕猴的行为学习曲线高度相似。对模型内部的分析显示,伴随学习发生了特征性的突触权重变化:皮层-皮层连接普遍表现出长时程增强(Long-Term Potentiation, LTP),权重缓慢持续增加;而皮层-纹状体连接的权重则表现出更复杂的动态,既有增强(LTP)也有减弱(长时程抑制,LTD)。这反映了纹状体作为整合皮层输入、多巴胺奖赏信号和胆碱能调制信号的关键节点,其突触可塑性受到更复杂规则的调控。这些突触变化是行为学习得以实现的物质基础。
关于神经生理活动与同步性的结果:模型成功复现了多项在猕猴大脑中观察到的神经生理现象。首先,模型和实验数据都显示,在学习后期的试次中,皮层和纹状体的总体活动强度(模型为LSS,实验为LFP)均高于学习早期。其次,也是更具说服力的发现是,模型准确预测了皮层-纹状体神经同步性的特定变化模式:1) 学习依赖性:随着学习进行,两者在β频段(由Asc1驱动)的相位同步性(PLV)在后期试次中显著增强。2) 任务阶段依赖性:这种同步性增强在“延迟期”(刺激已消失,需要保持工作记忆)比在“刺激呈现期”更为明显,这与工作记忆需要跨脑区回路持续活动的理论相符。3) 试次结果依赖性:在后期试次中,β频段的同步性增强仅出现在正确试次中,而在错误试次中则较弱甚至消失。模型为此提供了机理解释:分析显示,在错误试次中,那些倾向于引发错误反应的皮层神经元到纹状体“错误”动作选择神经元的突触连接权重被选择性削弱(LTD),导致纹状体活动变得稀疏,从而降低了区域间的同步性。这种同步性模式的精细复现,强烈支持模型捕捉到了真实神经回路的核心动力学特征。
最重要的预测性发现——“不一致神经元”:对模型深层活动的分析揭示了一个前所未见的现象。在学习完成后,每个前额叶皮层兴奋性神经元不仅对刺激类别(A或B)有选择性,还在试次最初200毫秒就对其最终的行为结果(正确或错误)表现出强烈的、预测性的编码。具体而言,所有神经元可清晰地分为四类:A-正确、A-错误、B-正确、B-错误。其中,预测错误结果的神经元(A-错误、B-错误)被命名为“不一致神经元”(Incongruent Neurons, ICNs),它们约占神经元总数的20%。ICN的存在违背了单纯强化学习的直觉——一个优化后的系统似乎应全力支持正确选择。在模型中,ICN通过激活对侧(错误)的纹状体动作选择通路,导致错误行为的发生。
预测的实证验证与统计显著性:1) 存在性验证:对猕猴实验数据的回溯分析证实,记录到的皮层神经元同样表现出对四种条件的选择性偏好,与模型中的ICN现象一致。2) 统计验证:将后期试次数据分为两半,用前半部分数据识别出的ICN类别,能够显著地预测后半部分试次的行为结果,其预测效力(通过ROC曲线下面积AUC衡量)远高于随机选择的神经元(经验数据p<0.001,模拟数据p<10^−21)。3) 功能验证(干预模拟):在模型的“实时干预”模拟中,当检测到ICN活动并据此中止可能出错的试次时,系统的整体行为准确率得到了显著提升(经验数据模拟提升2.07%,p=0.0017;模型数据提升0.79%,p=0.003)。这证明ICN确实编码了关于即将发生错误的、具有行为相关性的信息。
关于ICN产生机理的探索:模型分析进一步揭示了ICN可能的形成原因。首先,模型中稀疏的皮层连接架构导致每个下游皮层神经元“看到”的视觉感受野是先天(解剖结构上)有偏的,倾向于对A类或B类刺激有微弱偏好。在学习过程中,那些感受野偏向模糊或模棱两可的神经元,更容易在强化学习规则下演变成ICN。其次,关键区别在于它们与纹状体的下游连接:一致性神经元(预测正确)学会了强化与“正确”动作对应纹状体区的连接;而不一致性神经元则异常地强化了与“错误”动作对应纹状体区的连接。
本研究的结论是,成功构建了一个从机理上准确、跨越多尺度的生物模拟脑回路模型,该模型仅基于生理学文献构建,未经过任何特定实验数据训练,却能直接产生从神经元放电、局部场电位、区域同步到工作记忆、决策和类别学习等一系列神经与认知现象,并与独立的猕猴实验数据广泛吻合。这首次实现了从低层次生理活动到高层次认知行为的直接、可预测的桥梁连接。
该研究的意义与价值体现在多个层面:科学价值:1) 方法论突破:提出的“生理计算”和“生物模拟计算基元”框架,为构建兼具生物真实性和认知复杂性的脑模型提供了新范式。2) 机理阐释:模型为已知的神经现象(如学习相关的β同步变化)提供了自下而上的、可检验的电路水平解释。3) 预测与新发现:模型强大的预测能力引领发现了全新的神经编码——“不一致神经元”,并得到实验证实,这是计算模型驱动神经科学发现的典范。应用潜力:1) 疾病机制与药物测试:该模型可作为“在硅片中进行”(in silico)的实验平台,通过模拟特定神经递质受体阻断或基因变异,来研究精神神经疾病(如与多巴胺、强化学习相关的疾病)的底层电路机制,并筛选潜在的药理干预靶点。2) 脑机接口:ICN的发现为开发能够实时预测和纠正错误决策的新型脑机接口或神经调控策略提供了全新的信号源和思路。
本研究的亮点在于:重要发现:1) 发现并实证验证了“不一致神经元”这一全新的、具有行为预测功能的神经编码。2) 首次实现了一个模型同时复现行为学习曲线、多尺度神经生理活动模式(放电、场电位、同步振荡)及其在学习过程中的动态变化。方法新颖性:1) 采用“未分布外推理”(Out-of-Distribution Inference)的严格验证标准,即模型基于一类数据(生理学文献)构建,却能预测另一类完全不同的数据(猕猴行为与神经生理数据)中的现象。2) 强调“自下而上涌现”而非“自上而下设计”或“数据拟合”,模型的复杂认知功能纯粹源于对生物物理和生理规则的模拟。研究对象的特殊性:聚焦于在认知功能和多种精神疾病中均至关重要的皮质-纹状体回路,并将其作为一个完整闭环系统进行建模,涵盖了从感觉输入、工作记忆保持、奖赏学习到动作选择的完整认知链条。
此外,研究还通过模拟“损伤实验”(如分别损毁SNc、纹状体小体或TANs),展示了模型在剖析各电路成分功能及其对行为学习影响方面的潜力,为生成可检验的假设提供了工具。研究也坦诚指出了模型的当前局限,例如尚未包含全部中间神经元亚型、部分脑区使用了简化输入输出规则、未包含边缘系统等其他重要回路等,这些为未来模型的扩展和完善指明了方向。总体而言,这项研究代表了计算神经科学向构建全尺度、可预测、生物机理透明的人脑模型迈出的重要一步。