分享自:

兴奋-抑制平衡在多属性选择层次神经网络模型中对决策策略的调控作用

期刊:PLOS Computational BiologyDOI:10.1371/journal.pcbi.1008791

本项研究由纽约大学神经科学中心的 Warren Woodrich Pettine、Kenway Louie、Xiao-Jing Wang 教授团队以及耶鲁大学医学院的 John D. Murray 教授合作完成,研究成果以题为“兴奋性-抑制性平衡塑造分层神经网络模型中多属性选择的决策策略”的学术论文形式,于 2021 年 3 月 11 日发表在《PLOS Computational Biology》期刊上。

研究的学术背景主要交叉于计算神经科学、决策神经科学以及生物物理建模领域。在日常生活中,我们频繁面对由多种属性定义的选择(例如,选择早餐麦片时需权衡口味和健康)。尽管神经影像和电生理研究已识别出多个脑区在决策过程中的活动,但对于神经网络的基本特性——特别是兴奋性与抑制性神经元活动的平衡——如何具体塑造对多个属性的处理并最终影响选择行为,尚缺乏严格的生物物理模型描述。此外,当环境存在不确定性(即属性真实价值不明确)时,这些基本神经特性如何影响决策表现,更是未知。先前的研究表明,不同脑区可能以层级方式处理信息,较低层级的脑区处理单一属性,而较高层级进行整合。同时,兴奋-抑制平衡是神经环路的根本特性,影响信号处理、工作记忆、感知决策等多个认知功能,并且与自闭症谱系障碍、精神分裂症等神经精神疾病的病理机制相关。因此,本研究旨在建立一个层级神经网络模型,系统地探究兴奋-抑制平衡如何通过调节层级间的非线性信号转换,来决定个体在多属性决策任务中采用的策略,特别是在不同环境不确定性下的适应性表现。其核心目标是提供一个将微观环路特性(E/I 平衡)与宏观决策行为及策略联系起来的、严谨的生物物理计算框架。

研究采用计算建模方法,详细工作流程包括以下几个核心步骤:

第一步,模型构建与设计。 研究者构建了两种神经网络架构进行比较研究: 1. 线性网络: 作为基线模型。该网络包含一个输入层和一个最终决策层。输入层编码两个备选方案各自的两个属性值,这些属性值直接以线性加权和的方式(权重各为0.5)输入到一个最终决策区。该决策区包含两个相互竞争的神经元群体(分别代表选项A和B),其动力学基于经典的平均场吸引子模型,具有循环兴奋和交叉抑制连接。决策依据是哪个群体的发放率首先超过设定的阈值(35 Hz)。这个模型模拟了所有属性信息完全、线性地呈现在最终决策脑区的情况。 2. 分层网络: 本研究的主要模型。该网络包含三层结构:输入层、中间变换层和最终决策层。输入层同样编码属性值。关键创新在于中间层,它由多个并行的、属性特异性的处理模块(每个模块对应一个属性)组成。每个模块同样是一个包含两个竞争性群体(代表该属性下选项A和B的价值)的平均场吸引子。来自输入层的属性信号首先进入对应的中间层模块进行非线性变换,变换后的输出信号再被传递到最终的决策层进行整合与竞争。中间层模块的核心参数是其内部的兴奋性连接强度和抑制性连接强度,这两个参数的组合定义了该模块的“兴奋-抑制平衡”。

第二步,定义决策行为与“无差异曲线”分析。 为了量化不同兴奋-抑制平衡下网络模型的决策策略,研究者引入经济学中的“无差异曲线”概念。在网络模拟中,固定一个参考选项(B)的两个属性值,系统地变化另一个选项(A)的两个属性值。通过大量模拟试验(每种属性值组合进行1000次试验),找到那些使网络选择A和B的概率各为50%的(A属性1, A属性2)点。这些点构成的曲线即为无差异曲线。曲线的形状揭示了网络如何权衡不同属性:线性曲线表明网络对属性进行线性加和;凸曲线表明网络偏好属性间“平衡”的选项(如两个属性都不错,胜过一个极高一个极低);凹曲线表明网络更看重较大的那个属性值,即“赢者通吃”的非线性偏好。

第三步,系统参数扫描与“决策体制”划分。 研究团队对分层网络中间层模块的兴奋性权重和抑制性权重进行了大范围的参数空间扫描。对于权重空间中的每一个点(即一种特定的兴奋-抑制平衡配置),都按照第二步的方法计算其对应的无差异曲线形状。结果表明,根据无差异曲线的形状,网络的行为可以明确划分为三种“决策体制”:体制I(线性)、体制II(凸性)和体制III(凹性)。通过这种划分,研究者成功地将抽象的神经网络参数空间(兴奋/抑制强度)映射到了具体、可观测的决策行为模式上。

第四步,网络功能机制探究:固定点分析与相位平面。 为了理解不同体制下中间层模块是如何对输入信号进行非线性变换的,研究者使用了动力学系统中的固定点分析和相位平面技术。他们计算了在无噪声条件下,给定输入和兴奋-抑制参数时,中间层模块动力学方程的稳定状态(固定点)。通过追踪从初始状态到稳定点的轨迹,可以近似得到模块对输入信号的“变换函数”。分析发现,在体制I和II下,模块的输出大致保持了输入信号的相对大小关系;而在体制III下,模块执行了一种“赢者通吃”的非线性操作:对于一个属性模块内的两个竞争群体,输入值较高的群体输出被显著放大,而输入值较低的群体输出被强烈抑制。

第五步,环境不确定性下的任务表现比较。 研究引入了环境不确定性,即在每个试验中,每个属性的真实输入值会加上一个从均值为零、方差可调的正态分布中随机抽取的噪声。然后,研究者设计了包含大量不同属性价值组合的“多属性决策任务”,让线性网络和处于不同体制(不同兴奋-抑制平衡点)的分层网络在该任务下进行模拟。核心指标是网络选择“总体价值更高”的选项的概率。他们比较了在不同不确定性水平下,分层网络的表现相对于线性网络的优劣变化。

第六步,中间层信号解读分析。 研究者模拟了神经科学实验中常见的“从中间脑区解读决策信号”的场景。他们为中间层每个属性模块设定了一个内部的发放率差异阈值(12 Hz),当一个模块内两个群体的发放率差异首次超过此阈值时,即认为可以从该模块“读出”一个倾向性选择。他们分析了这种从中间层“提前读出”的选择,其准确性与最终决策层做出的实际选择的一致性,以及在不同不确定性下的表现。

第七步,应用于抑制功能受限的模型预测。 最后,研究者提出了一个概念性框架:假设大脑能够根据感知到的环境不确定性水平,动态调整中间处理脑区的兴奋-抑制平衡,以优化决策表现。他们构建了一个“神经典型”模型(可以访问所有兴奋-抑制平衡配置)和一个“抑制功能受限”模型(其抑制性强度被限制在很低的水平)。通过模拟,比较这两个模型在不同不确定性任务块中的表现和策略变化。

研究的主要结果如下:

首先,研究者成功证明,仅仅通过调节分层网络中间层的兴奋-抑制平衡,就可以使网络展现出三种截然不同的决策策略,对应线性的加和整合、凸性的平衡偏好以及凹性的“赢者通吃”偏好。这意味着基本的神经微环路特性可以直接决定宏观的、复杂的决策行为模式。

其次,关于环境不确定性的影响,研究得出了关键且反直觉的发现:在环境不确定性较低(噪声方差小)时,线性网络和分层网络中的体制I(线性)表现最好,因为它们能最稳定地选择总体价值更高的选项。然而,随着环境不确定性的增加,分层网络中体制III(凹性,赢者通吃)的表现相对提升,甚至在高不确定性下超越线性策略。这是因为体制III的非线性操作起到了“信号提纯”的作用:它放大了不同选项在同一属性上的差异,同时抑制了差异小的属性带来的噪声。分析表明,这种优势源于两方面:1) 增加分布分离度: 类似“最大值”操作,减少了重叠决策值分布的混淆;2) 基于显著性的动态注意: 网络并非僵化地只取最大值,而是通过动力学过程,让属性间差异更大的那个模块更快达到竞争阈值,从而在最终决策层获得更大权重,这相当于动态地“注意”了更具鉴别力的属性。

再者,对中间层信号解读的分析结果对实验神经科学有重要启示。研究发现,即使在最终决策由更高层级脑区做出的前馈网络中,从中间层(仅处理单一属性信息)也能以很高的准确率、甚至有时更早地解读出即将做出的选择。特别是在高不确定性下,某些中间层区域的解读准确率可能超过最终决策层。这说明,实验中在一个脑区记录到与行为选择高度相关且较早的信号,并不能直接证明该脑区是“决策发生”的地方或拥有所有整合信息;这可能只是层级处理过程中的一个自然涌现现象。

最后,基于模型的预测表明,在低不确定性环境下,神经典型个体和抑制功能受限个体(如某些自闭症或精神分裂症模型)可能都采用线性或接近线性的策略,表现相似。但随着不确定性增加,神经典型个体会通过增强抑制性(进入体制III)切换到更有效的非线性策略,而抑制功能受限的个体则无法实现这种策略切换,导致其决策表现随不确定性增加而显著下降,且其无差异曲线始终保持更线性的形状。

结论:本研究通过一个生物物理上合理的层级神经网络模型,首次系统地揭示了兴奋-抑制平衡作为神经环路的一个基本特性,如何通过塑造层级间的非线性信息变换,来决定多属性决策中策略的采用。研究不仅提供了连接微观神经机制与宏观经济选择行为的计算框架,还提出了环境不确定性是驱动策略切换的关键因素。其科学价值在于深化了对决策神经计算基础的理解,强调了动力学和非线性在认知功能中的核心作用。

研究的亮点包括:1) 创新性模型: 将经济学中的无差异曲线分析工具与生物物理神经网络建模相结合,提供了一个新颖且强大的分析框架;2) 关键性发现: 揭示了在不确定性环境下,非线性、“赢者通吃”的神经处理策略可能优于传统的线性加和策略,这对理解适应性决策具有重要意义;3) 重要的实验启示与预测: 对神经信号解读的警示以及对神经精神疾病决策缺陷的机制性预测,为后续实验研究提供了清晰、可检验的假设方向;4) 跨层次整合: 成功地将分子/细胞水平的兴奋-抑制平衡概念,与系统水平的脑区交互以及行为水平的决策策略有机地联系起来。

此外,研究在讨论部分还提出了可能的神经调制机制(如胆碱能系统)来实现根据不确定性动态调整兴奋-抑制平衡,并详细列举了该模型对神经生理学实验和人类行为实验的一系列具体预测,进一步拓展了研究的应用价值和启发意义。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com