分享自:

在线拟合连接组约束的果蝇全脑模型重现关键静息态动力学

期刊:ICLR 2026

这篇文档属于类型a,是一篇关于果蝇全脑模型在线拟合的原创性研究论文。以下是详细的学术报告:


作者及发表信息

本研究由匿名作者团队完成,目前作为会议论文提交至ICLR 2026,正处于双盲评审阶段。


学术背景

研究领域:计算神经科学、全脑建模与连接组学(connectomics)。
研究动机:随着突触分辨率连接组图谱(synaptic-resolution connectome maps)和神经活动数据集的快速增长,亟需开发能够整合解剖结构与功能数据的全脑模型。传统方法如基于时间反向传播(BPTT, backpropagation through time)的模型因内存需求随模拟时间线性增长,难以在生物相关时间尺度上训练大规模网络。
研究目标:提出一种在线学习框架(online learning framework),通过前向时间梯度优化(online gradient-based optimization)降低内存消耗,构建一个包含13万个神经元和数百万突触的果蝇全脑模型,并验证其能否复现静息态神经活动的临界动力学(critical dynamics)。


研究流程

1. 在线拟合框架设计

  • 方法创新:采用在线梯度优化(而非BPTT),仅需存储单时间步的激活状态,内存占用仅与参数数量相关。
  • 模型构建:以果蝇FlyWire连接组(Dorkenwald et al., 2024)为固定解剖骨架,神经元动态采用阈值线性发放率模型(threshold-linear firing-rate models),优化突触权重、时间常数等自由参数。
  • 数据输入:使用18个果蝇脑的静息态钙成像数据(Mann et al., 2017; Turner et al., 2021),采样频率1.2 Hz,覆盖73个神经纤维网(neuropil)。

2. 单神经元动态建模

  • 方程
    [ \tau_i \frac{dr_i}{dt} = -r_i + f(I^{\text{conn}}_i + I^{\text{enc}}_i) ]
    其中 ( I^{\text{conn}}_i ) 为连接组定义的突触输入,( I^{\text{enc}}_i ) 为背景输入,( f(x) = \text{ReLU}(x) ) 为激活函数。
  • 离散化:采用指数欧拉近似(exponential Euler approximation),时间步长 (\Delta t) 可调。

3. 连接组约束的突触连接

  • 数据来源:FlyWire v783版本(138,639个神经元,15,091,982个突触)。
  • 突触极性:根据神经递质类型设定兴奋性(+1,如乙酰胆碱)或抑制性(-1,如GABA)。
  • 输入计算
    [ I^{\text{conn}}i(t) = \sum{j \in \mathcal{N}i} \text{sgn}{ij} |w_{ij}| r_j(t) ]

4. 神经纤维网活动读出

  • 加权聚合:根据神经元在神经纤维网中的突触密度加权计算区域活动:
    [ \text{fr}^{\text{neuropil}}k(t) = \frac{\sum{j \in \mathcal{M}_k} rj(t) \cdot n^{\text{syn}}{j,k}}{\sum_{j \in \mathcal{M}k} n^{\text{syn}}{j,k}} ]
    其中 ( n^{\text{syn}}_{j,k} ) 为神经元 ( j ) 在神经纤维网 ( k ) 的突触数量。

5. 在线优化算法

  • 算法:采用D-RTRL(Wang et al., 2024),通过资格迹(eligibility traces)累积局部参数敏感性,避免存储完整时间序列。
  • 损失函数:模拟活动与实验数据的均方误差(MSE)。

主要结果

  1. 计算效率

    • 在线方法在单GPU上训练全脑模型,内存占用与序列长度无关,而BPTT在400时间步后即超出32GB GPU内存限制(图2a)。
  2. 动态复现能力

    • 模型在训练阶段(500时间步)和测试阶段(500时间步)均能生成与实验数据匹配的自发振荡活动(图3a)。
    • 功能连接(functional connectivity, FC)预测与实验数据的相关性在训练集达0.998,测试集达0.556,优于实验数据自身的跨段相关性(0.474)(图3b)。
  3. 突触权重分布

    • 训练后权重分布呈现重尾特征(heavy-tailed distribution),与FlyWire连接组实测的突触脊柱计数分布高度一致(图4)。分位数-分位数(Q-Q)分析显示训练后权重与实验数据的相关性显著提高(图4c)。
  4. 临界动力学

    • 实验数据中神经雪崩(neuronal avalanches)的持续时间服从幂律分布(指数α=1.78),模型预测结果同样符合幂律(α=1.90)(图5a-b)。
    • 训练过程中,网络谱半径(spectral radius)趋近1,表明系统自发逼近临界状态(图5c)。

结论与价值

科学意义
1. 首次实现基于连接组约束的大规模全脑模型在线优化,为整合解剖与功能数据提供了可扩展框架。
2. 证明数据驱动的参数优化能自发产生生物合理的突触权重分布和临界动力学,提示功能约束可能塑造了神经回路的结构特性。

应用价值
1. 为研究脑疾病的网络动力学异常提供新工具。
2. 推动类脑计算模型的发展,例如低功耗神经形态硬件设计。


研究亮点

  1. 方法创新:在线梯度优化突破BPTT的内存瓶颈,使全脑模型训练在常规计算资源上可行。
  2. 多尺度验证:从单神经元动态到全脑功能连接,均与实验数据一致。
  3. 涌现特性:未经显式约束的突触权重和临界动力学自发匹配生物学观测,支持“结构-功能共优化”假说。

其他价值

  • 补充材料中提供了钙成像信号到发放率的稀疏反卷积方法(附录A)和低秩权重近似策略(附录C),可供后续研究参考。
  • 开源平台Brainscale(Wang et al., 2024)的算法实现促进了方法复用。
上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com