基于BrainPy的多尺度可微分脑建模工作流程:连接电生理、解剖与行为数据的新方法
作者及机构
本研究的通讯作者为Chaoming Wang(北京大学心理与认知科学学院、IDG/McGovern脑研究所)和Si Wu(北京大学前沿交叉学科研究院、北京大学生命科学联合中心)。该研究发表于2024年7月的第41届国际机器学习会议(ICML)的“Differentiable Almost Everything”研讨会。
研究领域与动机
脑科学面临的核心挑战之一是如何整合微观(单神经元)、介观(神经环路)和宏观(行为)尺度的数据,构建连贯的全脑模型。传统脑模拟器(如NEURON、NEST)因缺乏可微分性(differentiability),难以利用高效的梯度优化方法,导致模型拟合速度慢、参数搜索依赖启发式方法。为此,研究团队基于可微分脑模拟器BrainPy(结合JAX的自动微分功能),提出了一种多尺度可微分建模工作流程,旨在通过梯度优化统一跨尺度数据。
关键科学问题
1. 单神经元尺度:如何通过电生理数据优化神经元模型参数?
2. 网络尺度:如何利用连接组(connectome)数据构建生物约束的脉冲神经网络(SNN)?
3. 行为尺度:如何训练网络完成认知任务以复现动物行为?
目标:拟合单神经元电生理数据。
方法:
- 模型选择:采用广义泄漏积分发放(Generalized Leaky Integrate-and-Fire, GLIF)和Hodgkin-Huxley(HH)模型。
- 替代梯度(Surrogate Gradient):为解决脉冲事件的不可微问题,使用高斯、线性或SLAYER等替代函数近似梯度(附录C)。
- 优化算法:对比L-BFGS-B、差分进化(DE)、粒子群优化(PSO)和贝叶斯优化,发现L-BFGS-B在拟合精度与速度间最佳平衡(图S7,表S2)。
实验数据:
- GLIF模型:拟合皮层锥体细胞的适应性发放(tonic spiking)和相位发放(phasic spiking)。
- HH模型:基于体外电生理记录数据,L-BFGS-B实现膜电位损失接近零(图2c,表S3)。
目标:实现高效的脉冲通信与梯度传播。
创新点:
- 稀疏存储:采用CSR(Compressed Sparse Row)格式存储突触连接,开发事件驱动的矩阵-向量乘法算子(附录D)。
- 性能优势:相比传统稀疏/稠密方法,前向与反向计算速度提升1-2个数量级。
三层次整合(图1):
- 微观尺度:通过梯度优化拟合单神经元和突触模型(图1a)。
- 介观尺度:整合果蝇、斑马鱼、猕猴等连接组数据构建生物约束网络(图1b)。
- 宏观尺度:利用在线学习框架BrainScale训练网络完成认知任务(如工作记忆任务)。
任务设计:证据累积任务(evidence accumulation task),网络需分别计数左右刺激并在延迟后做出响应(图3a)。
网络结构:
- 神经元:400个GLIF神经元(兴奋性:抑制性=4:1),突触动力学采用指数模型。
- 训练方法:BrainScale框架(低内存占用的在线反向传播近似)。
结果:
- 神经活动:抑制性神经元在刺激期高频发放,兴奋性神经元在回忆期主导(图3b-d)。
- 突触权重分布:训练后兴奋性权重呈高斯分布尾部,抑制性权重呈对数正态分布(图3e-f),与生物学观测一致。
科学意义:
- 方法论创新:首次将可微分模拟贯穿神经元、网络、行为三尺度,为脑模型提供统一优化框架。
- 生物启示:突触权重分布的复现提示生物神经网络可能通过类似梯度优化的机制学习认知任务。
应用潜力:
- 脑机接口:高精度神经元模型可提升神经解码性能。
- 类脑计算:BrainPy的可微分特性助力脉冲神经网络(SNN)训练。
挑战与展望:
- 数据质量(如连接组分辨率)和模型简化之间的平衡仍需探索(附录H)。
- 高维参数空间的优化效率待提升。
(全文约2200字)