神经科学领域重大突破:基于大规模数据的初级视觉皮层模型实现类脑鲁棒视觉处理
作者及发表信息
本研究由奥地利格拉茨技术大学理论计算机科学研究所的Guozhang Chen、Franz Scherr和Wolfgang Maass*(通讯作者)合作完成,于2022年11月2日发表在*Science Advances*期刊(卷8,文章编号eabq7592)。
科学领域与动机
该研究属于计算神经科学与人工智能的交叉领域,聚焦于初级视觉皮层(primary visual cortex, V1)的建模。传统的人工智能视觉模型(如卷积神经网络,CNN)虽在图像分类任务中表现优异,但与生物视觉系统相比存在显著差异:
1. 功能局限性:CNN难以整合时序分散的视觉信息,且对噪声敏感;
2. 结构差异:生物V1具有分层递归连接、神经元多样性、稀疏放电等特性,而CNN缺乏这些生物学特征。
研究团队旨在通过整合现有解剖学和神经生理学数据,构建一个数据驱动的大规模V1模型,以探索其视觉处理能力及神经编码机制,并为类脑计算提供新范式。
关键背景知识
- V1的解剖结构:小鼠V1包含5层神经元(L1-L6),以局部连接为主,具有兴奋性(excitatory)和抑制性(inhibitory)神经元的分化。
- 神经编码理论:实验表明,生物V1的神经活动遵循幂律(power law)特征,其主成分分析(PCA)的方差衰减速率(α≈1+2/d)是噪声鲁棒性的关键。
研究对象与数据来源
- 神经元模型:采用111种GLIF3(generalized leaky integrate-and-fire)神经元,参数来自Allen脑图谱(Allen Brain Atlas)的实测数据,模拟膜电位和慢电流过程。
- 网络结构:51,978个神经元分布于5层,连接概率基于实验数据(图1c),并随神经元间距指数衰减(图1d)。
- 输入预处理:通过外侧膝状体(LGN)模型将图像转换为神经元输入电流,包含17,400个时空滤波器。
创新方法
- 噪声模型:基于小鼠V1实验数据(参考文献11),设计快速噪声(quick noise)和慢速噪声(slow noise),模拟突触释放随机性和网络状态波动(图1f)。
- 训练算法:通过随机梯度下降(SGD)调整突触权重,保留Dale定律(兴奋/抑制性权重符号不变),采用伪导数(pseudo-derivative)解决脉冲神经元的不可微问题。
五项视觉任务(图2)
1. 精细朝向辨别(Fine orientation discrimination):区分接近45°的漂移光栅朝向。
2. 图像分类(MNIST数据集):识别手写数字(0-9)。
3. 自然图像变化检测:判断序列中图像是否变化。
4. 静态光栅变化检测:类似任务3,但使用光栅刺激。
5. 证据累积(Evidence accumulation):整合左右侧线索并决策。
读出的设计
- 生物学合理性:使用L5层的30个锥体神经元集群作为读出单元(非全局线性读出),避免过拟合(图2a)。
- 性能验证:训练后模型平均准确率达94.28%,接近小鼠行为数据(表1)。
未来方向
- 扩展至高阶视觉皮层交互;
- 验证模型预测(如抑制性神经元的PCA谱非幂律性)。
(全文约2200字)