分享自:

基于数据的大规模初级视觉皮层模型实现类脑稳健且多功能的视觉处理

期刊:sci. adv.DOI:eabq7592

神经科学领域重大突破:基于大规模数据的初级视觉皮层模型实现类脑鲁棒视觉处理

作者及发表信息
本研究由奥地利格拉茨技术大学理论计算机科学研究所的Guozhang Chen、Franz Scherr和Wolfgang Maass*(通讯作者)合作完成,于2022年11月2日发表在*Science Advances*期刊(卷8,文章编号eabq7592)。


学术背景

科学领域与动机
该研究属于计算神经科学人工智能的交叉领域,聚焦于初级视觉皮层(primary visual cortex, V1)的建模。传统的人工智能视觉模型(如卷积神经网络,CNN)虽在图像分类任务中表现优异,但与生物视觉系统相比存在显著差异:
1. 功能局限性:CNN难以整合时序分散的视觉信息,且对噪声敏感;
2. 结构差异:生物V1具有分层递归连接、神经元多样性、稀疏放电等特性,而CNN缺乏这些生物学特征。
研究团队旨在通过整合现有解剖学和神经生理学数据,构建一个数据驱动的大规模V1模型,以探索其视觉处理能力及神经编码机制,并为类脑计算提供新范式。

关键背景知识
- V1的解剖结构:小鼠V1包含5层神经元(L1-L6),以局部连接为主,具有兴奋性(excitatory)和抑制性(inhibitory)神经元的分化。
- 神经编码理论:实验表明,生物V1的神经活动遵循幂律(power law)特征,其主成分分析(PCA)的方差衰减速率(α≈1+2/d)是噪声鲁棒性的关键。


研究流程与方法

1. 模型构建

研究对象与数据来源
- 神经元模型:采用111种GLIF3(generalized leaky integrate-and-fire)神经元,参数来自Allen脑图谱(Allen Brain Atlas)的实测数据,模拟膜电位和慢电流过程。
- 网络结构:51,978个神经元分布于5层,连接概率基于实验数据(图1c),并随神经元间距指数衰减(图1d)。
- 输入预处理:通过外侧膝状体(LGN)模型将图像转换为神经元输入电流,包含17,400个时空滤波器。

创新方法
- 噪声模型:基于小鼠V1实验数据(参考文献11),设计快速噪声(quick noise)和慢速噪声(slow noise),模拟突触释放随机性和网络状态波动(图1f)。
- 训练算法:通过随机梯度下降(SGD)调整突触权重,保留Dale定律(兴奋/抑制性权重符号不变),采用伪导数(pseudo-derivative)解决脉冲神经元的不可微问题。

2. 任务训练与测试

五项视觉任务(图2)
1. 精细朝向辨别(Fine orientation discrimination):区分接近45°的漂移光栅朝向。
2. 图像分类(MNIST数据集):识别手写数字(0-9)。
3. 自然图像变化检测:判断序列中图像是否变化。
4. 静态光栅变化检测:类似任务3,但使用光栅刺激。
5. 证据累积(Evidence accumulation):整合左右侧线索并决策。

读出的设计
- 生物学合理性:使用L5层的30个锥体神经元集群作为读出单元(非全局线性读出),避免过拟合(图2a)。
- 性能验证:训练后模型平均准确率达94.28%,接近小鼠行为数据(表1)。

3. 噪声鲁棒性分析

  • 内部噪声测试:即使未在训练中暴露,模型对高幅度噪声(s=q=20)仍保持84.53%准确率(图3e)。
  • 外部噪声测试:在MNIST图像中添加高斯噪声时,V1模型显著优于CNN(图6b)。

4. 神经编码机制解析

  • PCA分析:V1模型的神经编码幂律指数α接近理论最优值(1+2/d),而CNN的α更小(图5d),表明其编码对噪声更敏感。
  • 噪声维度正交性:信号编码维度与最大噪声维度正交(图7d),与生物实验(参考文献3)一致。

主要结果与结论

1. 功能验证

  • 多任务兼容性:单一模型可同时解决五项任务,且性能与生物行为相当(表1)。
  • 时序整合能力:证据累积任务中,模型能整合分散时间线索(图2e)。

2. 结构贡献分析

  • 分层局部连接:控制实验显示,去除分层结构(控制模型3)会显著降低学习速度和性能(图4a)。
  • 神经元多样性:使用单一神经元类型(控制模型2)导致性能下降。

3. 理论意义

  • 神经编码优化:V1模型的幂律和噪声正交性解释了其鲁棒性,为类脑计算提供设计原则。
  • 能量效率:稀疏放电和局部连接使其适合神经形态硬件(neuromorphic hardware)实现。

研究亮点与价值

  1. 首个综合性V1模型:整合了最大规模的解剖与生理数据,兼具功能性与生物合理性。
  2. 方法论创新:通过伪导数和噪声模型,解决了脉冲神经网络训练的难题。
  3. 跨领域应用:为AI提供更鲁棒的视觉处理框架,并为神经形态芯片设计提供蓝图。

未来方向
- 扩展至高阶视觉皮层交互;
- 验证模型预测(如抑制性神经元的PCA谱非幂律性)。

(全文约2200字)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com