大脑新皮质分层结构实现自我监督预测学习的计算理论
作者及机构
本研究由Kevin Kermani Nejad(牛津大学生理学、解剖学与遗传学系神经回路与行为中心;布里斯托大学智能系统实验室)、Paul Anastasiades(布里斯托大学转化健康科学系)、Loreen Hertäg(柏林工业大学 & 柏林伯恩斯坦计算神经科学中心)和Rui Ponte Costa(牛津大学;布里斯托大学)共同完成,发表于*Nature Communications*(2025年7月4日,DOI: 10.1038/s41467-025-61399-5)。
学术背景
新皮质(neocortex)通过多层结构构建对世界的内部表征,但其底层神经环路和计算原理尚不明确。传统观点认为,感觉信息通过丘脑传递至第4层(L4),再经第2/3层(L2/3)整合后传递至第5层(L5)。然而,近期研究发现L5可直接接收丘脑输入,形成平行通路。受自监督学习(self-supervised learning)算法启发,本研究提出新皮质通过L2/3整合L4传递的延迟感觉输入和自上而下(top-down)的上下文信息,预测即将到来的感觉刺激,并通过与L5实际输入的比对实现自我监督学习。研究旨在揭示新皮质分层结构的计算意义,并解释实验观察到的层特异性稀疏性(sparsity)和失匹配响应(mismatch responses)。
研究流程与方法
1. 模型构建
- 网络架构:模拟新皮质微环路,设计包含L4、L2/3和L5的三层子网络。L4接收丘脑输入(x_{t-1}),L2/3整合延迟的L4输入和自上而下上下文信息,L5同时接收丘脑直接输入(x_t)和L2/3的预测输出。
- 学习规则:结合预测成本(predictive cost)和重构成本(reconstruction cost)。预测成本通过比较L2/3输出与L5活动生成误差信号,反馈至L2/3驱动可塑性;重构成本防止L5表征坍塌(representational collapse)。
- 生物学验证:模型中的L2/3→L5突触可塑性规则与实验观察的“去极化依赖的突触权重切换”一致(Sjöström & Häusser, 2006)。
任务设计
分析方法
主要结果
1. 预测学习能力
- L2/3在Gabor任务中预测准确率达93%,L5对当前输入分类准确率为89%(随机模型11%)。延迟输入(L4→L2/3)是预测未来输入的关键,移除后L2/3无法区分未来状态(图3c)。
- 噪声与遮挡鲁棒性:L2/3→L5连接使模型对噪声和部分遮挡输入具有强健的重构能力(图5a-b)。L2/3可完整重构遮挡输入,而L5仅编码可见部分。
层特异性稀疏性
失匹配响应
结论与意义
本研究提出新皮质通过L4-L2/3-L5通路实现时间自监督学习,L2/3作为预测引擎,L5作为感觉输入编码器。其科学价值包括:
1. 理论创新:首次将自监督学习映射至新皮质分层环路,解释了层特异性功能(如稀疏性、失匹配响应)的计算基础。
2. 实验预测:提出可通过光遗传操控测试L2/3和L5的预测-误差反馈机制。
3. 进化启示:L2/3的扩张可能增强预测能力,支持人类新皮质的高级认知功能。
研究亮点
1. 跨学科方法:融合机器学习(对比预测编码,contrastive predictive coding)与神经生物学实验数据。
2. 环路机制解析:阐明延迟输入、反馈连接和并行通路在预测学习中的作用。
3. 应用潜力:为类脑计算架构设计提供生物启发,如抗噪声的预测编码算法。
补充价值
模型扩展至递归网络(RNN)后,可整合更长时序信息(图S14),为分层时间预测(hierarchical temporal prediction)提供新思路。