分享自:

推断神经可塑性前的神经活动作为超越反向传播学习的基础

期刊:nature neuroscienceDOI:10.1038/s41593-023-01514-1

这篇文档属于类型a,是一篇关于神经科学领域原创研究的学术论文。以下为详细报告:


前瞻性配置:超越反向传播的学习新范式

作者及机构
本研究由Yuhang Song(牛津大学计算机科学系、MRC脑网络动力学单元、Fractile公司)、Beren Millidge(MRC脑网络动力学单元)、Tommaso Salvatori(牛津大学计算机科学系、维也纳技术大学逻辑与计算研究所、VERSES AI研究实验室)、Thomas Lukasiewicz(牛津大学计算机科学系、维也纳技术大学逻辑与计算研究所)、Zhenghua Xu(牛津大学计算机科学系、河北工业大学电气设备可靠性与智能国家重点实验室)和Rafal Bogacz(MRC脑网络动力学单元)共同完成,发表于Nature Neuroscience 2024年2月刊(第27卷,348-358页)。


学术背景

研究领域与动机
研究聚焦于神经科学与人工智能交叉领域的信用分配问题(credit assignment problem),即如何确定信息处理流程中哪些组件应对输出错误负责。长期以来,反向传播算法(backpropagation)被认为是解决该问题的金标准,但其在生物学习中的适用性存在争议:生物神经系统学习效率远高于反向传播(如更少的数据需求、更强的抗干扰能力)。本研究提出了一种新机制——前瞻性配置(prospective configuration),挑战了反向传播的主导地位。

核心问题
反向传播的局限性包括:
1. 需要大量重复训练;
2. 存在灾难性干扰(catastrophic interference)(新知识破坏旧记忆);
3. 无法解释生物学习中的快速适应和神经活动动态。
研究团队假设,大脑通过前瞻性配置实现更高效的信用分配:即先调整神经活动模式以匹配目标输出,再通过突触可塑性巩固这一模式。


研究流程与方法

1. 理论框架构建
- 前瞻性配置的定义:与反向传播“先修改权重,再改变神经活动”的顺序相反,前瞻性配置要求网络首先推断学习后应有的神经活动模式(即“前瞻性活动”),再调整权重以巩固该模式。
- 能量模型(energy-based models)的数学基础:研究证明,前瞻性配置天然存在于基于能量的网络(如Hopfield网络、预测编码网络)中。通过类比物理机械系统(“能量机器”),阐释了神经活动与权重更新的动力学关系(图2)。

2. 计算模拟与比较
- 模型对比:以预测编码网络(predictive coding networks)实现前瞻性配置,与反向传播训练的人工神经网络(ANN)在相同任务中对比。
- 关键指标
- 目标对齐(target alignment):衡量学习方向与目标输出的匹配程度(图3a-c);
- 学习效率:在深度网络、在线学习、持续学习等场景下的性能差异(图3f-h, 图4)。
- 任务设计:涵盖监督学习(FashionMNIST、CIFAR-10)、强化学习(Acrobot、CartPole)及人类/动物行为实验(感觉运动学习、恐惧条件反射)。

3. 生物实验数据验证
- 感觉运动学习实验(图5):模拟人类在上下文依赖的任务中如何通过前瞻性配置推断潜在状态(如背景颜色与运动扰动的关联),结果与行为数据高度吻合,而反向传播无法解释。
- 强化学习实验(图6):前瞻性配置能自动发现任务结构(如选项间的负相关性),与fMRI记录的脑区活动一致。


主要结果

1. 前瞻性配置的优势
- 减少干扰:目标对齐显著高于反向传播(图3e),尤其在深层网络中差距更明显(图3h)。
- 高效学习:在少量数据(图4h)、动态环境(图4f-g)和持续学习(图4d-e)中表现更优。
- 生物合理性:解释了实验中“未呈现刺激仍触发学习”的现象(图5f),支持潜在状态推断理论。

2. 机制解析
- 能量最小化驱动:神经活动通过松弛(relaxation)快速收敛至前瞻性状态,权重更新则通过局部Hebbian可塑性实现(图2b)。
- 与目标传播(target propagation)的理论联系:前瞻性配置在特定条件下等价于目标对齐为1的算法(补充图3-4)。

3. 应用潜力
- 机器学习:前瞻性配置在卷积网络(图4i)和强化学习(图4k)中表现优异,提示其在下一代硬件(如模拟计算)中的潜力。
- 神经科学:为突触可塑性-稳定性难题提供新解,即通过动态补偿避免记忆干扰。


结论与价值

科学意义
1. 提出了一种颠覆性的信用分配机制,挑战了反向传播在生物学习中的核心地位;
2. 揭示了能量模型天然支持前瞻性配置,为理解皮层电路提供了统一框架;
3. 弥合了计算模型与实验数据的鸿沟,解释了多模态学习中的神经动态。

应用前景
- 人工智能:推动高效、低能耗的类脑算法设计;
- 神经工程:启发新型脑机接口和神经形态硬件开发。


研究亮点

  1. 理论创新:首次明确将前瞻性配置定义为独立于反向传播的学习原则;
  2. 方法突破:通过“能量机器”物理类比直观展示神经动力学(图2);
  3. 跨学科验证:从计算模拟到行为实验的多层次证据链;
  4. 颠覆性结论:证明生物学习的优越性可能源于反向传播的“近似”而非“实现”。

其他价值

  • 实验预测:补充图11-12提出了可验证的神经活动模式差异;
  • 开放问题:讨论了权重对称性(weight symmetry)的生物学可行性及动态松弛的优化空间。
  • 代码开源:算法细节与模拟参数公开,支持后续研究复现(见原文Methods部分)。

本研究为理解生物学习与人工智能的差异奠定了里程碑,并为下一代学习算法的设计指明了方向。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com