分享自:

大脑中的反向传播与学习机制

期刊:nature reviews | neuroscience

《Nature Reviews Neuroscience》2020年6月刊发表的这篇题为《Backpropagation and the brain》的perspectives文章,由DeepMind的Timothy P. Lillicrap、Adam Santoro、Luke Marris,牛津大学的Colin J. Akerman以及多伦多大学的Geoffrey Hinton共同完成。文章探讨了反向传播算法(backpropagation)与大脑学习机制之间的潜在联系,提出了“神经梯度通过活动差异表示”(neural gradient representation by activity differences, NGRAD)的新框架,为理解大脑多层神经网络中的信用分配(credit assignment)问题提供了创新视角。

核心观点一:反向传播算法与生物学习的兼容性挑战

传统观点认为反向传播算法具有明显的生物学不合理性,主要体现在三个方面:1)需要前向与反馈连接的精确对称(即“权重传输问题”);2)需传递有符号的极端值误差信号;3)要求反馈连接仅影响突触可塑性而非神经活动。然而,作者指出,近年研究发现随机反馈权重(feedback alignment)仍能支持有效学习,表明严格对称并非必需。此外,大脑皮层普遍存在的反馈连接(如V2→V1的拓扑下行通路或丘脑-皮层环路)可能通过调制神经元活动间接传递误差信息。

核心观点二:NGRAD框架的提出与机制

NGRAD假说的核心在于:大脑可能通过反馈连接诱导神经元活动差异来编码类反向传播的误差信号,而非直接传递数学梯度。这一框架整合了多种学习算法: 1. 目标传播(target propagation):通过自编码器(auto-encoder)的逆向函数将输出目标逐层反传,利用前馈活动与反馈诱导目标的差异驱动突触更新。差异目标传播(difference target propagation, DTP)通过加入重构误差校正,缓解了完美逆向函数的不可实现性问题。 2. 对比赫布学习(contrastive Hebbian learning):在负相位(自由运行)和正相位(输出钳制)下分别测量突触活动,以二者差异作为更新依据。 3. 平衡传播(equilibrium propagation):通过微扰输出层驱动系统达到新平衡态,利用状态差异计算梯度近似。

核心观点三:生物学实现证据

文章列举了支持NGRAD的神经生物学发现: - 皮层微环路结构:皮层第5层锥体神经元的基底树突(接收前馈输入)与顶端树突(接收反馈输入)存在电隔离,可能分别处理前馈信息和误差信号。实验显示,顶端树突产生的平台电位(plateau potentials)可调控基底突触的可塑性。 - 时序依赖性:突触可塑性规则(如STDP)的局部性与NGRAD的局部误差计算要求一致。 - 功能解剖学:视觉腹侧流中,反向传播训练的人工网络与猕猴IT皮层神经表征的相似性(Cadieu et al., 2014),暗示皮层可能采用类似的高效学习策略。

核心观点四:算法性能与生物学习的关联

反向传播训练的深层网络在多项任务中展现出与生物神经系统相似的特征: 1. 表征匹配:在ImageNet分类任务中,反向传播模型的深层神经元活动与猕猴颞下皮层(IT)的响应模式相关性(r=0.68)显著高于其他模型(Khaligh-Razavi & Kriegeskorte, 2014)。 2. 学习动态:深层网络能复现知觉学习中的感受野变化阶段(Wenliang & Seitz, 2018),以及人类技能习得的阶段性跃迁。 3. 误差编码:小鼠视觉皮层第2/3层神经元可检测感觉输入与预测的失匹配(Zmarz & Keller, 2016),符合分层误差信号传递的预测。

观点五:未解问题与未来方向

作者承认当前模型与生物学习的差距: 1. 解剖约束:皮层区域间缺乏人工网络中清晰的层状划分,且存在多样化的细胞类型和连接模式。 2. 时间尺度:生物学习依赖连续实时信号处理,而非人工网络的离散前向-反向交替。 3. 多模态整合:现有算法尚未充分模拟跨模态(如视觉-听觉)的联合学习机制。

学术价值与意义

本文的核心贡献在于: 1. 理论创新:将反向传播的核心数学原理(链式法则)与生物可实现的NGRAD机制分离,为大脑学习理论提供新范式。 2. 跨学科整合:弥合机器学习(如DTP算法)与神经科学(如树突计算)的鸿沟,推动两者协同发展。 3. 应用启示:对开发类脑学习算法(如脉冲神经网络中的信用分配)具有指导意义,尤其为神经形态硬件设计提供理论依据。

文章的突破性在于首次系统论证了反向传播的“计算思想”(而非具体实现方式)可能被大脑采用,并通过反馈对齐、目标传播等近似方法展示其生物学合理性。这一观点挑战了长期以来将反向传播视为纯粹工程工具的认知,为理解智能的本质提供了新维度。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com