基于混合忆阻器阵列的具有疲劳脉冲时序依赖可塑性学习的脉冲神经网络

分享自：
基于混合忆阻器阵列的具有疲劳脉冲时序依赖可塑性学习的脉冲神经网络

声学
物理学
期刊:nature electronicsDOI:10.1038/s41928-025-01554-4
【点击此处】阅读全文、收藏及针对性提问
面向神经形态计算的混合忆阻器阵列实现具有疲劳特性的脉冲时序依赖可塑性学习
作者与发表信息
本研究由来自中国多所顶尖研究机构的团队合作完成。主要作者包括 Dang Bingjie、Zhang Teng、Meng Fanqi、Liu Keqin、Yu Liutao、Zhang Qinghua、Wu Si、Gu Lin、Huang Ru 以及通讯作者 Yang Yuchao。参与单位包括北京大学集成电路学院、北京先进集成电路创新中心、中国科学院物理研究所、北京大学心理与认知科学学院、北京大学深圳研究生院电子与计算机工程学院、北京脑科学与类脑研究中心（CIBR）以及北京大学人工智能研究院脑芯片中心。该研究成果以“Spiking neural networks with fatigue spike-timing-dependent plasticity learning using hybrid memristor arrays”为题，于2026年1月15日在线发表于 Nature Electronics 期刊（2026年2月第9卷，213-224页）。
学术背景
本研究属于神经形态计算与忆阻器硬件领域。脉冲神经网络（SNN, Spiking Neural Networks）因其事件驱动的特性和生物启发的学习机制，被认为是实现高能效人工智能的潜在途径。其中，脉冲时序依赖可塑性（STDP, Spike-Timing-Dependent Plasticity）是一种核心的无监督学习规则，它根据突触前后神经元的脉冲精确时间差来调整突触权重。然而，传统的STDP学习在面对现实世界中复杂、混合了速率编码和时序编码的脉冲模式时存在局限性，特别是对高频输入适应性差，学习效率低下，难以有效提取复杂的时空特征。
生物突触中存在一种称为“突触疲劳”（synaptic fatigue）或短期可塑性的现象，即在高频刺激下，突触效能会暂时性下降，这有助于过滤噪声并增强对低频、相关性信号的检测能力。将这种疲劳动力学整合到STDP中，形成“疲劳STDP”（fatigue STDP）学习范式，有望显著提升SNN处理复杂时空信息的能力。然而，在硬件上高效、紧凑地实现这种结合了短期疲劳和长期记忆的混合突触动力学，一直是一个重大挑战。
本研究旨在解决这一硬件实现难题。其核心目标是开发一种新型的混合忆阻器突触单元，该单元能自然地融合短期疲劳和长期STDP学习功能，从而在硬件层面高效实现疲劳STDP算法，最终构建一个能够适应宽频率范围、具有高噪声鲁棒性、并能处理复杂时序事件数据的SNN系统。
详细研究流程
本研究是一个系统性的硬件设计与验证工作，主要流程可分为四个核心部分：1）具有疲劳特性的界面动态忆阻器（IDM, Interfacial Dynamic Memristor）的研发与表征；2）具有可调STDP特性的非易失性忆阻器（1T1R NVM）阵列的构建；3）基于IDM和1T1R NVM的混合突触单元及SNN系统的集成与功能验证；4）利用所构建的硬件SNN系统完成多项复杂的时序学习任务演示。
第一部分：界面动态忆阻器（IDM）的开发与疲劳动力学研究。 研究团队首先设计并制备了一种具有独特结构的W/α-IGZO/MgO/W界面动态忆阻器。该器件是模仿生物突触疲劳行为的关键。研究通过直流扫描和脉冲测试对其电学特性进行了详细表征。实验结果显示，该器件在负电压扫描下表现出高均匀性、高耐久性（超过2亿次循环）的挥发性电阻开关行为，这种“重置”过程是可逆的。至关重要的是，在施加不同频率的连续脉冲时，器件的电流响应表现出明显的频率依赖性抑制：脉冲频率越高，电流下降（即电导降低）越显著，这与生物突触在高频刺激下效能暂时降低的“疲劳”现象高度相似。
为了深入理解其物理机制，团队采用了原位透射电子显微镜（TEM） 和电子能量损失谱（EELS） 等先进表征技术。通过原位施加偏压并实时观察器件结构演变，他们发现疲劳行为的根源在于氧离子在电场驱动下的迁移与扩散。施加负压时，氧离子从非晶铟镓锌氧化物（α-IGZO）层迁移至氧化镁（MgO）层，导致MgO层电阻升高（重置）；撤去偏压后，氧离子在浓度梯度驱动下扩散回α-IGZO层，器件恢复低阻态。这种基于界面离子迁移而非局域导电细丝的全区域调制机制，是器件获得高均匀性和稳定疲劳动力学的关键。团队还对20个器件进行了统计测试，结果显示其循环间（cycle-to-cycle）和器件间（device-to-device）的变异系数极低，性能优于此前报道的多种动态忆阻器件。
第二部分：可调STDP非易失性忆阻器（1T1R NVM）阵列的构建。 长期记忆部分由一个36×32的1晶体管-1忆阻器（1T1R）阵列实现，其忆阻单元采用TiN/TaOx/HfO2/TiN结构。该器件表现出良好的模拟式电阻开关和多态特性。通过向器件的栅极、源极和漏极施加特定波形和时序的电压脉冲（分别模拟突触前、后神经元脉冲），可以在该器件上实现标准的STDP学习规则：当突触前脉冲先于突触后脉冲（Δt>0）时，权重增强（易化）；反之（Δt）则权重减弱（抑制）。实验在包含120个器件的阵列上进行，证明了该STDP窗口具有良好的均匀性。此外，研究还发现通过调节施加在晶体管栅极的电压（Vg），可以线性地调制STDP窗口的幅度，这为实现与IDM的耦合控制奠定了基础。
第三部分：混合突触单元集成与SNN系统搭建。 本研究最核心的创新在于将上述两种器件通过“栅极耦合”方式集成为一个紧凑的混合突触单元。具体而言，IDM的输出端（其电压Vg）连接到1T1R NVM中晶体管的栅极。IDM接收突触前脉冲输入（V_pre_idm），并根据输入频率产生相应的疲劳电压信号Vg(t)。这个Vg(t)信号实时调制着1T1R NVM晶体管的导通状态，从而影响施加在忆阻器本身上的实际电压，最终调控其STDP学习过程的强度。当高频输入到来时，IDM产生强烈的疲劳效应，导致Vg下降，进而抑制1T1R NVM的权重更新；反之，低频相关信号则能更有效地引起权重变化。这种设计巧妙地用单个IDM器件替代了传统方案中复杂的CMOS读出和乘法电路，极大地简化了硬件结构，提高了面积效率。
基于此混合突触单元，研究团队构建了一个完整的硬件SNN演示系统。该系统包含一个20×1的IDM阵列和一个36×32的1T1R NVM阵列，并集成了数模转换器（DAC）、模数转换器（ADC）、驱动电路以及基于现场可编程门阵列（FPGA）的控制逻辑。脉冲的整合与发放由软件实现的漏积分发放（LIF, Leaky Integrate-and-Fire）神经元模型完成。
第四部分：系统级功能验证与性能评估。 为验证混合SNN系统的优越性，研究团队设计了三个从易到难的时序学习任务进行实验演示。
相关性检测任务：系统接收12个通道的合成脉冲流，其中4个通道包含低频但时间相关的脉冲（信号），8个通道包含高频但无关的脉冲（噪声）。实验对比了仅使用1T1R NVM的传统STDP和采用混合器件的疲劳STDP。结果显示，传统STDP无法区分信号与噪声，对所有通道的权重都进行了增强。而疲劳STDP系统则能成功抑制高频噪声通道的权重更新，同时增强低频相关信号通道的权重，清晰地区分出了相关与无关的输入。
事件模式识别任务：任务难度升级，系统需要从包含噪声的背景中识别出由时空脉冲模式表示的字母（如‘P’， ‘K’等）。团队构建了一个20×6的SNN网络（20个输入通道，6个输出神经元对应6个字母）。使用包含噪声的字母“P”的事件数据进行训练。实验再次表明，传统STDP学习后的权重图混杂不清，无法有效识别模式；而疲劳STDP学习后，与字母相关的像素（对应低频相关脉冲）权重得到增强，背景噪声（对应高频无关脉冲）权重被抑制，形成了清晰的字母轮廓。此外，研究还测试了系统在不同输入脉冲频率（从10 Hz到500 kHz）下的识别准确率。传统STDP的性能对频率非常敏感，在非最佳频率下准确率骤降；而疲劳STDP系统则在全部测试频率范围内保持了稳定的高准确率，展现了卓越的频率适应性。
语音识别任务：为了展示在更接近实际应用场景下的性能，研究将系统用于嘈杂环境下的语音数字（“0”和“1”）识别。人类语音主要是低频信号，而环境噪声（如鸟鸣、尖叫）往往包含大量高频成分。疲劳STDP突触的特性恰好能抑制高频噪声，保留低频语音特征。实验使用Spiking Heidelberg Digits数据集，将音频信号通过内耳模型转换为脉冲序列。在无噪声情况下，疲劳STDP和传统STDP均能达到超过91.5%的识别准确率。然而，当加入鸟鸣和尖叫等高频环境噪声后，传统STDP系统的准确率大幅下降，而疲劳STDP系统则凭借其固有的高频抑制能力，保持了极高的识别准确率，显著优于传统方法。
主要结果
成功研制出高性能界面动态忆阻器（IDM）：该W/α-IGZO/MgO/W器件表现出优异的挥发性开关特性、极高的循环均匀性（C2C变异系数0.04%）和耐久性（>2×10^8次）。关键的是，它首次在忆阻器件中实现了可控的、频率依赖的“突触疲劳”动力学，其行为与生物突触的短期抑制高度相似。原位TEM和EELS分析揭示了其物理机制源于氧离子在异质界面间的可逆迁移，这是一种全区域调控的界面型开关机制。
创新性地提出了“栅极耦合”混合突触架构：将IDM与1T1R NVM通过栅极简单连接，构成了一个紧凑的、硬件高效的疲劳STDP突触单元。该设计无需额外的CMOS电路进行权重乘法和短期状态读取，简化了结构，降低了面积和功耗。实验证实，该混合单元能根据输入脉冲频率动态调整STDP学习强度，高频输入被抑制，低频相关信号被增强。
构建并验证了全功能混合忆阻器SNN硬件系统：该系统在三个不同难度的时序学习任务上均表现出色：
在相关性检测中，能有效从高频噪声背景中提取出低频时序相关信号。
在事件模式识别中，能在宽频率范围（10 Hz - 500 kHz）和噪声背景下稳定学习并识别时空模式，且性能不受输入频率剧烈变化的影响。
在语音识别中，展现出对高频环境噪声的强大鲁棒性，在嘈杂环境中保持高识别率，性能远超传统STDP方案。
结论与意义
本研究成功报道了一种基于混合忆阻器阵列的、具有疲劳STDP学习能力的脉冲神经网络硬件系统。其核心科学价值在于： 1. 提出并验证了一种新颖的硬件突触模型：通过将具有短期疲劳动力学的IDM与具有长期可塑性的NVM相结合，在物理层面自然实现了生物启发的疲劳STDP学习规则，为在神经形态硬件中集成更复杂的突触动力学提供了可行的技术路径。 2. 揭示了新型界面动态忆阻器的工作机理：通过先进的原位表征手段，明确了W/α-IGZO/MgO/W体系中氧离子迁移主导的界面型开关和疲劳动力学，为设计高性能动态忆阻器提供了重要指导。 3. 展示了强大的系统级信息处理能力：所构建的硬件SNN系统在处理混合编码（速率/时序）、宽频率范围输入以及高噪声环境下的复杂时空信息方面表现出显著优势，证明了疲劳STDP机制在提升SNN现实应用潜力方面的巨大价值。
在应用层面，该工作为开发下一代高能效、高鲁棒性的神经形态计算芯片奠定了基础。其硬件高效的混合架构有助于推动SNN从实验室原型走向实际应用，特别是在需要实时处理复杂、非平稳时序信号（如动态视觉传感、听觉处理、物联网边缘计算）的领域具有广阔前景。
研究亮点
器件创新：首次研制出具有明确“突触疲劳”行为且均匀性极高的界面动态忆阻器（IDM），并深入揭示了其物理机制。
架构创新：提出并实现了“栅极耦合”的混合忆阻突触单元，以极简的硬件结构（无额外CMOS电路）实现了复杂的疲劳STDP学习功能，显著提升了面积和能效。
功能创新：构建了完整的硬件SNN演示系统，并在系统级别上验证了疲劳STDP在处理宽频带、噪声环境下的复杂时序任务（相关性检测、模式识别、语音识别）中的卓越性能，特别是其前所未有的频率适应性和噪声鲁棒性。
方法创新：综合运用了从纳米尺度原位表征（TEM, EELS）到器件制备、电路集成、再到系统级算法验证的全链条研究方法，为类脑计算硬件研究提供了范本。
其他有价值内容
研究团队提供了详细的器件制备方法（IDM的电子束光刻与磁控溅射工艺，1T1R NVM的CMOS兼容后端集成工艺）、测试系统搭建方案（定制化板卡与FPGA控制）以及用于生成训练数据的事件数据生成算法（已在Zenodo平台开源）。这些细节为其他研究者复现和推进相关工作提供了重要参考。性能指标方面，该混合忆阻器操作速度达2微秒，每次操作功耗约4.01微瓦，系统能效达0.298 TOPS/W，展示了其在低功耗边缘计算场景的应用潜力。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问