分享自:

面向切换与融合神经形态计算:具有多神经形态功能的垂直体异质结晶体管及其高效深度学习应用

期刊:Advanced MaterialsDOI:10.1002/adma.202419245

面向可切换与融合神经形态计算的垂直体异质结晶体管:具备多功能的高效深度学习

一、 研究团队、期刊与发表时间

本研究由福州大学光电显示研究院、国家与地方平板显示技术联合工程实验室、福建省信息光电科技与创新实验室,以及湖南大学半导体学院(集成电路学院)的研究团队共同完成。第一作者为邹毅,通讯作者为陈惠鹏。其他作者包括刘迪、甘新艳、余仍坚、张向红、高灿松、陈振佳、徐陈辉、叶赟、胡媛媛、郭太良。本项研究工作于2025年发表于《先进材料》(Advanced Materials)期刊,文章DOI号为10.1002/adma.202419245。

二、 学术背景与研究目标

本研究属于神经形态计算与人工智能硬件交叉领域。在当前大数据与人工智能技术飞速发展的背景下,实现能在多样环境和任务中自适应学习的通用人工智能(Artificial General Intelligence, AGI)成为核心目标。实现AGI的两大关键路径分别是基于计算机科学的人工神经网络(Artificial Neural Network, ANN)和基于神经科学的脉冲神经网络(Spiking Neural Network, SNN)。ANN采用连续的电压(或数值)编码,在图像识别、自然语言处理等高精度任务中表现出色;而SNN采用生物启发的脉冲时间编码,具有事件驱动、功耗极低的特性,适用于动态传感和终端控制等场景。将ANN的高精度与SNN的高能效相结合,被认为是迈向AGI的有效途径。

然而,目前的ANN和SNN计算架构通常是独立设计的。在硬件层面,实现两者的融合或切换需要大量的辅助电路和复杂的算法进行训练转换,例如Intel的Loihi芯片、IBM的存内计算方案、曼彻斯特大学的SpiNNaker以及清华大学的“天机”芯片等。这导致了训练效率降低、功耗增加和硬件成本上升。根本原因在于,在单个器件层面上缺乏能够同时实现ANN和SNN核心计算功能(即电压编码的突触/激活神经元和脉冲编码的神经元)的通用物理机制。因此,开发一种能够无缝切换并融合ANN与SNN计算模式的新型神经形态器件,对于构建高效、低功耗、适应性强的AGI硬件具有迫切需求和重要意义。

本研究旨在提出并验证一种新型垂直体异质结神经形态晶体管(Vertical Bulk Heterojunction Neuromorphic Transistor, VHNT)。该器件的主要目标是:在单一器件结构内,首次集成突触、人工脉冲神经元和人工自激活神经元三种功能,从而在器件层面实现ANN和SNN的神经形态计算。研究者期望通过改变编程方式(即施加不同的电信号模式),无需外围辅助电路即可在ANN模式与SNN模式之间进行原位切换。此外,研究还致力于验证基于VHNT阵列构建的可切换神经网络硬件,并开发一种融合ANN与SNN优势的人工脉冲神经网络(Artificial Spiking Neural Network, ASNN)仿真训练架构,以在复杂数据集上实现高精度、高效率的识别任务。

三、 详细研究流程与方法

本研究的工作流程主要包括器件设计与制备、电学特性与神经形态功能表征、工作机制模拟、以及基于器件的网络架构构建与性能验证四大环节。

1. 器件设计与制备: 研究团队设计并制备了VHNT器件。其结构类似于垂直有机场效应晶体管,但具有独特的多层堆叠设计。具体制备步骤如下:以硅(Si)作为栅极,采用直流磁控溅射在其上沉积90纳米厚的氧化钽(TaOx)作为绝缘层和电阻转变层。随后,旋涂稀释的MXene(Ti₃C₂Tₓ)水溶液作为网状源极。通过热蒸发在MXene上沉积50纳米银(Ag)作为源极和人工神经元通道的顶电极。关键的有源层采用P型半导体材料PDVT-10与N型半导体材料N2200的共混物,通过旋涂形成约105纳米厚的体异质结薄膜。对于突触单元和神经元单元,采用了不同的掺杂比例以优化性能:突触单元采用低N型掺杂比例(PDVT-10:N2200 = 95:5)以确保电导状态在训练中的稳定性;神经元单元采用高掺杂比例(PDVT-10:N2200 = 85:15)以实现动态可调的神经元功能。最后,通过氯仿蚀刻图案化半导体层,并热蒸发沉积50纳米金(Au)作为漏极。器件面积为200×200 μm²。这种垂直结构使得沟道长度(半导体层厚度)和人工神经元通道距离(TaOx层厚度)均在纳米尺度,有利于低功耗运行。

2. 电学特性与多功能表征: 研究者使用半导体参数分析仪等设备对VHNT进行了系统测试,通过施加不同的电压信号模式(编程方式),验证了其三种工作模式。 * 人工脉冲神经元模式: 通过向栅-源极施加负电压脉冲序列,激活TaOx层中的电化学过程。当电压达到设定值(V_set)时,Ag电极发生氧化,Ag⁺离子迁移并在Si栅极还原,形成银导电细丝(Ag CFs),使神经元通道突然“放电”(电流急剧增加);当电压超过复位值(V_reset)时,细丝因焦耳热断裂,通道“泄漏”。实验演示了该模式下的泄漏积分放电(Leaky Integrate-and-Fire, LIF)特性,并验证了其脉冲幅值、脉冲间隔和占空比编码能力,即这些参数的变化可以调控神经元累积并触发脉冲所需的时间。 * 人工自激活神经元模式: 利用PDVT-10/N2200体异质结的双极性传输特性,通过匹配栅-源电压(V_gs)和源-漏电压(V_ds)的极性,实现了类似整流线性单元(ReLU)的激活函数功能。当V_ds为正、V_gs为负时,开启P型沟道(空穴电流);当V_ds为负、V_gs为正时,开启N型沟道(电子电流)。通过简单的极性匹配即可实现非线性激活,而无需复杂的外部电路。 * 突触模式: 通过向栅极施加连续的正或负电压脉冲,可以线性、对称地调制半导体沟道的电导。正脉冲导致兴奋性突触后电流(EPSC)增强,模拟长时程增强(LTP);负脉冲导致抑制性突触后电流(IPSC)减弱,模拟长时程抑制(LTD)。实验展示了器件的双脉冲易化/抑制(PPF/PPD)短时记忆特性,以及从短时记忆向长时记忆的过渡行为。特别值得注意的是,单个乘累加(MAC)操作的能耗仅为0.84纳焦,且电导更新具有良好的线性度。

3. 工作机制模拟: 为了从理论上阐明VHNT的多功能机制,研究团队进行了物理模拟和机理分析。 * 脉冲神经元机制: 基于Ag在TaOx中的电化学迁移和导电细丝形成/断裂过程进行解释,并引用了相关的朗之万方程模型来描述离子动力学。 * 自激活神经元机制: 通过能带图分析了在不同栅压和漏压极性下,P型沟道和N型沟道的开启与关闭,对应ReLU函数的实现。 * 突触机制: 提出了两种假设机制共同作用。一是栅电场调控网状源极开口处的载流子积累形成导电沟道。二是PDVT-10/N2200/PDVT-10形成的量子阱状异质结充当电荷陷阱中心。施加正栅压时,沟道电子被捕获在量子阱中,导致空穴浓度相对上升,电导增加(兴奋);施加负栅压时,被捕获的电子逃逸并与空穴复合,导致空穴电流下降,电导减小(抑制)。通过半导体仿真软件模拟了载流子浓度分布,验证了上述机理。

4. 网络架构构建与性能验证: 这是研究的应用验证环节。 * 可切换硬件阵列: 研究团队制备了1×10的VHNT阵列,并设计了驱动模块,构建了一个硬件演示平台。通过选择不同的编码方式(连续电压或脉冲序列),该平台可以在ANN架构和SNN架构之间进行原位切换训练。 * MNIST数据集验证: 在手写数字数据集(MNIST)上测试了基于VHNT的ANN和SNN。ANN架构(784-100-10全连接网络)达到了96.05%的识别准确率,单次训练周期时间较长(6.06秒)。SNN架构达到了84.3%的准确率,但单次训练周期时间极短(0.72秒),仅为ANN的11.88%。这验证了VHNT器件支持两种网络模式的有效性及其各自的特点(ANN高精度、SNN高效率)。 * ASNN融合架构仿真: 为了解决ANN训练参数多、SNN训练梯度难以及精度相对较低的问题,研究者创新性地提出了基于VHNT的人工脉冲神经网络(ASNN)融合训练仿真架构。该架构结合了CNN(用于特征提取)、ANN突触单元(进行高精度权重乘法)和SNN脉冲神经元单元(进行事件驱动式整合与传递)。在更复杂的CIFAR-10彩色图像数据集上,ASNN架构实现了约95%的最高识别准确率。性能分析表明:ASNN达到SNN最高准确率(状态1)时,其训练效率(达到相同精度所需迭代次数比)较纯SNN提升了283%,训练速度(达到相同精度所需时间比)提升了157%;ASNN达到ANN最高准确率(状态2)时,其训练速度较纯ANN提升了263%,训练效率提升了281%。

四、 主要研究结果及其逻辑关联

研究的各环节结果环环相扣,共同支撑了最终结论。 1. 器件基础特性结果: VHNT表现出稳定的双阈值开关特性(神经元通道)和优异的晶体管转移特性(突触/激活通道)。器件间性能稳定,经时性和循环耐久性良好。这些基础电学结果为后续的神经形态功能演示提供了可靠的物理载体。 2. 多功能演示结果: 这是核心实证部分。通过改变编程,VHNT成功演示了LIF脉冲神经元、ReLU自激活神经元以及线性可调突触的全部三种功能。这些结果直接证明了单一器件实现ANN与SNN核心计算单元的可行性,回答了研究背景中提出的“缺乏通用器件”的问题。低功耗(0.84 nJ/MAC)和良好线性度的结果,为其高效计算潜力提供了数据支持。 3. 机理模拟结果: 物理模拟和能带分析为上述多功能现象提供了合理解释。TaOx中的电化学细丝机制解释了脉冲发放;体异质结的量子阱电荷捕获与释放机制解释了突触电导的线性调制;双极性传输特性解释了自激活功能。这些机理分析增强了研究的科学深度,并指明了器件性能优化的可能方向(如材料比例、界面工程)。 4. 网络验证结果: 基于VHNT阵列的MNIST任务验证,从系统层面证明了该器件在实际神经网络应用中确实可以按需切换工作模式。ASNN在CIFAR-10上的优异表现(高精度、高效率)则是融合价值的集中体现。它表明,利用VHNT的独特能力构建新型网络架构,可以超越传统ANN或SNN的局限,在保持高精度的同时大幅提升训练速度与效率。这个结果将器件级的创新提升到了算法-硬件协同设计的系统级优势,有力地支撑了本研究对于推动高效AGI硬件的价值主张。

五、 研究结论与价值

本项研究得出结论:成功研制出一种新型垂直体异质结神经形态晶体管(VHNT),该器件首次在单一结构内集成了突触、人工脉冲神经元和人工自激活神经元功能,从而能够在器件层面实现ANN和SNN的神经形态计算,并可通过编程方式原位切换,无需辅助电路。基于VHNT构建的可切换神经网络硬件及ASNN融合仿真架构,在复杂模式识别任务中实现了高精度与高效率的突破。

本研究的价值体现在多个层面: * 科学价值: 提出并验证了一种通过耦合电阻转变效应(TaOx)和体异质结电荷调控效应(PDVT-10/N2200)来实现多模态神经形态功能的新器件物理策略。深化了对单一器件中实现多种编码和计算模式的理解。 * 技术价值: 提供了一种结构简单(无额外功能层)、功耗极低、功能丰富的神经形态器件解决方案。其垂直纳米沟道结构和与现有工艺兼容的制备方法,为高密度集成提供了可能。 * 应用价值: 为开发能够自适应不同任务和环境的高效能、低功耗AGI硬件提供了关键的器件级技术支持。ASNN架构展示出的显著性能提升,为未来设计新一代神经形态计算系统提供了新的思路和范式。

六、 研究亮点

  1. 功能集成创新: 首次在单一器件中实现了ANN(电压编码)和SNN(脉冲编码)所需的所有基本计算单元(突触、激活神经元、脉冲神经元),实现了真正的“三位一体”。
  2. 原位切换能力: 仅通过改变外部电信号编程即可切换工作模式,无需复杂的外围转换电路,极大地提高了硬件架构的灵活性和通用性。
  3. 融合网络架构创新: 提出了基于VHNT的ASNN融合训练架构,巧妙结合了ANN的精度优势和SNN的事件驱动效率优势,在CIFAR-10数据集上实现了精度与训练速度/效率的显著同步提升。
  4. 高性能与低功耗: 器件在纳米垂直沟道下实现了极低的单次MAC操作能耗(0.84 nJ)和良好的电导更新线性度,同时ASNN架构在系统层面也展现了卓越的训练效率。

七、 其他有价值的内容

研究中对MXene作为网状源电极的作用进行了深入探讨,并与银纳米线等电极进行了对比,指出MXene不仅能提供穿孔场调制,还具有部分场屏蔽效应,能显著增强栅压的可控性,降低导电细丝生长的随机性,从而提升器件稳定性。这一材料选择细节对优化类似器件性能具有参考价值。此外,论文支持信息中包含了丰富的补充数据,如不同半导体掺杂比例对保持特性的影响、与同类工作的详细性能对比表格等,进一步增强了研究的完整性和说服力。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com