交叉点阻变存储器:非理想特性与解决方案
作者与发表信息 本文由华中科技大学武汉光电国家研究中心、信息存储系统教育部重点实验室、计算机科学与技术学院的Chengning Wang, Dan Feng, Wei Tong, Jingning Liu, Zheng Li, Jiayi Chang, Yang Zhang, Bing Wu, Jie Xu, Wei Zhao, Yilin Li和Ruoxi Ren共同撰写。该论文作为一篇综述文章,发表于2019年6月的《ACM Transactions on Design Automation of Electronic Systems》期刊(第24卷第4期,文章编号46)。
论文主题与背景 本文是一篇关于新兴计算型阻变存储器(Resistive Memory),特别是其核心架构——交叉点阵列(Cross-point Array)的全面综述。论文聚焦于阻变存储器在走向大规模商业化应用过程中面临的关键挑战:器件与电路层面的各种非理想特性。随着大数据时代的到来,以DRAM为基础的传统冯·诺依曼架构面临可扩展性、能耗和“内存墙”瓶颈等严峻挑战。新兴的阻变存储器(如相变存储器PCM、金属氧化物阻变存储器RRAM)因其非易失性、高密度、低功耗、以及与CMOS工艺兼容的3D集成潜力,被视为克服这些挑战、并实现存内计算(In-memory Computing)的理想候选者。然而,阻变存储器在单元(Cell-level)和阵列(Array-level)层面存在的非理想特性,严重影响了其在数据存取和模拟计算时的可靠性、性能、精度和能效。本文旨在系统性地回顾和分析这些非理想特性,并总结当前学术界和工业界提出的、从器件与电路协同优化角度出发的实用解决方案。
主要观点与论述
1. 阻变存储器阵列的基本结构与工作原理 论文首先介绍了阻变存储器的器件基础,即利用电阻状态存储信息的双端器件,其状态可在高阻态(HRS)和低阻态(LRS)之间通过SET和RESET操作切换,并可实现多级存储(MLC)。随后,文章详细回顾了五种主要的存储器阵列构建模块: * 1T1R阵列:每个存储单元串联一个选择晶体管。虽然提供了良好的选通能力,但晶体管占据了大量面积(最小6F²到12F²),限制了存储密度,且控制逻辑复杂。 * 交叉点阵列(1R和1S1R):这是本文的核心焦点。存储单元位于字线(Word-line)和位线(Bit-line)的交叉点上,理论上可实现4F²的最小单元面积,具有极高的密度潜力。其中,1R阵列依赖存储器件自身的非线性I-V特性(如自选通、自整流或互补阻变CRS)来抑制漏电流(Sneak Current),但难以完美实现。1S1R阵列则在存储单元上垂直堆叠一个选通器(Selector,如指数型或阈值开关型),能更有效地抑制漏电流和IR压降,是当前高密度交叉点阵列的主流方案。 * 1TnR阵列:作为1T1R和交叉点阵列的折中方案,每个局部线选择晶体管(LLST)与n个并联的存储器件串联,在局部形成交叉点结构,通过晶体管提供部分隔离,平衡了面积、功耗和性能。 * CMOL阵列:采用旋转分段字线和位线,并通过上下两层CMOS地址解码层进行连接,形成一种4D地址布局,能有效减少部分选中单元的数量,从而降低寄生效应和漏电流。 * 3D阵列:为了进一步提升存储密度和降低成本,论文介绍了3D水平交叉点阵列(多层堆叠共享连线)和3D垂直交叉点阵列(在垂直柱状电极侧壁形成存储单元)。3D集成是突破二维缩放极限的关键技术。
2. 非理想特性对基本操作(写入与读取)的影响及解决方案 论文的核心部分深入剖析了在非理想交叉点阵列上进行写入和读取操作时面临的挑战。 * 写入操作:关键在于确保足够的有效电压施加在选中的存储单元上,同时最小化对未选中单元的干扰。主要挑战包括: * 互联电阻(IR Drop):纳米尺度连线的电阻会导致沿字线/位线的电压下降,使得阵列中不同位置的单元感受到的有效电压不均匀,导致写入延迟、能耗和可靠性问题。解决方案包括采用优化的连线连接方案(如双端接地偏置DSGB)和电压偏置方案(如1/2偏置、1/3偏置),以及运行时根据选中单元的位置和数据模式动态调整时序参数。 * 漏电流(Sneak Current):通过未选中单元的寄生电流路径会消耗额外功率,并加剧IR压降。除了使用选通器(1S1R)外,还可以通过动态重构开关模式,将不常访问的单元配置为互补阻变(CRS)模式以阻断漏电流路径。 * 单元级非理想特性:包括开关非线性和不对称性(导致多级写入困难)、器件间(D2D)和周期间(C2C)的变异性(影响写入精度和耐久性)、有限的耐久性(尤其是尾比特Tail-bit问题)以及焦耳热干扰(在3D阵列中更严重)。解决方案涉及材料/界面工程、最坏情况设计、写验证(Write-and-Verify)算法、磨损均衡(Wear Leveling)以及温度感知的操作方案。
3. 非理想特性对模拟计算(矩阵向量乘法)的影响及解决方案 交叉点阵列的物理结构天然适合并行执行矩阵向量乘法(MVM)或点积(Dot-product)运算,这是实现存内计算加速神经网络、科学计算等应用的基础。然而,非理想特性严重制约了计算精度: * 互联电阻与非线性I-V特性:会导致输出电流与理想线性关系发生偏离。解决方案包括:1) 优化逻辑到物理的映射,例如采用脉冲宽度调制(PWM)代替脉冲幅度调制(PAM)作为输入向量,以规避I-V非线性的影响;2) 利用奇异值分解(SVD)等方法降低所需阵列规模,从而减轻IR压降影响;3) 为输入向量映射寻找解析解以补偿非线性。 * 器件变异性与有限动态范围:限制了可区分的电阻状态数量,从而限制了计算精度和权重分辨率。采用多单元表示单个比特(如多个器件求和平均)是克服变异性、提高精度的有效方法。 * 阵列规模与外围电路:并行MVM操作会产生巨大电流,对CMOS外围电路的驱动能力提出挑战,因此实际可用于计算的阵列规模远小于存储阵列。
4. 统一的、可重构的计算型内存架构展望 论文最后描绘了一个统一的、可重构的计算型内存架构蓝图。该架构包含可配置的子存储体(Subbank),它们可以在计算模式、转置内存模式或传统内存模式之间切换。架构的核心是一个位于内存硬件层和应用层之间的操作转换层(Operation Translation Layer),负责将高级应用任务(如MVM)映射并翻译为底层存储器硬件能够高效执行的一系列基本操作(如特定的连线连接、电压偏置、逻辑-物理映射等),从而协同优化静态参数和动态运行时操作,以最大程度地缓解非理想特性的影响。
论文的意义与价值 本综述论文具有重要的学术和工程指导价值: 1. 系统性总结:首次从“器件-电路-架构”协同设计与优化的跨层视角,系统性地梳理和分类了交叉点阻变存储器在单元和阵列层面的各类非理想特性,并建立了它们对存储访问和模拟计算性能影响的清晰分析框架。 2. 解决方案集成:不仅指出了问题,更全面回顾和集成了从器件工程、电路设计到架构和算法层面的多种解决方案,特别是强调了动态运行时优化策略(如连线连接、电压偏置、逻辑-物理映射、读取参考设置、开关模式重构)的重要性,为后续研究指明了方向。 3. 面向应用:紧密围绕存内计算这一新兴范式,深入探讨了非理想特性对MVM等核心运算的影响及缓解方案,为设计实用的计算型内存系统提供了关键见解。 4. 前瞻性指导:文章对多级单元(MLC)交叉点阵列和3D交叉点阵列的操作挑战进行了分析,并对统一可重构架构的描绘,为未来高密度、高能效非易失性内存和存内计算芯片的设计与开发提供了重要的理论依据和技术路线参考。