基于垂直堆叠CAA-IGZO 4F² 2T0C细胞的3D EDRAM计算内存设计

分享自：
基于垂直堆叠CAA-IGZO 4F² 2T0C细胞的3D EDRAM计算内存设计

信息科学
半导体科学与信息器件
期刊:IEEE
本研究的通讯作者包括清华大学电子工程系的Xueqing Li与IMECAS（中国科学院微电子研究所）的Ling Li、Di Geng。该成果于2023年发表在IEEE International Electron Devices Meeting (IEDM)，标题为《30 mb/mm2/layer 3d edram computing-in-memory with embedded beol peripherals and local layer-wise calibration based on first-demonstrated vertically-stacked caa-igzo 4f2 2t0c cell》。
学术背景随着人工智能模型规模爆发式增长，存内计算（Computing-in-Memory, CIM）面临内存密度的严峻挑战。3D堆叠技术因其垂直扩展能力成为潜在解决方案，但传统硅基动态随机存储器（DRAM）受限于物理尺寸和功耗。氧化铟镓锌（IGZO）晶体管因其高迁移率、低漏电特性成为后道工艺（BEOL）兼容存储器的理想选择。本研究首次通过垂直环绕栅（Channel-All-Around, CAA）结构的IGZO 2T0C（双晶体管零电容）单元，实现了超高密度3D嵌入式DRAM（eDRAM）存算一体架构，旨在解决三大核心问题：
 1. 垂直堆叠可行性：先前研究仅提出平面2T0C概念，未实现实际堆叠验证；
 2. 工艺波动抑制：IGZO器件的层间与层内性能差异导致计算可靠性下降；
 3. 外围电路优化：传统硅基前道工艺（FEOL）外围电路面积过大，制约内存密度。
研究流程与创新方法1. 器件制备与表征（图3-8）工艺开发：
 研究团队采用原子层沉积（ALD）在250°C低温下制备2层垂直堆叠的CAA-IGZO 2T0C单元。关键工艺包括：
 - MIM结构刻蚀：通过干法刻蚀形成65/75nm临界尺寸（CD）的垂直通孔；
 - 自对准栅堆叠：依次沉积IGZO沟道层、HfOx栅介质和IZO栅电极，避免高温工艺损伤底层器件；
 - 层间介质优化：针对第二层堆叠对第一层性能的影响（图7），优化ILD（层间电介质）刻蚀工艺，使上层工艺对下层器件Ion和亚阈值摆幅（SS）的影响控制在10%以内。
器件性能：
 - 记录性尺寸：单元面积仅0.023 μm²（4F²设计），比传统硅基eDRAM缩小近两个数量级；
 - 长保持时间：通过优化寄生电容，在0.1V信号衰减标准下保持时间达20秒（图8f），满足AI加速器刷新需求。
2. 3D存算架构设计（图9-13）BEOL嵌入式外围电路：
 - 解码器创新：采用与存储单元相同的2T0C结构实现行/列地址解码（图10），通过共享全局垂直线节省面积；
 - 密度优势：相比FEOL控制器，BEOL方案使计算密度提升1.54倍（图12d）。
局部校准模块：
 - 数据恢复机制：通过查找表（LUT）存储不同层的参考电压，结合写入验证（Write-and-Verify）降低层间差异影响；
 - 抗波动能力：在VGG-8网络和CIFAR-10数据集测试中，即便器件相对波动达20%、8层堆叠且每层性能衰减0.9倍，仍保持90%准确率（图15）。
3. 系统级验证（图14-17）基准测试：
 - 超高密度：单层存储密度达30 MB/mm²，计算密度50 TOPS/mm²（表1）；
 - 能效比：256 TOPS/W，优于同类基于RRAM或NOR Flash的CIM方案；
 - 精度优势：局部计算单元（LCU）的数字化恢复使50%器件波动下的推理准确率较模拟域累积方案提升29%（图14）。
结论与价值本研究通过三个核心突破奠定了CAA-IGZO 3D eDRAM存算一体的技术基础：
 1. 首款实测垂直堆叠2T0C单元：为超高密度存储器提供了可扩展的工艺蓝图；
 2. BEOL-FEOL协同设计：通过外围电路嵌入式布局，突破传统硅基CMOS的面积瓶颈；
 3. 自适应校准体系：解决了多层堆叠的可靠性难题，支持未来32层以上的扩展。
科学价值上，该成果为后摩尔时代存算一体芯片提供了新范式；应用层面，其50 TOPS/mm²的算力密度可支持边缘端大规模神经网络部署。相较于IEDM 2022报道的45nm IGZO方案，本工作将单元面积进一步缩小67%，且首次实现校准功能集成（图17）。
研究亮点首个75nm CD的CAA-IGZO垂直堆叠器件：通过ALD低温工艺实现层间低干扰（图4）；
 
存算密度双重突破：内存密度较8层3D RRAM方案提升5倍，计算精度超越5b/4b量化硅基方案（表1）；
 
自主开发校准算法：LCU模块的LUT动态调整机制为行业首创（图13）。
 
其他贡献研究团队公开了完整的器件工艺参数（图6）和SPICE模型，可供后续研究复现。资助信息显示，该工作获中国国家重点研发计划（2019YFA0706100）及中科院战略先导专项（XDB30030000）支持。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问