分享自:

一种采用7纳米鳍式场效应晶体管工艺的112Gb/s PAM-4低功耗9抽头滑动块判决反馈均衡器

期刊:2021 IEEE International Solid-State Circuits Conference

该文档属于类型a:一篇关于单个原创性研究的报告。

一项创新的112Gb/s PAM-4低功耗9抽头滑动块判决反馈均衡器研究

本文旨在向研究同行介绍一项发表于高性能电路设计顶级会议上的突破性工作。这篇由James Bailey、Hossein Shakiba、Ehud Nir、Grigory Marderfeld、Peter Krotnev、Marc-Andre Lacroix和David Cassan共同完成的研究,所有作者均隶属于华为技术有限公司(Huawei Technologies),其加拿大(多伦多和渥太华)研究中心。该研究成果以论文形式发表于2021年度的IEEE国际固态电路会议(International Solid-State Circuits Conference, ISSCC)。该会议是集成电路设计领域最具影响力的学术盛会,论文的录用和发表标志着研究成果的前沿性和技术成熟度。

从学术背景来看,这项研究隶属于高速有线通信(Wireline Communication)接收机设计领域,具体聚焦于数字信号处理(DSP)中的均衡技术。随着高速模数转换器(ADC)的进步,基于DSP的均衡已成为补偿长距离(Long-Reach, LR)信道损耗的主流方案。其中,前馈均衡器(Feed-Forward Equalizer, FFE)和判决反馈均衡器(Decision Feedback Equalizer, DFE)是关键组件。FFE计算复杂度高、会放大噪声;而传统的DFE虽不放大噪声,但其反馈环路结构导致时序收敛困难,难以实现多抽头(tap)设计,多数先进实现被限制在1-2个抽头。这意味着DFE无法完全消除信道后标间干扰(postcursor ISI),部分均衡负担仍需由FFE承担,增加了整体面积和功耗。因此,该研究的目标明确:打破传统DFE的反馈环路时序壁垒,实现一种可流水线化、能够扩展到高抽头数的DFE架构,从而用单一的、更长的DFE承担全部后标干扰消除任务,以达成降低系统面积、功耗,并提升性能的综合优势。

研究的核心在于提出并验证了一种名为“滑动块DFE”(Sliding-Block DFE, SB-DFE)的新型架构及其详细工作流程。整个研究流程并非传统的生物或化学实验流程,而是一个完整的集成电路设计、实现、验证与测试的工程流程,可分为以下几个关键环节:

第一,SB-DFE架构的概念设计与原理阐述。研究团队首先从算法层面定义了SB-DFE的工作机制。其核心思想是将连续的数据流分割成相互重叠的块(Block)进行处理。每个块包含H个“历史”(History)符号和K个待解码(Decode)符号。解码器硬件由B(B=H+K)个串联的“判决器”(Decisor)构成,每个判决器实现DFE的抽头函数。关键创新在于,每个块在开始解码时,可以利用来自FFE的初步估计值作为“种子”(Seeding)来初始化前H个历史符号的状态。块内的解码过程允许完全的流水线操作,因为块的边界打破了传统DFE的严格时序反馈环路。前H个符号的解码结果仅用于块内后续符号的决策,在块处理完成后被丢弃,只有最后K个稳定后的符号被输出。这个过程使得硬件可以在一个较宽松的时钟周期内完成复杂计算,从而能轻松实现高抽头数设计。

第二,系统集成与芯片实现。为了验证SB-DFE的优势,研究团队将其集成到一个完整的112Gb/s PAM-4(四电平脉冲幅度调制)接收机中。该接收机采用7纳米鳍式场效应晶体管(FinFET)工艺制造。接收机架构包括:模拟前端(AFE)、一个采样率为56GS/s的时间交织(Time-Interleaved)异步逐次逼近寄存器(SAR)ADC、以及核心的数字信号处理(DSP)路径。DSP路径设计了一个可选择的双模式结构以进行公平对比:模式一采用了所提出的“5抽头前标FFE + 9抽头SB-DFE”;模式二则是一个传统的参考方案,即“5抽头前标 + 7抽头后标FFE + 常规2抽头DFE”。两个方案的总均衡能力(窗口)是相同的,区别在于后标ISI是由SB-DFE单独处理,还是由FFE和短DFE共同处理。此外,系统还包含用于时钟数据恢复(CDR)的定时路径和用于系数自适应的最小均方(LMS)算法模块。这种在同一芯片上集成新旧两种方案的“对比实验”设计,为性能评估提供了极具说服力的平台。

第三,性能仿真与可行性分析。在流片前,研究团队通过软件仿真和逻辑综合来评估SB-DFE的性能和可扩展性。他们首先仿真了在一个理想ISI信道上,PAM-4 SB-DFE的误码率(BER)随符号位置的变化。结果显示,SB-DFE的BER在经过块内前几个符号的“建立”(Settling)过程后,迅速收敛到与理想等长传统DFE相同的水平。仿真还对比了“零种子”和“FFE均衡后种子”两种初始化方式,证明有效的种子可以将所需的“历史”长度H从大约9减少到4,从而降低开销。接着,他们使用电子设计自动化工具对一个参数化的112Gb/s SB-DFE解码器进行逻辑综合(Synthesis),评估其面积随抽头数增加的变化趋势。综合结果表明,在7nm工艺、1GHz时钟频率下,SB-DFE的面积比实现相同均衡长度的参考DSP方案(FFE+短DFE)小50%至60%,并且每增加一个抽头的增量成本仅为FFE的约2/3。综合还证明,SB-DFE的架构可以轻松扩展到30个抽头以上,展示了其卓越的可扩展性。

第四,流片后测试与性能验证。这是研究的实证核心环节。研究团队对制造出的芯片进行了实际测量。测试对象就是集成了上述两种DSP模式的接收机芯片。他们使用了插入损耗(Insertion Loss, IL)分别为36dB和45dB(在28GHz处)的长距离信道作为测试环境。测试内容包括:1) 功耗和面积测量:直接对比两种模式芯片的数字部分门电路数量、核心面积和功耗。2) 误码率测量:在112Gb/s速率下,测量两种模式在不同信道条件下的最终链路BER。3) 均衡器抽头系数观察:读取并显示SB-DFE在自适应后收敛的抽头值,观察其对高阶ISI的消除情况。4) 眼图和浴缸曲线测量:通过捕获的符号数据重建眼图,并绘制表征时序抖动的浴缸曲线(Bathtub Curve),直观展示信号质量。

研究的主要结果详实而具有说服力。在系统集成与性能仿真环节,仿真结果(对应论文图8.8.3)直观证明了SB-DFE算法的有效性及其通过种子初始化减少开销的潜力。综合结果(对应图8.8.4)则用数据曲线清晰展示了SB-DFE相对于传统方案在面积上的巨大优势及其良好的线性扩展特性,为长抽头DFE的可行性提供了关键证据。在流片后测试环节,测量数据给出了决定性的结论:在相同的36dB损耗信道上,采用9抽头SB-DFE的方案相比传统参考方案,实现了多重性能提升。具体数据包括:DSP部分门电路数量和面积减少30%;数字功耗降低17%,相当于每比特节省0.33皮焦耳(pJ/b);而最关键的链路误码率从参考方案已经很优秀的水平进一步改善了近一个数量级,达到了2e-11的极高水平。对于更恶劣的45dB信道,SB-DFE接收机依然能打开眼图,并在0.1单位间隔(UI)的采样窗口下实现1e-5的BER。这些测量结果(对应图8.8.5、8.8.6)不仅验证了仿真和综合的预测,更以硬件实测证明了新架构的实际效能。特别值得注意的是,对SB-DFE抽头系数的观察显示,其高阶抽头(第3抽头及以上)具有显著的权重,这证实了它确实在有效地消除FFE通常难以高效处理的远处后标ISI。所有结果逻辑连贯:架构创新(SB-DFE)带来了硬件可行性(可综合、可流水线),进而实现了高性能芯片(面积小、功耗低、BER优),最终通过实测数据全面证实了其相对于现有技术的优越性。

研究的结论是明确且有力的。这项研究成功提出并硬件验证了滑动块DFE这一创新架构。其科学价值在于,它从算法和电路结构层面,从根本上解决了制约传统DFE抽头数扩展的时序反馈环路难题,为高速有线接收机中的均衡器设计提供了一条新的、更优的技术路径。应用价值则直接体现在产品性能上:采用SB-DFE的接收机能够以更小的芯片面积、更低的功耗,实现更优异的误码率性能,这对于下一代数据中心互联、高性能计算等需要极高数据速率和能效的应用场景具有重要意义。研究还指出,通过移除测试特性和优化种子,预计还能再减少15%的面积和功耗,展现了进一步的优化潜力。

本研究的亮点非常突出。首先,最重要的发现是SB-DFE架构本身,它通过“分块”和“种子初始化”的巧妙设计,打破了DFE的时序墙,这是观念上的突破。其次,研究方法的特殊性在于其完整的“从理论到芯片”的验证闭环:不仅提出了新算法,还通过详细的仿真、综合分析其理论优势,更关键的是在同一颗测试芯片上集成了新旧方案进行“背对背”对比测试,这种对比实验设计使得性能提升的归因非常清晰,结论极具说服力。第三,研究目标的特殊性在于它直击产业界痛点——在追求更高数据速率时面临的功耗和面积挑战,其成果(112Gb/s, 极低BER, 显著面积/功耗节省)直接达到了业界领先水平。论文中的对比表格(图8.8.7)显示,其性能指标明显优于同期的其他已发表工作,确立了该项技术的领先地位。

此外,论文中还包含一些有价值的细节。例如,它提到了SB-DFE的另一个优势:错误传播(Error Propagation)在块边界会被终止,这有助于限制由误判引起的连续错误突发长度。同时,论文也坦诚讨论了之前有相关研究提出过“打破环路”的概念,但因其硬件开销过大而未实际实现,从而衬托出本次提出的SB-DFE在控制开销方面的创新性和实用性。这些细节进一步丰富了研究的层次和严谨性。总而言之,这项研究是一项在高速集成电路设计领域,集创新性、实用性和卓越性能于一体的典范工作。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com