分享自:

RHT NOC:基于小芯片的多核系统可重构混合拓扑架构

期刊:IEEE Transactions on Very Large Scale Integration (VLSI) SystemsDOI:10.1109/TVLSI.2025.3572112

该文档属于类型a,即报告了一项原创性研究。以下是针对中国读者的详细学术报告:


可重构混合拓扑(RHT NoC):面向Chiplet多核系统的新型互连架构

一、作者与发表信息
本研究由Dongyu Xu(安徽工程大学)、Wu Zhou(安徽师范大学)、Zhengfeng HuangHuaguo Liang(合肥工业大学微电子学院)及Xiaoqing Wen(日本九州工业大学)合作完成,发表于IEEE Transactions on Very Large Scale Integration (VLSI) Systems 2025年8月刊(Volume 33, Issue 8)。论文标题为《RHT NoC: A Reconfigurable Hybrid Topology Architecture for Chiplet-Based Multicore System》。


二、学术背景
科学领域:本研究属于高性能计算与集成电路设计交叉领域,聚焦于片上网络(Network-on-Chip, NoC)的拓扑架构优化。
研究动机:随着摩尔定律放缓,Chiplet(小芯片)技术通过2.5D/3D集成实现异构计算成为主流,但传统静态NoC拓扑无法适应动态负载,导致通信延迟与功耗成为瓶颈。现有方案(如无线-有线混合拓扑)存在面积开销大、灵活性不足的问题。
目标:提出一种可重构混合拓扑(Reconfigurable Hybrid Topology, RHT),通过动态结合网状网络与环形网络的优势,实现低延迟、高能效的跨Chiplet通信。


三、研究流程与方法
1. 问题建模与分析
- 研究对象:基于8×8至16×16规模的NoC,对比传统Mesh、静态Torus及无线混合拓扑(WiNoC)。
- 关键发现:传统Mesh网络80%时间内单向链路带宽利用率不足,且路由器静态功耗占比高。

  1. RHT架构设计

    • 可逆链路(Reversible Link):单链路双向复用技术(图2),通过4个传输门控制方向(rev信号),节省50%链路资源。
    • 动态环形网络(Bufferless Torus Loop)
      • 环形接口(RI):集成注入/弹出模块,支持水平/垂直环的动态组合(图6)。
      • 组合机制:采用改进的并行迭代匹配算法(PIM),根据流量强度动态优化环路连接(如fi,j流量矩阵),最小化跳数(公式1-2)。
    • 混合传输机制
      • 低负载时优先通过环形网络传输,减少路由器唤醒次数;
      • 高负载时自适应分配Mesh网络带宽,避免竞争(算法1)。
  2. 硬件实现与优化

    • 路由器重构:集成链路控制器(LC)与RI,支持电源门控(Power Gating, PG)技术(图3)。
    • 低功耗设计:环形网络无缓冲特性减少仲裁开销,延长路由器睡眠周期。
  3. 仿真验证

    • 工具:基于Noxim(周期精确模拟器)与DSENT(功耗建模)。
    • 测试场景
      • 真实负载:Parsec基准测试(Netrace框架);
      • 合成流量:随机(Random)、位反转(Bit-reversal)等模式。
    • 对比方案:传统Mesh、Changesub(多层子网)、WiNoC等。

四、主要结果
1. 性能提升
- 延迟:动态环形组合(Mesh-DyRing)比基准Mesh降低48.6%延迟(图9),比WiNoC降低27.2%(无线协商开销显著)。
- 吞吐量:合成流量下饱和吞吐量提升72%(图12),16×16网络中提升103%。
- 能效:Mesh-DyRing-PG(带电源门控)静态功耗降低56.2%,总功耗减少61.3%(图11)。

  1. 可扩展性验证

    • 12×12与16×16网络中保持低延迟增益(图13),证明架构对大规模系统的适应性。
  2. 面积开销

    • RHT的环形接口与分配器仅增加4.6%面积(65nm工艺),远低于WiNoC的无线组件(54%增量,表II)。

五、结论与价值
1. 科学价值
- 提出首个动态结合Mesh与Torus的NoC架构,通过逻辑级重构(非物理层技术)实现拓扑灵活性。
- 验证了环形网络在减少跳数(公式1)与电源门控效率上的理论优势(公式3-6)。

  1. 应用价值
    • 为Chiplet系统提供低开销(面积增加%)、高能效的互连方案,支持AI加速器与高性能计算芯片的异构集成。
    • 动态环路组合机制可扩展至光电NoC(如硅光子互连)的未来研究。

六、创新亮点
1. 方法创新
- 链路动态复用:单可逆链路替代传统双向固定链路,节省硬件资源。
- 全局流量感知组合:通过PIM算法实现微秒级环路重构(n!/2次比较)。
2. 性能突破
- 在同等延迟下,功耗仅为WiNoC的43.8%;
- 环形网络的零缓冲设计减少20%动态功耗。


七、其他亮点
1. 协议级死锁避免:通过分离请求/响应队列(第七节),解决环形网络潜在活锁问题。
2. 开源工具链:研究代码基于Noxim扩展,支持动态拓扑仿真,便于后续研究复现。

(全文完)


注:本文图表及公式引用均来自原论文,数据细节可参考原文第2104-2117页。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com