基于计算重用的能效哈达玛SATD硬件架构

分享自：
基于计算重用的能效哈达玛SATD硬件架构

期刊:IEEE Transactions on Circuits and Systems–I: Regular PapersDOI:10.1109/TCSI.2019.2900004
这篇文档属于类型a，即报告了一项原创性研究。以下是基于文档内容生成的学术报告：
作者与发表信息
 本研究的作者包括Ismael Seidel、Marcio Monteiro、Bruno Bonotto、Luciano Volcan Agostini和José Luís Güntzel，他们分别来自巴西的圣卡塔琳娜联邦大学（Federal University of Santa Catarina）和佩洛塔斯联邦大学（Federal University of Pelotas）。该研究发表于2019年6月的《IEEE Transactions on Circuits and Systems–I: Regular Papers》期刊第66卷第6期。
学术背景
 本研究的主要科学领域是视频编码硬件设计，特别是针对基于Hadamard变换的绝对变换差和（Sum of Absolute Transformed Differences, SATD）的硬件架构优化。SATD是一种失真度量方法，与常用的绝对差和（Sum of Absolute Differences, SAD）相比，能够更好地与其他视频编码步骤相关联，从而提高编码效率。然而，由于Hadamard变换（Hadamard Transform, HT）的计算复杂性，SATD在视频编码中占据了大量时间。随着嵌入式编码器的广泛应用，计算复杂性和能效成为视频编码中不可忽视的问题。因此，设计能效优化的SATD硬件加速器成为必要。本研究的主要目标是结合SATD的两个数学特性，提出一种基于计算重用的新型硬件架构，以减少硬件面积和能耗。
研究流程
 研究分为以下几个主要步骤：
 1. 编码效率分析：首先，研究团队在HEVC模型（HM）中测试了SATD在运动估计（Motion Estimation, ME）中的应用，结果显示SATD可以将BD-rate（Bjøntegaard Delta Rate）降低高达2.99%。这一结果支持了在视频编码中使用SATD的必要性。
 2. 数学特性分析：研究团队分析了SATD的两个数学特性：一是变换豁免（Transform Exempted, TE）方法，通过将最后一层变换与绝对和计算合并，减少了算术操作；二是计算重用，通过利用HT的递归性质，实现了对较小块变换的重用。
 3. 硬件架构设计：基于上述特性，研究团队提出了一种新型硬件架构。该架构通过重新排列组件，减少了硬件面积和操作次数，从而降低了能耗。具体来说，团队设计了一个4×4和8×8块的SATD硬件架构，并通过合成和仿真验证了其性能。
 4. 案例研究：为了与现有技术进行比较，研究团队设计了一个案例研究，合成了4×4和8×8块的SATD硬件架构，并对其面积和能耗进行了详细分析。
 5. 数据对比与优化：研究团队将提出的架构与现有技术进行了对比，结果显示，新架构在面积和能耗上分别减少了约28%和32%。
主要结果
 1. 编码效率提升：研究结果表明，在HEVC模型中，使用SATD可以将BD-rate降低高达2.99%，尤其是在运动估计中表现显著。
 2. 硬件优化：通过结合TE方法和计算重用，新架构在面积和能耗上分别减少了约28%和32%。具体来说，4×4和8×8块的SATD架构在目标周期为31.25 ns时，能耗分别降低了15%和32%。
 3. 案例研究验证：案例研究进一步验证了新架构的优越性，尤其是在高分辨率视频编码中，新架构能够显著降低能耗。
结论与意义
 本研究提出了一种基于计算重用的SATD硬件架构，通过结合SATD的两个数学特性，显著减少了硬件面积和能耗。这一成果不仅提高了视频编码的效率，还为未来便携设备中的视频编码硬件设计提供了新的思路。此外，研究团队还公开了硬件架构的RTL描述，为后续研究提供了可复现的基础。
研究亮点
 1. 创新性：本研究首次将TE方法与计算重用结合，提出了一种新型的SATD硬件架构。
 2. 显著优化：新架构在面积和能耗上分别减少了约28%和32%，显著优于现有技术。
 3. 应用价值：该架构特别适用于高分辨率视频编码，能够显著降低能耗，适合未来便携设备中的应用。
其他有价值的内容
 研究团队还详细分析了SATD在HEVC模型中的编码效率，并提供了详细的硬件架构设计和合成方法。此外，团队还公开了硬件架构的RTL描述，为后续研究提供了重要的参考。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问