本文档属于类型a,即报告了一项原创性研究。以下是根据文档内容生成的学术报告:
研究作者及机构
本研究的主要作者包括Jiahao Lu、Dongsheng Liu(IEEE高级会员)、Zilong Liu、Xuan Cheng、Lai Wei、Cong Zhang、Xuecheng Zou和Bo Liu。他们分别来自华中科技大学光学与电子信息学院和杭州Hikstor技术有限公司。该研究于2021年7月发表在《IEEE Transactions on Circuits and Systems—I: Regular Papers》期刊上。
学术背景
随着传统医疗资源的日益短缺,现有的便携式健康监测设备已无法满足需求。因此,具备诊断能力的可穿戴医疗设备成为迫切需求。然而,可穿戴设备的设计面临硬件资源有限和高诊断准确性的挑战。本研究旨在提出一种高效的硬件架构,用于在心电图(ECG)分类中实现一维卷积神经网络(1-D CNN),以解决这些问题。ECG分类通常结合预处理、特征提取和分类算法,而CNN能够在不需要复杂预处理算法的情况下同时完成特征提取和分类,因此更适合硬件实现。然而,现有的ECG分类研究大多基于CPU或GPU平台,难以应用于资源有限的可穿戴设备。本研究提出了一种专为嵌入式ECG分类设计的1-D CNN硬件架构,以提高资源效率和计算性能。
研究流程
1. 1-D CNN结构设计
本研究提出了一种包含全局平均池化(Global Average Pooling, GAP)层的1-D CNN结构,用于ECG分类。该结构包括8个卷积层、4个最大池化层、1个GAP层和2个全连接层。GAP层通过将除法操作替换为移位操作,显著减少了网络参数。此外,研究还设计了完全流水线化的处理单元(PU)阵列,以提高计算效率。
硬件架构实现
研究提出了一种高效的1-D CNN硬件架构,包括PU阵列、数据重用策略和动态激活策略。PU阵列采用完全流水线化设计,能够在每个时钟周期内完成一次乘法和加法操作。动态激活策略基于符号位,减少了冗余乘法操作和ReLU函数的资源消耗。GAP层的硬件实现通过移位操作完成,避免了额外的计算资源开销。
数据预处理与训练
研究使用MIT-BIH心律失常数据库中的ECG信号作为输入数据。每个心跳信号由320个样本组成,经过Z-score标准化处理后用于训练和测试。1-D CNN模型在PC平台上进行训练,使用Adam优化器和He_normal初始化算法,训练集和验证集的准确率分别达到99.48%和99.02%。
硬件实现与性能评估
该1-D CNN硬件架构在Xilinx Zynq ZC706开发板上实现,工作频率为200 MHz。硬件实现的资源消耗为1538个LUT,计算性能达到25.7 GOP/s,资源效率提高了3倍以上。在测试集上,硬件实现的ECG分类准确率为99.10%,与软件实现相比仅有微小差异。
主要结果
1. 1-D CNN模型的性能
在训练集和验证集上,1-D CNN模型的准确率分别达到99.48%和99.02%。在测试集上,硬件实现的准确率为99.10%,表明该模型在嵌入式平台上具有较高的分类精度。
硬件架构的性能
硬件架构在Xilinx Zynq ZC706开发板上实现了25.7 GOP/s的计算性能,资源消耗仅为1538个LUT,资源效率达到16.71 GOP/s/kLUT,是目前同类研究中最高的。
GAP层的优化效果
GAP层通过移位操作实现,避免了除法操作带来的资源开销,显著减少了网络参数和计算复杂度。
结论
本研究提出了一种高效的1-D CNN硬件架构,专为可穿戴医疗设备中的ECG分类设计。通过引入GAP层、完全流水线化的PU阵列和动态激活策略,该架构在资源效率和计算性能上均取得了显著提升。硬件实现结果表明,该架构在嵌入式平台上能够以较低的资源消耗实现高精度的ECG分类,具有重要的应用价值。
研究亮点
1. 高效的1-D CNN结构
通过引入GAP层,显著减少了网络参数,适合嵌入式应用。
完全流水线化的PU阵列
提高了计算效率,能够在每个时钟周期内完成一次乘法和加法操作。
动态激活策略
基于符号位的动态激活策略减少了冗余乘法操作和ReLU函数的资源消耗。
硬件实现的优化
通过移位操作实现GAP层,避免了额外的计算资源开销,资源效率提高了3倍以上。
其他有价值的内容
本研究还展示了该1-D CNN模型在其他时间序列应用(如脑电图(EEG)和肌电图(EMG)检测与分类)中的潜力,表明其在医疗健康领域的广泛应用前景。
以上是本研究的详细报告,涵盖了研究背景、流程、结果、结论及亮点,旨在为其他研究人员提供全面的参考。