单一振动物理心电图传感器的多模态心脏波形生成重建

单传感器振动心动图生成多模态心血管波形

背景介绍

心血管疾病(Cardiovascular Disease, CVD)作为全球范围内致病率和致死率最高的疾病之一,每年影响着数以亿计的患者,对全球医疗体系造成了巨大负担。据文献统计,每年因心血管疾病花费的医疗费用高达数十亿美元,且影响着患者的生产力与生活质量。多种风险因素如高血压、糖尿病、肥胖以及久坐不动的生活方式普遍存在,使得CVD防治难度加大。

早发现、早干预是提升CVD管理效率、减少严重心血管事件的关键,这其中可穿戴健康监测技术逐渐成为热点。通过日常佩戴心脏生理参数监测设备,患者可以主动了解自身健康状况,配合医生实现精准的个体化管理。当前主流的心血管监测技术有:

  • 心电图(Electrocardiography, ECG): 通过记录心脏电活动提供心率、心律及疾病诊断信息,被誉为心脏监测的“金标准”。
  • 光电容积描记图(Photoplethysmography, PPG): 利用光学传感器检测血容量变化,广泛应用于智能手表与健身腕带,对心率、血氧饱和度等进行监测。
  • 阻抗心动图(Impedance Cardiography, ICG): 通过胸腔阻抗变化评估主动脉血流,可获得心输出量等重要血流动力学参数。
  • 无创血压监测(Non-Invasive Blood Pressure, NIBP): 采用指夹、腕带等方式实现无创连续血压监测。

尽管上述技术各自拥有独特优势,但多模态实时采集面临诸如传感器数量繁多、用户佩戴不便、数据同步难度大等挑战。鉴于上述技术均源于心脏本身的生理活动,科学家提出是否能通过一种传感器获取的信息,推断或重建其它模态信号,从而简化硬件部署,实现高效多模态心血管监测。这便是近年心脏模态转化(Modal Transfer in Cardiology)领域崛起的出发点。

借助深度学习和生成模型,诸多心脏信号间的映射已被研究,如利用PPG信号生成ECG、估算NIBP,或实现单导与12导心电信号之间的模态转换等。生成对抗网络(Generative Adversarial Network, GAN)、U-net、长短时记忆网络(Long Short-Term Memory, LSTM)等深度学习模型极大拓展了这一技术边界,但仍主要局限于两两模态间的信号互转,缺乏多信号同时重建的方案。

本研究关注于振动心动图(Vibrational Cardiography, VCG),它涵盖了胸骨震动图(Seismocardiography, SCG)与陀螺心动图(Gyrocardiography, GCG),可用单点接触的惯性传感器(惯性测量单元,IMU)在胸骨剑突处记录心脏机械活动,包括心脏收缩、瓣膜运动和血流。此前,VCG已被证实可捕捉心脏、呼吸和血流动力学等信息,并能测量心率、心脏时间间隔、心脏疾病参数和射血量等重要指标。

本研究的创新之处在于:假设VCG信号富含多种生理域信息,通过生成式机器学习模型,是否能够仅凭单传感器VCG实现对ECG、PPG、ICG及NIBP多模态信号的重建?如果可行,这将极大简化可穿戴监测设备硬件,提升日常连续心血管监测的实用性与可推广性。

论文来源及作者信息

本研究由James Skoric、Yannick D’Mello及David V. Plant(IEEE Fellow)等学者完成,所属机构为加拿大McGill University(麦吉尔大学)电气与计算机工程系。论文发表于2025年9月的《IEEE Journal of Biomedical and Health Informatics》期刊(Vol. 29, No. 9),这是生物医学与健康信息领域顶级专业学术刊物之一。研究数据和实验在McGill大学完成,并经过伦理审查委员会认证(伦理审批号:21-06-035)。

研究具体流程

1. 实验系统与设备设计

为了实现VCG的高质量采集,作者自行搭建了心脏振动测量系统。核心传感器是市售IMU(型号MPU9250,InvenSense),能够采集三轴加速度和三轴陀螺信息(总共6个信号通道),安装在胸骨剑突处,固定方式为双面胶。IMU信号采样频率约为300 Hz,通过Raspberry Pi Zero微型计算机采集并保存为文本文件,之后通过Wi-Fi传输到分析计算机。同时,所有目标参考信号(ECG、PPG、ICG、NIBP)均由Biopac MP160专业采集设备获取,实现与VCG信号同步——通过MP160输出的时钟信号与Raspberry Pi实现硬件对时,保证多模态信号时间一致。

2. 受试者与实验对象

实验共纳入20名健康志愿者(16男性,4女性),平均年龄23岁(标准差3.5岁)、平均身高178厘米、平均体重76公斤。所有受试者无任何已知心血管、血液动力学或呼吸系统疾病。部分受试者于间隔约43天后进行第二次实验,总计完成34次录制会话,累计数据时长达到2686分钟。

3. 实验流程与干预方案

实验内容设计充分考虑多种干预场景,旨在覆盖不同的心脏、血流和呼吸状态,具体流程如下:

  1. 静息录制(Rest):7分钟。
  2. 高肺容积屏气:吸气至最大后屏气,每人录制5次,每次2分钟。
  3. 低肺容积屏气:呼气至最大后屏气,同样录制5次,每次1分钟。
  4. 定时深呼吸(Timed Deep Breathing):深吸5秒、深呼5秒循环5分钟。
  5. 自由节奏深呼吸(Free Paced Deep Breathing):无时间限制自由深呼吸5分钟。
  6. 静息录制:再次7分钟。
  7. 冷压试验(Cold Pressor Test):右手浸入3°C冰水1分钟,前后采集总共5分钟(1分钟静息+1分钟冷刺激+3分钟恢复)。
  8. 长时间静息:30分钟,用于冷压试验间隔。
  9. 第二次冷压试验

在干预前后均进行NIBP设备的校准,每步实验具体采集目标信号,同时保证受试者保持仰卧静止,以减少体动伪差。

4. 数据预处理

所有采集信号首先重采样至200 Hz以兼容模型训练需求(高于信号主要频率成分),并采用三阶Butterworth带通滤波(0.8-50 Hz,PPG为0.8-8 Hz)消除基线漂移与高频噪声。随后利用滑动窗口法分割信号,每个窗口长度为512样本(2.56秒),窗口间50%重叠。NIBP数据存在自动重新校准时的采集中断及异常值(收缩压异常高/低),这部分数据被有条件地剔除。最终所有分段信号进行了z-score归一化,总计获得118,772个有效分段,用于后续深度学习训练与评估。

5. 生成模型架构及训练

作者采用条件生成对抗网络(Conditional Generative Adversarial Network, cGAN)及其衍生的一维Pix2Pix框架用于多模态信号生成。具体架构为:

  • 生成器(Generator): 采用U-Net结构(一种编码器-解码器架构并带有跳跃连接),输入为六通道VCG信号(512×6),输出四通道目标波形(ECG, ICG, NIBP, PPG,512×4)。编码器包含8个卷积模块,每个模块用不同数量过滤器层(64-128-256-512-512-512-512-512),解码器为反向卷积且包含skip connection,提升对高低层特征的复用能力。
  • 判别器(Discriminator): 采用PatchGAN结构,对目标信号分块进行真伪判断,包含4个卷积模块。
  • 损失函数: 训练生成器最大化L1损失(均值绝对误差,反映信号幅值及结构差异)和对抗损失(Binary Cross Entropy),判别器同样采用Binary Cross Entropy。训练优化器为Adam,学习率2e-4,Batch Size为32,总计训练5个Epoch。

模型一次性实现所有目标信号的同步输出,采用离开一个受试者交叉验证(Leave-One-Out Cross Validation),每轮用19人数据训练,剩下1人作独立测试,确保模型未见测试者数据且无个体校准,真实反映在真实场景下的泛化能力。

6. 信号评价与分析方法

模型输出信号通过皮尔森相关系数(Pearson’s r)平均绝对误差(Mean Absolute Error, MAE)评估结构与幅值相似度。每个受试者所有生成信号分窗计算相关性与误差,最终每人结果取中位数后汇总为总体表现。对关键心脏事件点(Fiducial Points)——如ECG中的P、Q、R、S、T波峰,ICG的B、C、X点,PPG的起始点与峰值,NIBP的收缩/舒张峰——采用Neurokit2等算法自动标注,分析模型重建信号的事件点检测准确性(以250毫秒为错配容忍窗口,超出者排除),统计误差分布与绝对误差。

此外,研究还考察不同信号窗口长度对模型表现的影响,分别设置2.56秒(512点)、5.12秒、10.24秒、20.48秒(4096点)窗口训练与测试,分析模型对长时间连续信号的生成能力及鲁棒性,评估实际佩戴应用中的适应性。

研究主要结果

1. 多模态信号重建质量

对所有目标信号,模型重建表现优异:

  • 相关性指标(r)中位数分别为: ECG 0.808、NIBP 0.907、ICG 0.833、PPG 0.929
  • 平均绝对误差(MAE)中位数分别为: ECG 0.309、NIBP 0.275、ICG 0.401、PPG 0.255

各干预实验间,相关性和误差变化不大,显示模型能稳定应对多种状态下的信号形态变异。静息状态相关性最高(体征稳定),屏气及冷压试验相关性略下降,推测与生理干扰导致信号变形有关,但总体性能仍高。各实验组均可解释目标信号变化,且模型能准确捕捉关键点的变时反应,反映生成模型对全流程生理动态的响应能力。

在具体信号示例中,ECG、NIBP、PPG、ICG生成波形基本复制原始形态,特殊病例遇到原始信号噪声时生成信号反而较稳定,有助于后期信号去噪。

2. 关键事件点检测能力

各信号对于关键事件点的检测表现如下:

  • ECG R波峰MAE仅6.66毫秒,在200Hz采样率下几乎仅与真实峰值相差1-2个采样点,显示极高时间精准性。
  • 其它ECG峰值(P/Q/S/T)MAE从12到28毫秒不等。
  • ICG C点MAE为15.11毫秒,B、X点误差略大,因其变异性和算法提取难度更高。
  • PPG和NIBP峰值延迟MAE在17到39毫秒之间,主要因远端采点受脉搏传播噪声影响大。
  • 事件点均无显著系统性偏差,模型输出未表现出方向性失误,这是临床评估心脏功能、开展时间区间分析如射血时间(LVET)、预喷射期(PEP)、脉搏传导时间(PTT)等的必要前提。

3. 长窗口信号重建表现

在最长20秒信号段测试下,相关性和误差仅略低于短窗口,分别保持在0.789(ECG)、0.891(NIBP)、0.810(ICG)、0.898(PPG)等高水平,幅值误差同样稳定。证明模型可支持长时程连续信号生成,满足实际可穿戴实时健康监测需求。

研究结论及意义

本项研究创新性地提出通过单点VCG传感器结合深度生成对抗网络,同时重建多种心血管重要信号,证实了VCG信号高维结构内蕴含足够丰富的生理信息,可支撑多模态心脏信号生成。其主要意义体现在:

  1. 硬件简化与实用性增强: 传统多传感器系统可被单点换装,极大降低了设备体积、佩戴负担与同步难度,提升了日常健康管理便携性。
  2. 实现多信号同步监测: 用户只需佩戴VCG传感器即可同步获得ECG、ICG、NIBP、PPG等全部心血管波形数据,技术上完成了多信号的生成与临床友好型转化。
  3. 信号事件点识别准确性高: 多模态信号关键事件点检测误差极低,满足临床对各种心脏时间间隔与功能指标的分析需求,为无创、连续、高精度健康监测铺路。
  4. 模型泛化能力强: 未见受试者数据的测试下,各受试者间信号重建准确性均高,个体差异如年龄、性别、体型对模型影响微弱,支持广泛人群推广。
  5. 长时程监测能力优异: 长窗口信号生成能力稳定,满足佩戴场景下的连续数据需求。
  6. 为心血管健康管理创新提供技术基础: 建议后续将此生成模型与临床智能诊断结合,评估生成信号对疾病检测、功能评估的应用价值。

研究亮点与技术创新

  • 首次验证单一VCG信号可同时重建四类心血管波形,极大突破了以往两两模态互换的技术瓶颈。
  • 创新使用一维多输出Pix2Pix结构,使生成模型能高效、同步处理多信号通道,提升复用率及泛化性。
  • 采用详细物理实验设计与干预验证,确保信号生成模型能应对各种生理状态与实际体征变异,优于单一静息状态数据训练。
  • 全流程高度自动化信号标注与评价体系,结合自动事件点检测算法,将生成模型性能提升至临床应用需要的准确度。
  • 实践为后续无创、连续、高维度的医疗监测设备开发奠定技术基础。

其他有价值信息

研究也指出,模型输出信号进行标准化提升了训练精度,却在原始幅值还原性上存在局限,对诸如血氧饱和度精确测定的场景仍需进一步模型、数据或算法层面优化;远端采样信号如PPG、NIBP因信号路径受多源噪声影响精度略降,对实际传感器选型、数据融合有指导意义;部分底层算法(如B点检测)本身存在学界一致性难题,实际应用中需结合多种方案加以优化。

研究的数据并未公开,但代码已在Github平台上开放(https://github.com/jamesskoric/vcg-generative-reconstruction),为后续同行业界的复现、拓展研究提供了基础。

总结与展望

本研究在单传感器可穿戴健康监测、深度生成式信号重建领域做出了里程碑式贡献,展示了VCG信号的多模态信息潜力与AI模型对其深入挖掘的可能。未来研究可以基于本成果,在更大样本、更复杂病情、实际临床场景下拓展模型泛化能力,评估生成信号对疾病检测的实用性,并进一步提升信号幅值及噪声鲁棒性。创新不仅源于算法的前沿,也体现在对硬件简化、用户体验、临床诊断模式变革上的推动,为全球心血管健康管理开启了新篇章。