文献信息

类型:文献全文
标题:一种针对手臂精细动作想象的细粒度图神经分类模型
DOI:
状态:
已完成
补充信息:
备注:
积分奖励:200
发布时间:2026-06-03 15:55:23
应助内容
文献解读

一种针对手臂精细动作想象的细粒度图神经分类模型

李泽旭、何宏、陈宇聪、徐楚迪(上海理工大学 健康科学与工程学院)的研究成果《一种针对手臂精细动作想象的细粒度图神经分类模型》于2026年6月3日在《计算机应用研究》期刊上进行了网络首发。

本研究属于脑机接口(Brain-Computer Interface, BCI)与人工智能交叉领域,具体聚焦于运动想象(Motor Imagery, MI)脑电(Electroencephalography, EEG)信号的解码问题。研究的核心背景在于,现有的脑电信号分析方法,尤其是针对手臂精细动作想象(如不同手的握拳、旋转)这类复杂任务时,难以充分捕捉大脑活动中复杂的时空耦合特征,导致解码精度和准确性不足。传统方法如共空间模式(CSP)依赖手工特征,而深度学习方法如卷积神经网络(CNN)在处理EEG这种具有非欧几里得拓扑特性的电极通道数据时存在固有局限。图卷积神经网络(GCN)虽然能有效建模电极间的空间关系,但在处理长时序动态特征方面能力较弱。因此,本研究旨在开发一种新的深度学习模型,以更有效地解码手臂精细动作想象的脑电信号,为开发高性能的脑机接口系统,特别是用于运动功能康复的BCI,提供新的技术思路和支撑。

本研究的工作流程系统而完整,主要包括以下几个关键步骤:

第一步:手臂精细动作想象脑电数据库的构建。 这是本研究的重要基础工作。研究团队自行采集并构建了一个专注于手臂精细动作想象的脑电数据集(数据集2)。该数据集招募了5名23岁左右、右利手的健康在校研究生作为受试者。实验设计了四种精细动作想象任务:右手握拳、左手握拳、右手旋转、左手旋转。实验采用标准的64通道脑电设备(TSMI Saga64)按照国际10-20系统放置电极,采样率为1000 Hz。实验范式为:每次试验(trial)开始时屏幕显示注视点(1.5秒),随后出现指示特定动作的箭头提示图片,受试者需在接下来的6秒内持续进行相应的动作想象,之后是6秒的休息/平静期。每种动作在每次实验运行(run)中出现次数相同且顺序随机。数据预处理流程严谨:首先进行1-50 Hz带通滤波和50 Hz陷波滤波以去除噪声和工频干扰;接着采用全脑平均参考;然后使用独立成分分析(ICA)去除眼电、肌电等伪迹;最后将采样率降至250 Hz。此外,研究还采用了基于同标签的时序片段随机拆解与重组的数据增广方法,以扩充数据集,缓解小样本问题。

第二步:提出并构建“细粒度图神经分类模型”。 这是本研究的核心创新。针对现有GCN模型“重空间、轻时序”的短板,研究团队提出了一种新颖的模型架构,该模型由四个核心模块级联构成:跨通道信号增强模块、图结构预处理模块、细粒度感知图卷积模块和特征分类模块。

  1. 跨通道信号增强模块:该模块在模型前端引入了基于Transformer编码器的自注意力机制。其作用是计算多通道EEG信号特征间的全局关联强度,自适应地为携带关键判别信息的电极通道分配高权重,同时抑制噪声和冗余信息,从而增强输入信号的表征质量,并在数据驱动层面缓解小样本训练中的过拟合问题。
  2. 图结构预处理模块:该模块负责为后续的图卷积操作构建多层次的图拓扑结构。首先,基于预处理后的脑电信号,计算所有电极通道两两之间的绝对皮尔逊相关系数(|PCC|),以此作为边权构建初始的脑功能连接图(邻接矩阵)。接着,为了在深层网络中捕获节点间的高阶拓扑依赖并扩大图卷积的感受野,采用了一种自底向上的图粗化(池化)策略。具体而言,从初始的64个节点(对应64个电极)开始,通过循环合并相关性最强的边所连接的两个节点,将节点数量逐层减半,最终生成一个包含多层子图的拓扑结构,为不同层次的图卷积提供输入。
  3. 细粒度感知图卷积模块:这是模型最关键的特征提取部分,旨在解决传统GCN时序建模能力不足的问题。其创新性在于:将输入的时间序列EEG信号沿时间轴划分为多个重叠或连续的时间窗(例如划分为t段)。对每一个时间窗内的信号,都根据其对应的图结构(来自预处理模块的某一层)独立进行一次图卷积操作,以提取该短时窗口内的局部时空特征。然后,对这些所有时间窗子图经过图卷积和池化后输出的特征进行拼接,重新聚合为完整的时序特征。这种方法相当于提高了图卷积在时间维度上的“分辨率”,通过构建多尺度子图来精细化捕捉EEG信号随时间演变的动态模式。
  4. 特征分类模块:该模块接收经过细粒度图卷积提取的高阶特征,通过一个多级的卷积神经网络进行进一步的深层抽象和分类。该网络包含三层卷积操作:第一层使用1×4的卷积核在特征维度上进行融合;第二层使用32×1的卷积核进行长程时间依赖性建模,并采用深度可分离卷积以减少参数量;第三层再次使用1×16的卷积核在特征维度上进行压缩和再学习。每层卷积后都跟随池化层和ReLU激活函数。最后,将特征展平,通过全连接层和Softmax函数输出对应于四个动作想象类别的概率分布。

第三步:模型训练与对比实验。 研究团队在公开数据集(PhysioNet MI数据集,记为数据集1)和自建数据集(数据集2)上,对所提模型进行了系统性的性能评估。实验设置包括:使用PyTorch框架,Adam优化器,交叉熵损失函数,并进行8次重复实验以确保结果稳定性。在数据集1上,为了测试模型在不同数据规模下的表现,分别选取了10、20、40、100名受试者的数据进行跨受试者实验。在数据集2上,则进行了个体内(非跨受试者)和跨受试者的分类实验。研究选取了9种主流的基线模型进行对比,包括EEGNet、CTNet、DGCNN、GCNs、FBCNet、InceptionTime、MDG-EEG、TMSA-Net等,涵盖了经典CNN、注意力机制、传统及动态GCN等多种架构。

第四步:结果分析与模型验证。 本研究通过详尽的实验结果来支撑其结论。
数据集1(公开数据集) 的跨受试者实验中,所提模型在四种不同受试者规模(10, 20, 40, 100人)下均取得了最优或接近最优的分类准确率,最高达到80.82%(10人规模),并且在100人规模下仍能保持80.01%的准确率,显著优于EEGNet、DGCNN等基线模型,也与表现较好的TMSA-Net等模型相比具有竞争力。这证明了该模型在处理不同规模、相对简单的(手、脚、头)MI任务时,具有良好的泛化能力和稳定性。
在更具挑战性的数据集2(自建手臂精细动作数据集) 上,实验结果更具说服力。在跨受试者实验中,所提模型取得了59.14%的准确率(Kappa系数0.438),明显优于其他所有基线模型(次优的TMSA-Net为55.06%)。在个体(非跨受试者)实验中,模型在五名受试者上均取得了最高的分类精度,其中在受试者S3上达到了76%的准确率。这些数据有力地表明,本研究提出的模型在解码特征相似度高、空间模式部分重叠的手臂精细动作想象任务上,具有显著优势。研究还对混淆矩阵进行了分析,发现模型主要的错误发生在功能相似或同侧的动作之间(例如左手握拳与右手握拳的混淆),这反映了区分同侧动作的神经表征难度高于区分不同动作类型(如握拳与旋转),这与神经科学认知相符。
为了探究模型内部组件的有效性,研究进行了消融实验。实验系统地移除了跨通道增强层,并改变了分类模块的卷积层深度。结果显示,无论是移除增强层还是减少分类层深度,模型性能都会下降。在数据集2-S3上,完整模型(带增强层和三層分类卷积)的准确率为76.21%,而去掉增强层后降至73.96%,仅使用单层分类卷积时更是降至63.46%。这证明了跨通道增强层和深层分类模块都是提升模型性能的必要组件,二者协同工作,分别从特征质量提升和深度特征解析两个方面贡献了模型的高性能。
此外,研究还通过t-SNE可视化技术展示了模型处理前后特征分布的变化。结果显示,经过模型处理后,属于同一类别的样本在特征空间中聚集得更加紧密,不同类别之间的界限更为清晰,直观地验证了模型特征提取和分类的有效性。

本研究的结论是,成功提出并验证了一种针对手臂精细动作想象的细粒度图神经分类模型。该模型通过嵌入自注意力机制和创新的细粒度图卷积模块,有效克服了传统图神经网络在时序建模上的不足,能够更精准地捕捉脑电信号中复杂的时空耦合特征。在公开数据集和自建数据集上的实验结果表明,该模型在手臂精细动作想象分类任务上性能优于多种主流基线模型,最高非跨受试者准确率达76%,跨受试者准确率达59%。这验证了模型架构的有效性。

本研究具有重要的科学价值和应用价值。在科学价值上,它为复杂脑电信号(尤其是精细动作想象)的时空联合建模提供了新的思路和方法,证明了通过细粒度时间窗划分与图结构结合来增强时序感知能力的可行性。在应用价值上,该研究为开发高性能、可用于临床康复的脑机接口系统提供了直接的技术支撑。手臂精细动作的识别对于中风患者手部功能康复训练至关重要,更高的解码精度意味着更精准的神经反馈和更有效的康复干预。

本研究的亮点主要体现在以下几个方面:第一,方法创新性强:提出了“细粒度感知图卷积”这一核心模块,创造性地通过时间窗分割构建多尺度子图,有效改善了GCN重空间轻时序的缺陷,这是模型性能提升的关键。第二,研究问题具有挑战性和应用针对性:专注于手臂精细动作想象这一解码难度更高、临床意义更明确的课题,并为此专门构建了相应的脑电数据库,填补了该细分领域的数据空白。第三,模型设计系统且合理:模型架构完整,从前端的注意力增强、中端的细粒度图卷积到后端的深度卷积分类,各模块分工明确,协同作用,并通过消融实验验证了各模块的必要性。第四,实验验证充分:不仅在公开数据集上验证了模型的通用性,更在自建的、任务更复杂的私有数据集上证明了其优越性,并进行了深入的错误分析和可视化,使结论非常扎实。

最后,作者也指出了研究的不足之处和未来方向,包括:图结构仍是静态的,未来可探索动态图生成;时序建模主要依靠卷积,可引入更擅长序列建模的RNN/LSTM;对左右手动作的侧化特征识别仍有提升空间;自建数据库规模较小,需扩大数据采集以进一步提升模型的泛化能力。这些思考为后续研究指明了方向。