本研究由Jin Yue (天津大学)、Xiaolin Xiao (天津大学)、Kun Wang (天津大学)、Weibo Yi (北京机械设备研究所)、Tzyy-Ping Jung (加州大学圣地亚哥分校/国立阳明交通大学)、Minpeng Xu (天津大学)和Dong Ming (天津大学)共同完成。研究成果发表于Cyborg and Bionic Systems期刊(Volume 6, 2025),文章标题为《Augmenting Electroencephalogram Transformer for Steady-State Visually Evoked Potential-Based Brain–Computer Interfaces》。
本研究隶属于脑机接口(Brain–Computer Interface, BCI)领域,具体聚焦于基于稳态视觉诱发电位(Steady-State Visually Evoked Potential, SSVEP)的BCI系统。SSVEP-BCI因其高信息传输率(Information Transfer Rate, ITR)和较少训练需求而备受关注,但其性能提升依赖于高效的脑电图(Electroencephalogram, EEG)信号解码。
当前,深度学习模型已广泛用于EEG解码,但面临两大核心挑战: 1. 数据稀疏性问题:由于实验设置复杂、耗时、受试者数量有限以及个体间变异大,获取大量、高质量的EEG训练数据非常困难。数据稀疏容易导致模型过拟合、泛化能力差。 2. 模型设计问题:传统卷积神经网络在处理动态EEG信号时可能丢失关键的时序信息。同时,多数数据增强方法(如混合、噪声注入)缺乏明确的神经生理学基础,未能充分利用EEG信号的先验知识,导致生成的数据质量不高。
基于此,本研究的目标是双重的:首先,提出一种基于神经生理学原理的新型EEG数据增强策略,以有效缓解数据稀疏性;其次,设计一种能够充分捕捉EEG信号时空频特征的先进深度学习模型,以提升SSVEP的解码效率和精度,特别是在短训练数据长度下的表现,这对于实现高速、实用的BCI系统至关重要。
本研究包含方法提出、实验验证和结果分析三大模块,具体流程如下:
第一模块:提出新方法 1. 背景EEG混合数据增强策略(Background EEG Mixing, BGMix)的提出: * 理论基础:该方法基于EEG信号的神经生理学特性。研究者认为,SSVEP信号由任务相关成分(对特定频率视觉刺激的稳定响应)和背景EEG(任务无关的神经活动噪声)组成。相同刺激下,任务相关成分在不同试次间相对稳定;而背景EEG则波动较大。 * 实现步骤: a. 成分提取:对于一个给定类别,计算其多个试次的平均模板,作为该类的“任务相关成分”。从单个试次信号中减去该平均模板,得到“背景EEG”。 b. 混合生成:为了生成新样本,将一个类别A的平均模板(任务相关成分)与另一个不同类别B的某试次的背景EEG相加,从而合成一个新的EEG样本。该新样本的标签为类别A和B的加权混合(类似Mixup策略)。 c. 流程:算法通过选择不同数量的试次来构建模板和背景EEG,可以生成大量多样化的合成样本。研究中,对数据集I,通过使用2个和3个试次构建,将数据扩增了80倍;对数据集II,使用2、3、4个试次构建,扩增了120倍。该策略仅在第二阶段(受试者特异性微调)使用。 * 核心创新:BGMix并非随机混合数据,而是有目的地保留任务相关特征,同时替换背景噪声,使得生成的样本既具有数据多样性,又符合EEG信号的固有结构,是一种“有神经生理学依据”的数据增强。
第二模块:实验设计与验证 1. 数据集:研究使用了两个公开的SSVEP数据集进行离线的模型性能评估。 * 数据集I:来自Nakanishi等人(2015)的工作,包含10名受试者,12个刺激目标(频率),每个目标15个试次(4秒时长),记录8个通道EEG(采样率256 Hz)。 * 数据集II:来自Wang等人(2017)的Benchmark数据集,包含35名受试者,40个刺激目标,每个目标6个试次(5秒时长),使用9个通道EEG(下采样至250 Hz)。 2. 实验设置与训练细节: * 基线方法: * 数据增强对比:比较了BGMix与多种传统增强方法,包括时域(高斯噪声、时间反转、平滑时间掩蔽)、频域(频移、傅里叶变换替代)和空域(通道重排)方法,以及简单的Mixup策略。 * 解码模型对比:将AETF与经典深度学习模型(ShallowConvNet, DeepConvNet, EEGNet)以及两种先进的传统分解方法——集成任务相关成分分析(Ensemble TRCA, ETRCA)和任务判别成分分析(Task Discriminant Component Analysis, TDCA)进行比较。 * 训练策略:采用两阶段训练以应对个体差异。第一阶段,使用所有受试者的数据训练一个跨受试者通用模型,学习共有的SSVEP特征。第二阶段,以此模型权重初始化,使用单个受试者的数据(包括原始数据+BGMix生成数据)进行微调,得到受试者特异性模型。 * 评估指标:使用平衡准确率(Balanced Accuracy, BA)和信息传输率(ITR)来评估分类性能,重点关注短数据窗(0.2秒至0.5秒)下的表现,这对于高速BCI至关重要。 * 消融实验:通过移除AETF中的Transformer模块,验证其有效性。 * 可视化与可解释性:使用t-SNE可视化输入样本、生成样本以及Transformer输出特征的分布;可视化Transformer层的注意力矩阵,以理解其工作机制。 * 模型效率与压缩:评估了AETF的计算成本(参数量、内存占用、训练时间),并探索了知识蒸馏(Knowledge Distillation)技术,训练了一个更轻量化的单层Transformer学生模型(AETF_1layer),以降低计算负担。
第三模块:数据分析工作流 1. 数据预处理:对两个数据集的EEG信号进行8-90 Hz的带通滤波。 2. 模型训练与验证:采用分试次的k折交叉验证。在每折中,为每个受试者每个类别留出一个试次作为测试集,其余用于训练和验证。在应用BGMix时,增强样本与原始训练/验证集结合形成新训练集,原始训练/验证集合并为新验证集。 3. 结果统计:对分类准确率等性能指标进行统计检验(数据集I使用Wilcoxon符号秩检验,数据集II使用配对t检验),以验证性能提升的显著性。 4. 结果解释:结合统计结果、可视化分析和消融实验,系统地论证BGMix策略和AETF模型的有效性、优势及内在逻辑。
BGMix策略显著提升模型性能:
AETF模型在短数据窗下表现卓越:
模型效率与压缩探索:
结论:本研究成功提出并验证了一种基于神经生理学原理的EEG数据增强策略(BGMix)和一个专为EEG信号设计的Transformer-based解码模型(AETF)。两者的结合有效地解决了SSVEP-BCI中数据稀疏性和复杂时序特征建模的挑战,显著提升了模型,特别是在极短时间窗下的解码精度和系统ITR。
科学价值: 1. 方法论创新:BGMix为EEG数据增强提供了一个新的、有理论依据的范式,强调了利用信号固有成分(任务相关vs.背景噪声)进行结构化增强的思路,超越了传统的随机扰动方法。 2. 模型架构创新:AETF是较早将Transformer架构系统性地应用于SSVEP解码的研究之一,其结合空间滤波、频率滤波和时序注意力机制的设计,为EEG信号处理提供了新的网络设计思路,证明了Transformer在捕捉EEG长程依赖方面的潜力。 3. 推动领域发展:该研究为开发高性能、高速度的SSVEP-BCI系统提供了有效的工具,将深度学习在此任务上的性能提升到了新的高度,并为解决其他模态BCI或EEG分析任务中的数据与模型问题提供了借鉴。
应用价值:研究所实现的高ITR和短时窗高精度解码能力,直接有助于开发更快速、更灵敏、用户体验更好的实时BCI应用,例如高速脑控拼写器、敏捷的神经假肢控制或快速的注意力状态监测系统。
研究还探讨了方法的局限性及未来方向: 1. 计算成本:AETF模型相对复杂,训练耗时较长,对部署的硬件有一定要求。知识蒸馏展示了一条可行的压缩路径,但如何进一步优化模型效率仍是未来课题。 2. 方法普适性:BGMix目前主要适配于深度学习框架,因其依赖混合标签的损失函数计算。如何将其思想拓展至传统机器学习模型,值得探索。 3. 数据增强量的优化:研究发现存在一个最佳增强倍数,超过后性能增益饱和甚至下降,提示需要根据具体场景和数据规模进行调优。 4. 未来扩展:可以探索结合其他Transformer变体、引入多模态学习或迁移学习技术,以进一步提升模型性能与鲁棒性,并扩展到更广泛的EEG-BCI任务中。