系统评估欧几里德对齐与深度学习在EEG解码中的应用

系统评估欧几里德对齐与深度学习在EEG解码中的应用

背景介绍

脑电图(EEG)信号由于其无创性、便携性和低采集成本,广泛用于脑机接口(BCI)任务。然而,EEG信号存在低信噪比、易受电极位置影响及空间分辨率差等缺点。随着深度学习(DL)技术的进展,该技术在BCI领域表现出色,甚至在某些情况下超过了传统的机器学习方法。然而,DL模型对数据需求量大是其主要障碍。多受试者数据的迁移学习(Transfer Learning, TL)通过共享数据能够更高效地训练DL模型。欧几里得对齐(Euclidean Alignment,EA)因其易用性、低计算复杂度和与DL模型兼容性,逐渐受到关注。但现有研究对EA结合DL的全局和个体模型训练效果评估较少。这篇论文旨在系统性评估EA和DL结合对BCI信号解码训练性能的影响。

文章来源与作者信息

本文题为“Systematic Evaluation of Euclidean Alignment with Deep Learning for EEG Decoding”,由Bruna Junqueira、Bruno Aristimunha、Sylvain Chevallier和Raphael Y. De Camargo等人撰写。作者分别来自University of São Paulo、Université Paris-Saclay (Inria TAU Team, LISN-CNRS)以及Federal University of ABC。论文发表于某学术期刊,通讯作者为Bruna Junqueira(brunaafl@usp.br)。

研究方法

EEG解码框架

EEG解码问题在BCI中意义重大,即如何从记录的信号中分类出心理状态。数据集E由n对实验和标签(x_i, y_i)组成。其中,实验记录X为c行t列的矩阵,c是通道数,t是时间步数。特征空间为X ∈ R^c×t。本实验仅针对左-右想象范式,分类标签空间为{‘left_hand’, ‘right_hand’}。

考虑到脑电信号的变异性,假设来自不同受试者的边缘分布p_k(·)不同。分类假设存在某个未知决策函数fθ(·),使其参数θ满足fθ(x) = y。通过给神经网络输入标记数据并最小化平均损失ℓ:

[ \min_θ \frac{1}{nt} \sum{i=1}^{n_t} ℓ(fθ(x_i), y_i) ]

本文所有实验均采用负对数似然损失和AdamW优化器。

迁移学习框架

定义域d由特征空间X和边缘分布p(x)组成,任务t由标签集合Y和决策函数f(X)组成。本文将每个个人视为一个域,源域为已知知识域,目标域为未知域。迁移学习框架通过在源域(D_s)和源任务(T_s)上训练模型,应用于目标域(D_t)和目标任务(T_t)。

欧几里得对齐

欧几里得对齐(EA)通过匹配每个受试者所有实验的均协方差矩阵与单位矩阵,减少彼此间的差异。假设对每个n个受试者有n个实验,其均协方差矩阵定义为:

[ R̄j = \frac{1}{n} \sum{i=1}^{n} X_j_i X^T_j_i ]

转换矩阵定义为R̄j的平方根逆矩阵,并应用于每个实验。

数据集

本文使用了两个数据集:BCI Competition 4中的Dataset IIA(BNCI2014)和Schirrmeister2017(高伽马)。BNCI2014包含9名健康个体数据,每个个体进行左手、右手、双脚和舌头四种运动想象任务。高伽马数据集包含14名健康个体数据,进行左手、右手、双脚和休息任务。仅使用左、右手数据来保持结果的一致性。标准预处理步骤包括带通滤波和重采样。

模型与数据拆分

本文分析了两种场景下EA的应用:

  1. 使用来自所有源受试者的数据(交叉受试者模型)。
  2. 使用每个源受试者的数据(个体模型)。

使用交互现实想象范式的两类分类任务,交互现实想象范式在目标受试者的两类分类任务中进行评估,防止测试、验证和训练集之间的数据泄漏。

使用EEGNet、ShallowNet和DeepNet作为评估模型,以确保比较的合理性。

数据对齐

在离线和伪在线实验中,采用不同的方法进行EEG对齐。离线实验中对每个受试者的所有实验进行对齐。在伪在线情况下,仅使用目标受试者的第一个24实验组来计算参考矩阵并对齐测试数据。

模型训练

交叉受试者模型使用leave-one-subject-out拆分,个体模型使用全部数据训练,20%用于验证。为每个目标受试者训练单独的模型,评价多对多的训练方案。训练过程中,模型批次为64,1000个epoch,250次早停,25%的dropout率,学习率和权重衰减参数调优。

研究结果

迁移学习中的欧几里得对齐

欧几里得对齐提高了所有评估数据集和架构的解码性能。在所有受试者数据上训练的离线-EA方法相比交互现实想象范式下的提高了1.26%的准确度,而在线-EA相比未对齐情况总体准确率提升了4.33%, 总体减低了训练时间约70%。

细微调整对共享模型的影响

在未对齐的管道中进行微调,结果表明细微调整后的平均准确性提高了1.43%。在离线-EA和在线-EA准确性的基础上进行微调未见显著变化,表明EA已经使得数据分布非常一致,在这种情况下微调需要更多的目标数据。

受试者间传递性的分析

欧几里得对齐提高了个体模型在受试者间传递性的准确性。好的捐赠者在作为接收者时通常也表现很好,EA增加了这种关联性,使得数据分布更为一致。然而,EA没有改变好坏捐赠者的结构。

投票分类器在迁移学习中的应用

EA明显提升了个体模型的传递性。使用加权多数投票分类器对目标受试者进行分类,使用不同组合的个体模型,EA提升了3.71%的平均准确性。相比共享模型在总平均准确率上减少了3.62%。然而,投票分类器的构建更为灵活,允许在增加新数据源时无需重新训练整个模型。

意义和价值

本文展示了欧几里得对齐作为一种强大的域适应技术,在DL结合过程中表现出色。EA显著提高了带有多受试者数据的模型的解码准确性及训练时间。当训练交叉受试者模型时,EA应作为标准的预处理步骤。未来研究可以进一步探讨EA在深度学习模型中的快速收敛问题和不同超参数对模型性能的影响,以获得更为广泛的应用前景。

通过系统评估EA与DL结合在EEG解码中的应用,不仅推动了BCI领域的技术进步,也为进一步研究开辟了新的方向。研究揭示了EA减少受试者间信号变异性问题的潜力,提供了更有效的迁移学习途径,为BCI技术的实际应用提供了重要指导。