基于脑电的脑机接口(BCI)的跨被试应用一直受到个体差异大和难以感知的复杂特征的限制。因此,收集每个用户的训练数据进行校准需要很长时间。即使使用大量独立于对象数据的转移学习方法预训练也不能在没有足够的对象特定数据的情况下解码不同的EEG信号类别。
跨被试的分类问题主要受到两个原因的限制。一个原因是EEG信号是非平稳的,不同的生理特征导致个体差异较大。与面部表情识别研究一样,身份信息严重影响分类性能。此外,受试者特定EEG数据的有限数量不足以支持一些好的方法,如卷积神经网络(CNN),感知与不同类别相关的个体特征。随后,转移学习首先通过与被试无关的数据进行预训练来实现跨被试问题,但除非有足够的目标被试数据进行微调,否则仍然不能胜任。自然地,研究人员考虑人工生成EEG数据,以模拟和增强训练集,使用了添加高斯噪声和分割等方法,并获得了一定程度的改进。冗余噪声或信息丢失还不能满足我们的需要,由于强调数据生成,生成模型可能是解决这一难题的潜在方案。其中,生成性对抗网络(GAN)由于其出色的人工图像生成能力,在计算机视觉领域引起了极大关注。
在BCI的实际使用中,在仅使用受试者独立数据无法获得良好分类结果的情况下,需要太多受试者特定数据进行校准。由此文章提出了CS-GAN,这是一种专注于空间增强的EEG信号增强方法,它使用少量特定于对象的数据来生成与原始信号具有相同特征的数据,并提高EEG分类任务中的跨被试性能。图1显示了CS-GAN增强分类的总体框架。
图1. 具有数据增强的跨被试脑电图分类的总体框架
首先,处理特定于对象的数据,以获得空间特征和空间滤波器。然后将空间特征和用作CS-GAN中的约束,用于数据扩充和增强类别之间的区分,然后将许多生成的数据引入到被试无关数据中进行自适应训练。空间滤波器也用于CS-GAN,并最终应用于分类器的训练集。
图2. CS-GAN模型结构
图2给出了CS-GAN的结构,如我们所见,它还包括发生器部分和鉴别器部分。但与其他研究不同,他们创新性地将鉴别器扩展为两个模块,分别用于区分EEG数据和公共空间数据(CS数据),并增强不同类别之间的空间差异。其中生成器和鉴别器网络结构参数分别如下表1和表2:
表1.生成器网络结构参数
表2. 鉴别器网络结构参数
该数据集包含9名受试者在250Hz下采集的EEG数据,这些数据是在四种不同的运动图像任务(包括左手、右手、双脚和舌头的运动想象)中用22个通道收集的。每名受试者在不同的日子记录了两次实验,一次实验中有288条轨迹,每个运动图像任务有72条轨迹,所有信号在0.5 Hz和100 Hz之间进行带通滤波(启用50 Hz notchfilter)。具体信息参照格拉茨理工大学提供的BCI竞赛IV的数据集。
文章的框架是用Python 3.6中的PyTorch库在一台带有Intel Xeon CPU和Geforce 2080Ti GPU的服务器上实现的。对于数据集,直接丢弃三个眼电图(EOG)通道,而不进行伪影去除操作。在CS-GAN中,使用Adam作为优化器,学习率为0.0001,β1为0.1,β2为0.999,网络参数在每批大小为5的情况下更新。采用开明统一初始化。在分类器中,β1变为0.9,批量大小变为50。选择BCI竞争IV数据集2a中9名受试者的“T”会话进行实验,以便每个受试者有288个样本,每个类别有72个样本。此外,从288个样本中随机选择100个数据,用少量数据测试极端性能。我们知道,GAN通常需要大量数据用于训练,但只有16到31个数据用于使用CSGAN扩展一个类别。此外,采用配对t检验进行统计分析。
通过使用足够的增强数据进行自适应训练,得到的跨被试分类准确率比漏掉一个受试者(LOO)测试显著提高了15.85%,比仅在BCI竞赛IV的数据集2a上调整100个原始样本显著提高了8.57%,如表3所示。
表3. 不同增强情况下的分类准确率(百分比%)
本文提出了一种用于EEG信号的CS-GAN,其中利用空间特征生成接近原始数据分布的EEG数据,并增加类别区分。实验结果表明,使用生成的数据成功地缓解了基于脑电的脑机接口中的跨学科问题。此外,他们还提供了一种很好的分类方法,可以作为基准。提出的框架在提高BCI的实用性方面具有巨大潜力,我们可以学习他们这种思想,并应用于帕金森病患、意识障碍病患等基于脑电跨被试疾病辅助诊断领域。
论文链接:https://doi.org/10.48550/arXiv.2102.04456
撰稿人:李建平
审稿人:邱丽娜