团队成员朱皓颖等在IEEE SPL发表脑纹识别的研究成果

近日,脑机团队本科生成员朱皓颖等人在黄俊端老师的指导下于国际信号处理领域的知名期刊IEEE Signal Processing Letters (JCR Q2, 中科院三区, IF: 3.9,CCF-C) 上发表了题为 “WST-CAA: A Brainprint Recognition Framework Based on Wavelet Scattering Transform and Channel-Axial Attention Dense Network” 的研究论文。论文第一作者为朱皓颖,通讯作者为黄俊端副研究员。该论文自2025年5月25日投稿,于2025年11月2日正式被接收。

论文链接:https://ieeexplore.ieee.org/document/11223658

开源代码链接:https://github.com/jhuangscnu/BrainPrint_WST-CAA

IEEE Signal Processing Letters(SPL)是由 IEEE 信号处理学会出版的国际知名期刊,旨在快速发表信号、图像、语音、语言与音频处理等领域中具有创新性和前沿性的研究成果。该刊平均每年发表约 600 篇高质量论文,以高影响力和快速审稿著称,是信号处理领域的重要交流平台。

研究背景

生物特征识别(Biometrics)是一种基于个体独特的生理或行为特征进行身份识别的自动化技术,常见的生理特征包括指纹、面部特征、指静脉等,行为特征则包括步态、声纹等。由于生物特征具有天然的唯一性和稳定性,该技术在信息安全、身份验证等领域得到广泛应用。然而,传统生物特征识别仍面临一些挑战:一方面,这些特征容易受到伪造与攻击(如假指纹、面具识别攻击等)的威胁;另一方面,个体的生理特征可能随年龄、健康状态或环境条件变化而发生变化,从而导致识别准确率和稳定性下降。为克服传统生物特征的局限性,脑纹识别(Brainprint Recognition) 作为一种新兴的生物识别方式逐渐受到关注。脑纹识别基于脑电信号(Electroencephalography, EEG),利用大脑在特定刺激或静息状态下的神经活动模式作为个体身份特征。与传统生物特征相比,脑纹识别具有以下显著优势:

  1. 高安全性(High Security):EEG信号源于大脑神经活动,具有极强的个体特异性与非外显性,难以通过物理或仿真手段复制,因此在防伪造和防攻击方面具有天然优势。
  2. 用户主观性(User Subjectivity):脑纹采集过程需要被试者主动配合,无法在非合作或胁迫条件下准确获取,从而有效防止了强制性身份冒用。
  3. 高隐蔽性与隐私保护(High Privacy Protection):不同于面部或指纹等外部可见特征,脑电信号属于内在生理特征,不易被感知或窃取,天然具备隐私安全优势。
  4. 动态特征表达能力(Dynamic Identity Representation):EEG信号反映的是实时神经活动,其动态性使得脑纹识别不仅能捕捉静态特征,还能刻画个体在不同任务或刺激状态下的神经反应特征,进一步提升系统的判别性与鲁棒性。

与此同时,随着便携式EEG采集设备和智能可穿戴技术的发展,脑纹识别逐渐具备了实际部署条件,有望成为下一代个体身份识别的重要方向。然而,脑纹识别的实际应用仍面临两大核心挑战:

  1. 易受生理伪迹干扰:脑电信号是一种微弱的生理信号,其幅值通常仅为 10–100 μV,极易受到各种非神经源干扰的影响,例如肌电(Electromyogram, EMG)、眼电(Electrooculogram, EOG)及心电(Electrocardiogram, ECG)等伪迹信号。这些伪迹往往在频谱上与脑电信号存在重叠,难以通过传统滤波手段完全去除。尤其在实际采集过程中,被试者的眨眼、面部肌肉活动及电极接触不稳定等都会引入强噪声,显著削弱EEG的信噪比,使身份相关的神经活动模式被掩盖。更为关键的是,伪迹干扰不仅导致特征分布漂移,还会在跨会话、跨任务条件下造成模型泛化性能下降,从而限制脑纹识别系统的稳定性与可用性。如何在低信噪比条件下稳健提取身份判别特征,成为实现实用化脑纹识别的首要难题。
  2. 身份相关特征提取能力有限:现有脑纹识别方法大多借鉴脑机接口(Brain–Computer Interface, BCI)领域的信号处理与分类算法,如共空间模式(CSP)、卷积神经网络(CNN)及时序建模方法等。然而,这些算法通常面向任务或意图识别,关注脑电信号中的“任务相关”信息,而非“身份相关”特征。由于个体间脑信号差异微小且易受状态波动影响,传统模型难以充分捕捉跨通道、跨频段的高阶特征交互关系。此外,部分深度学习模型对输入扰动高度敏感,对信号幅值和时间偏移依赖强,缺乏对频域局部模式的稳健建模能力。再者,现有方法普遍依赖大量人工参数调整,且通道间特征融合不足,无法有效整合多通道EEG信号中潜在的空间信息,导致模型在跨个体或跨会话场景下识别性能显著下降

论文贡献与研究方法

基于上述内容,本文针对脑纹识别中脑电信号易受生理伪迹干扰以及身份相关特征提取能力有限的两大挑战,本文提出了一种新颖的脑纹识别框架——WST-CAA(Wavelet Scattering Transform and Channel-Axial Attention Dense Network)。该框架融合了信号层面的多尺度特征提取与网络层面的多维注意力机制,实现了从低层信号预处理到高层特征识别的端到端优化。

整体结构由两大核心模块组成:

(1)PWST:预处理与小波散射变换模块(Preprocessing and Wavelet Scattering Transform)

该模块旨在实现EEG信号的深度去噪与稳健特征提取。首先,对原始脑电信号进行标准化、带通滤波(0.5–42 Hz)及独立成分分析(ICA),以去除眼电(EOG)与肌电(EMG)等伪迹信号,从而有效提升信噪比。随后,引入小波散射变换(WST)作为中间特征提取手段,通过多尺度卷积、非线性模值变换与低通滤波三步操作,将原始信号映射至平移不变且类内低方差,类间高方差的散射特征空间。既保留了EEG信号的高频细节,又在频域上实现了稳定的能量分布,使模型能够获得对微小时序扰动具有鲁棒性的身份相关特征。此外,WST天然具备抑制任务无关成分与增强身份特征的能力,有助于减少模型在小样本条件下的过拟合风险。

图 1  PWST 处理前后类别分布的 t-SNE 可视化结果,展示了类间分离度增强与类内相似度提升的效果。

(2)CAADN:通道-轴向注意力密集网络(Channel-Axial Attention Dense Network)

该模块旨在从多维角度建模脑电信号的通道—空间—时间相关性,以提取高判别性身份特征。网络结构包含三个关键组件:注意力块(Attention Block)密集块(Dense Block)与过渡层(Transition Layer)

  • 注意力块中,结合通道注意力(Channel Attention)轴向注意力(Axial Attention)机制:前者用于在各通道维度上动态分配权重,突出身份判别性强的神经通道信号;后者沿散射系数轴与时间轴分别建模长距离依赖关系,捕获EEG信号的跨时空交互模式。两种注意机制协同作用,可有效抑制噪声与伪迹对特征的干扰。
  • 密集块(Dense Block)通过跨层特征连接的设计,使浅层特征能够直接传递至深层,从而提升梯度流动性与特征复用率,减少冗余学习并强化特征表达能力。
  • 过渡层(Transition Layer)利用逐点卷积和平均池化进行通道压缩与空间下采样,从而在保证性能的同时降低模型复杂度,实现轻量化与高效性。

通过将 PWST 与 CAADN 模块有机结合,WST-CAA 框架在信号处理层面实现噪声抑制与多尺度表示,在深度网络层面实现高阶特征建模与身份特征增强。该框架不仅能保持EEG信号的高频细节与判别特征,还能生成具有伪迹抵抗性和平移不变性的类内方差,类间高方差的稳定表示,从而显著提升脑纹识别的准确性与泛化性能。

图 2 WST-CAA 框架的结构示意图。该框架主要由两个模块组成:(1) 预处理与小波散射变换模块(PWST),用于对脑电信号进行降噪处理并提取中间特征;(2) 通道-轴向注意力密集网络(CAADN),用于学习身份相关特征并实现脑纹识别。其中,下标k×k表示该操作以k=1与k=3顺序执行。

脑纹识别实验

为验证所提出的 WST-CAA 框架在脑纹识别任务中的有效性与鲁棒性,本文在两个公开脑电数据集 DEAPFACED 上开展了系统的实验研究。

  1. 实验设计与设置

实验采用 被试依赖(subject-dependent) 的划分方式,即针对每位被试分别训练和测试模型,确保模型充分学习个体特征。数据划分比例为 50%训练集、20%验证集、30%测试集,以准确率(Accuracy, ACC)作为唯一性能评估指标。

模型训练参数如下:

  • 优化器:SGD(学习率 0.1,动量 0.9,权重衰减 5×10⁻⁴);
  • 训练轮数:1000 epochs;
  • 若连续 25 个 epoch 性能无提升,则学习率减半;
  • 若性能在 100 个 epoch 内无改进,启用早停策略(Early Stopping)。

对比模型包括:

  • CADCNN(基于通道注意力的卷积密集网络);
  • CNN-GRU(卷积 + 门控循环单元混合网络)。
  1. 实验结果与分析

表 I 显示了 WST-CAA 与基准模型在 DEAP 与 FACED 数据集上的识别性能。

从结果可以看出:

  • WST-CAA 在两个数据集上均显著优于现有模型,尤其在规模更大、受干扰更强的 FACED 数据集上仍保持高准确率(97.46%),体现出优越的泛化能力。
  • 相较于 CADCNN 和 CNN-GRU,WST-CAA 在模型参数量相近的情况下取得了更高的性能,说明其在模型复杂度与识别精度之间实现了良好的平衡。
  1. 消融实验(Ablation Study)

为评估各功能模块的贡献,本文分别移除通道注意力(CA)、轴向注意力(AA)以及两者组合(CAA)进行对比。结果如下表所示:

实验表明:

  • 轴向注意力 对识别性能提升贡献最大,说明捕捉长程依赖关系在脑纹判别中尤为关键;
  • 通道注意力 则在增强特征选择性与噪声抑制方面具有显著效果;
  • 两者结合可获得最优性能,验证了通道与空间–时间注意机制的互补性。
  1. 与最佳方法比较

在与多种现有 SOTA(State-of-the-Art)脑纹识别方法的对比中(如 DAGN、AITST、MLP、GCN 等),WST-CAA 在 DEAP(99.48%)FACED(97.46%) 两个数据集上均达到或超过最新水平,尤其在大样本场景下展现出更好的可扩展性与稳定性。

  1. 实验结论

综上,WST-CAA 框架在脑纹识别实验中表现出以下优势:

  1. 显著提升识别准确率与泛化能力,在不同规模的数据集上均保持稳定性能;
  2. 在模型复杂度可控的前提下实现高精度识别,证明了框架设计的高效性;
  3. 通过多模块协同(PWST + CAADN)显著增强特征判别性,验证了所提方法的有效性与合理性。

该结果充分说明,WST-CAA 能在噪声干扰显著、跨被试特性差异明显的 EEG 信号条件下,稳健地提取身份相关特征,为高安全性脑纹识别系统的构建提供了新思路。

总结

  1. 提出了预处理与小波散射变换模块(PWST),该模块将信号去噪与小波散射特征提取深度融合,实现了脑电数据的高效预处理与中间特征提取。PWST 能有效抑制生理伪迹干扰,提取高阶、低方差且身份相关的 EEG 特征,从而提升脑纹表征的稳健性与稳定性。
  2. 设计了通道-轴向注意力密集网络(CAADN),用于捕捉脑电信号在通道、空间与时间维度上的内在相关性。该网络通过联合建模局部依赖与长程特征交互,在保持较低计算复杂度的同时显著提升特征判别能力,实现了性能与效率的平衡。
  3. 基于上述模块,构建了脑纹识别框架 WST-CAA,形成一个双阶段、端到端的脑纹识别系统。该框架充分融合了 PWST 对细粒度信号模式的表征能力与 CAADN 的高层特征建模优势,在多个公开 EEG 数据集上均取得了领先的识别精度与泛化性能。

 

撰稿:朱皓颖;

审核:黄俊端


登录用户可以查看和发表评论, 请前往  登录 或  注册
SCHOLAT.com 学者网
免责声明 | 关于我们 | 用户反馈
联系我们: