人脸数据增广技术可以对不同场景下的人脸特征进行特定属性的增广,以此扩大模型训练数据集或者测试数据集。例如,针对人脸佩戴口罩的场景,可以通过人脸数据增广技术在人脸未佩戴口罩的训练数据集上进行口罩贴图数据增广,以提高此类场景中人脸检测与识别的准确率。
在现有研究中,人脸数据增广方法可以分为传统的图像处理方法、基于模型的人脸数据增广方法和基于生成对抗网络(Generative Adversarial Networks, GAN)的人脸数据增广方法。
传统人脸数据增广方法
对人脸数据进行处理的传统图像增广方法包括几何变换、色域变换和局部变换等。这些方法都是针对单张图像数据进行增广的方法。
几何变换方法旨在通过裁剪、平移、镜像和旋转等技术产生新的数据样本。该方法专注于改变图像中特征目标的位置以及角度,以解决在测试场景中由于观察目标的视角不同而引起的识别失败问题,由此增强模型的鲁棒性,提高模型的准确率。在人脸数据增广任务中,我们需要根据数据集中人脸图像的特点来选择几何变换的方法。如果使用不合适的方法,如不合时宜地使用大范围裁剪、垂直镜像、大角度旋转图片等,可能会颠覆性地改变人脸图像原本的标注语义。
色域变换方法通过改变图像通道中不同位置像素的亮度达到生成新数据样本的目的。比方说,Okokpujie等人[1]通过给图像中的每个像素添加随机rgb 值来进行数据增广,在人脸识别任务中获得了更好的分类效果。但在使用色域变换方法增广人脸数据时,需要获取与实际应用场景中光照对图像色域空间影响相关的数据。色域宽度将决定色域变换中颜色增广的取值范围,使模型不会在数据增广时丢失图像中重要的颜色信息和语义信息。
图1不同色彩空间的色域
局部变换方法是指在训练数据中加入像素块以生成新的训练图像。在与人脸有关的实际应用场景中,经常会出现人脸图像中主要特征被遮挡的情况。例如帽子、墨镜、口罩等物品会遮挡人脸图像的表征区域。Montero等人[2]对现有的人脸数据集进行口罩贴图,生成了戴口罩的新增人脸数据集并用其训练人脸识别模型,使模型能够应用于面部被口罩遮挡的人脸识别任务。局部变换方法可以使算法模型去学习图像中更多具有特殊性质描述的特征。
基于模型的人脸数据增广方法
基于模型的人脸数据增广方法主要包括三维模型法和自编码模型法。基于三维模型的人脸合成方法[3]旨在从单一的二维图像重建三维人脸模型,并通过控制模型参数生成在姿态、光照等多个不同增广方向上的新数据(如图2所示)。此类技术不仅可以用于训练数据集,还可以用于在测试时对齐人脸图像,以减少图像外观变化。
图2 基于三维模型的人脸合成方法展示图例[3]
自编码模型[4]主要用于实现人脸图像的姿态变换。该方法将人脸图像与姿态码输入到编码器中,使模型学习到具有不同姿态的人脸图像特征表示,然后通过解码器生成具有相同身份的多角度人脸图像。
基于GAN的人脸数据增广方法
受到博弈论中零和博弈的启发,生成对抗网络可以产生与模型输入图像风格近似的数据。在人脸图像增广任务中,GAN可以在发型、妆容、年龄、表情、姿态等特定属性上做出转换。如图3所示,FA-GAN[5]将二阶段人脸数据增广的生成对抗网络与图卷积网络相结合,在尽可能保留身份信息的同时,生成不同姿态下的人脸图片,提高人脸识别的精确性。因此,通过大量人脸图片训练一个GAN模型可以解决数据集中同一个体的数据较少这一问题。然而,基于GAN的算法模型需要比较大的数据量对生成器进行训练,使其学习到真实数据中潜在的特征分布,从而产生更有效的新数据。此外,GAN还面临着训练不稳定的问题。众所周知,神经网络的训练过程是一个黑盒,人们难以得知如何操作网络训练时的参数来修改一些特定的面部特征。因此,当脸部变化太大时,要保持身份不变的人脸数据增广是比较困难的。
图3 基于GAN的人脸合成方法展示图例[5]
与传统图像处理的数据增广方法相比,人脸生成技术能够产生具有更多多样化类内特征的数据,但无法保证产生的人脸数据能保留原始身份特征。因此,现有研究更多从保留身份特征的角度出发,探寻基于GAN的人脸生成方法如何提高新增数据的有效性。
参考文献
[1] K. Okokpujie, S. John, C. Ndujiuba, et al, "An improved age invariant face recognition using data augmentation," Bulletin of Electrical Engineering and Informatics, vol. 10, no. 1, pp. 179-191, 2021.
[2] D. Montero, M. Nieto, P. Leskovsky, et al, "Boosting masked face recognition with multi-task arcface," arXiv preprint arXiv:2104.09874, 2021.
[3] I. Masi, T. Hassner, A. T. Tran, et al, "Rapid synthesis of massive face sets for improved face recognition," in 12th IEEE International Conference on Automatic Face & Gesture Recognition (FG), 2017, pp. 604-611.
[4] Y. Qian, W. Deng, J. Hu, "Task specific networks for identity and face variation," in 13th IEEE International Conference on Automatic Face & Gesture Recognition (FG), 2018, pp. 271-277.
[5] M. Luo, J. Cao, X. Ma, et al, "FA-GAN: face augmentation GAN for deformation-invariant face recognition," IEEE Transactions on Information Forensics and Security, vol. 16, pp. 2341-2355, 2021.
总编:黄翰
责任编辑:袁中锦
文字:刘琦炜
图片:刘琦炜
校稿:何莉怡
时间:2022年7月11日