查字典论文网 >> 基于离散余弦变换和稀疏表示的人脸识别

基于离散余弦变换和稀疏表示的人脸识别

小编:

摘 要: 传统的基于稀疏表示的人脸识别方法是基于人脸的整体特征的,这类方法要求每位测试者的人脸图像要有足够多幅,而且特征维度高,计算复杂,针对这一问题,提出一种基于离散余弦变换和稀疏表示的人脸识别方法,对人脸图像进行分块采样,对采样样本使用离散余弦变换和稀疏分解,然后使用一种类似于词袋的方法得到整幅图像的特征向量,最后使用相似度比较的方法进行分类识别。实验表明,在此提出的方法比传统的基于稀疏表示的人脸识别方法在训练样本较少时效果更好。

关键词: 人脸识别; 离散余弦变换; 稀疏表示; 词袋; 局部特征

Face recognition based on DCT and sparse representation

WANG Guang?liang, GUO He?fei

(School of Computer Science and Engineering, Nanjing University of Science and Technology, Nanjing 210094, China)

Abstract: Traditional face recognition methods based on sparse representation are based on holistic feature of face image. The methods requires enough face images for each test person and the high dimensional feature, and has computational complexity. Aiming at these shortcomings, a face recognition method based on discrete cosine transform (DCT) and sparse representation is proposed, which divides an image into regions, samples in each region, decomposes the samples by DCT and sparse representation, gets feature vector of the whole image with a method like bag?of?word, and then classifies and identifies them by similarity comparing method. The experiment results indicate that the method outperform the traditional face recognition methods based on sparse representation when there are few training samples.

Keywords: face recognition; discrete cosine transform; sparse representation; bag?of?word; local feature

0 引 言

另一方面,人脸还可以用局部特征来表示,相关的方法有局部二值模式(Local Binary Pattern,LBP)方法[7]、基于Gabor特征的方法[8]等等,另一种基于局部特征的方法是近期由Sanderson等人在文献[9]中提出的一种用于人脸识别的扩展的词袋(Bag?of?Words, BoW)方法,叫做多区域直方图方法(Multi?Region Histogram, MRH),该方法将一幅图像中各个区域中采样得到的局部特征使用一种类似于词袋的方法组合起来作为图像的特征向量来进行分类识别,获得了良好的实验结果。文献[10]中指出,局部特征相对与整体特征对于表情变化和角度变化等更加鲁棒。基于以上原因,结合稀疏表示和区域直方图方法的优点,本文提出一种基于离散余弦变换和稀疏表示的人脸识别方法,对图像进行分区域采样,然后对采样样本使用离散余弦变换和稀疏表示获得特征向量,最终使用基于相似度比较的方法进行分类识别。 1 算法描述

本节首先对稀疏表示方法进行简单介绍,然后描述提出的特征提取方法的具体流程以及最终的分类识别方法。

1.1 稀疏表示介绍

[y=Dα] (1)

1.1.1 字典学习方法

字典学习的目的是从原始数据中学习出一个大小合适且可以很好地重构原始数据的过完备字典,目前广泛使用的字典学习方法是由Aharon等人提出的K?SVD算法[11],K?SVD是一种迭代算法,对于给定的训练数据矩阵[Y],K?SVD算法的目标优化函数是:

[minD,AY-DA2Fs.t. ?i, αi0≤T0] (2)

式中[・F]表示求弗罗贝尼乌斯范数(Frobenius norm),其定义如下:

[XF=ijxi,j2] (3)

K?SVD算法每次迭代包括两个阶段:第一阶段固定字典[D],使用下文描述的任意一种稀疏分解方法解得稀疏系数矩阵;第二阶段对字典原子和与其对应的稀疏系数矩阵中的行依次更新,对于要更新的字典原子[dk],式(2)中的开销函数(cost function)可以改写为:

[Y-DA2F=Y-i≠kdiαiR-dkαkR2F=Ek-dkαkR2F] (4)

稀疏分解是指在已知过完备字典[D]和原始数据[y]的情况下,求解对应的稀疏系数[α],求解过程就是解决如下的[?0]最小化问题:

[minα0 s.t. Dα-y22≤ε] (5)

这是一个NP?Hard问题,文献[13]证明在一定条件下将式(5)改为[?1]最小化问题:

这两个优化问题是等效的,而式(6)是凸优化问题,可以使用线性规划方法来解决。目前较常用的解决式(6)的方法有[?1]?magic算法和[?1]LS算法。

(1) 对所有训练样本进行如上文所述的处理,即分区域、有重叠采样、离散余弦变换;

(2) 对获得的所有这些低维特征向量使用K?SVD算法进行字典学习,获得过完备字典[D];

对每个区域,使用下面的式子来获得该区域的特征向量:

[hr=1nri=1nrαr,i] (7)

式中[nr]为第[r]个区域的取样小图像块总数。

由于在稀疏表示时[αr,i]中可能含有负数,而如果直接用这种带负数的稀疏系数代入到式(7)中会损失很多信息,对此问题找到了3种解决方法:

(1) 使用非负的稀疏分解[14];

(2) 将负数系数与正数系数分为两个向量,这样我们要处理的数据维度将增加一倍,但实际数据量的增加不大;

(3) 简单的对每个低维特征向量求绝对值。

最终通过实验发现简单易行的第3种方法就可以得到良好的结果。经过以上步骤各个区域的特征向量就组成了整幅图像的特征,图1为本文特征提取流程的图1所示。

图1 本文特征提取方法流程

1.3 识别方法

本文的识别方法为相似度比较方法,两张人脸图像间的距离可以用下式进行计算: [drawA,B=1nr=1nhAr-hBr1] (8)

式(8)中的距离计算方法受图像间的光照变化,角度变化等影响太大,所以我们使用文献[9]中提出的同群归一化(Cohort Normalization)方法来计算图像A和B之间的归一化距离:[dnormA,B=drawA,B121mi=1mdrawA,Ci+1mi=1mdrawB,Ci] (9)

式中:[Ci]是第[i]个同群人脸图像;[m]为总的同群图像数。在式(9)中,所有同群人脸图像是不同于A和B的随机选取的人脸图像,这样式(9)中的分母部分可以度量A和B与不同于他们的图像间的平均距离,[dnormA,B]越接近1则表示A和B属于不同的人,[dnormA,B]越小(在小于1的情况下)越表示A和B属于同一个人,即[dnormA,B]越小,A和B的相似度越高。而且由于引入了同群人脸图像,式(9)对测试人脸图像中的光照变化、角度变化等都是不敏感的。

这样对于一个测试样本,将它的特征向量分别与各个类别的基准人脸图像计算归一化距离,测试样本的类别就是与其归一化距离最小的基准人脸图像的类别,如下式:

式中:[Ftest]为测试人脸图像;[Fi]为各类别的基准人脸图像;[c]为人脸类别数。

2 实验与结果分析

2.1 实验数据库

图2 extended Yale B中一人的人脸图像

FERET数据库中则包含了更多的镜头角度变化,如图3所示。

图3 FERET中一人的人脸图像

2.2 实验方法

2.3 实验结果

表1 本文方法和相关方法在extended Yale B上的实验结果 %

表2为本文方法和相关方法在FERET上的实验结果对比,由于FERET上各个类别的人脸数目都较少,可以看出本文的方法明显优于其他方法。

表2 本文方法和相关方法在FERET上的实验结果 %

3 结 语

本文提出了一种基于离散余弦变换和稀疏表示的人脸识别方法,这种方法结合了稀疏表示和多区域直方图方法的优点,在训练样本较少时,本文方法的实验结果明显优于传统的基于人脸整体特征的方法,在训练样本足够多时,本文方法也达到了良好的识别效果。本文下一步的工作是进一步优化算法性能,使其满足实时的人脸识别系统的要求。

参考文献

[2] 李武军,王崇骏,张炜,等.人脸识别研究综述[J].模式识别与人工智能,2006,19(1):58?66.

[4] YANG M, ZHANG L. Gabor feature based sparse representation for face recognition with gabor occlusion dictionary [C]// European Conference on Computer Vision. Berlin Heidelberg: [s.n.], 2010: 448?461.

[8] LIU C, WECHSLER H. Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition [J]. IEEE Transactions on Image processing, 2002, 11(4): 467?476.

热点推荐

上一篇:基于Proteus VSM Studio的电子产品开发技术

下一篇:如何对幼儿进行德育教育论文 幼儿园关于德育教育之类的论文