基于局部奇异值算法的人脸识别研究

(整期优先)网络出版时间:2017-07-17
/ 2

基于局部奇异值算法的人脸识别研究

王维列

关键字:人脸识别;局部奇异值向量;观察序列;隐马尔科夫模型

1引言

隐马尔可夫(HiddenMarkovModel,HMM)理论最初是由Baum及他的同事于20世纪70年代初提出。隐马尔可夫模型是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。HMM起初在语音识别面得到广泛的应用。Samaria最早建议了关于人脸的隐马尔可夫模型,他用灰度值作为观察值。Nefian发展了Samaria的方法,他用二维离散余弦变换系数作为观察序列,这在一定程度上解决了Samaria的大量存储的缺陷。

2隐马尔可夫模型简介

在隐马尔可夫模型中,状态不是直接可见的,但受状态影响的某些变量则是可见的。每一个状态在可能输出的符号上都有一个概率分布。因此输出符号的序列能够透露出状态序列的一些信息。隐马尔可夫模型就是一种用参数表示的,用于描述双重随机过程统计特性的概率模型。一个潜在的过程称为“状态”过程,另一个可观测过程称为“观测序列”,观测序列是由隐含的状态过程决定的。

HMM定义如下:

(1)X代表一组状态的集合,其中,NSSSX,....,,21,N为隐含状态数。

(2)O代表可观察符号的集合12{,,...,}MOVVV,M是从每一状态可能输出的不同的观察值的数目。

(3)状态转移概率分布{}ijAa,这里1{|},1,ijijtiaPqSqSijN。

(4)状态j的观察概率分布{()}jBbk,表示状态j输出相应观察值的概率,其中(){|},1,1jtktjbkPOVqSjNkM。

(5)初始化状态分布{}i,1{},1iiPqSiN。

使用简写的记法,HMM可表示为三参数形式),,(BA。将HMM应用到实际中,必须解决三个基本问题:

(1)估值问题。即给定观察序列12...TOOOO和模型(,,)AB,计算(|)PO。

(2)解码问题。即给定观察序列12...TOOOO和模型(,,)AB,求在某种有意义的情况下最优的相关状态序列12...TQqqq。

(3)学习问题。即如何调整模型参数(,,)AB,对于一个给定的观察序列12...TOOOO,使得(|)PO最大。

3基于HMM的局部奇异值分解算法研究

3.1HMM人脸模型

HMM人脸模型最早由Samaria最早提出。这种模型是包含5个状态的左右模型。它把正面人脸图像分为5个显著的特征区域,即头发、额头、眼睛、鼻子和嘴巴。即使头部有一些偏转或倾斜,也可以认为这五个显著区域隐含着5个“状态”。则我们可以将观察到的序列看做是由5个状态产生的,我们可以通过观察序列对它进行估计。它的状态结构和非零转移概率矩阵ija如图1所示。

图1用于人脸识别的左右型HMM。

3.2局部奇异值特征

奇异值分解是求解最小二乘问题的一种有效工具,在图像压缩信号处理和模式分析中得到广泛应用。若矩阵A代表一幅图像,对A进行奇异值分解为

TVUA其中U和V是两个单位正交的矩阵,是一个对角矩阵,为),...,,(21ndiag。如果A只有k个非零奇异值,则kiTiiivuA1其中ui和vi是u和v的各个列、那么TknS)0,...,0,,...,,(211称为矩阵A的奇异值向量。因为对于任意一个实矩阵A,它的奇异值分解是唯一的,所以当排列k...21时,原图像A对应一个唯一的奇异值向量。于是奇异值向量可以作为描述灰度值矩阵A的一种数值特征。

图2是对采样窗进行奇异值分解得到的观察向量。从图中可以看出,奇异值向量的前面几个值很显著,后面的值迅速减小,趋近于0,真正对图像描述起决定性作用的只与前面几个较大的值有关。

奇异值分解的特征保证了奇异值向量可以作为稳健的特征对人脸进行描述,比采用灰度值和二维DCT变换系数作为采样窗口的特征,识别率和速度都有所提高。但将整幅图的奇异值向量作为图像的特征,不能详细描述图像的局部细节;而且奇异值向量作为识别特征主要由前面几个显著值起决定作用。

图,2状态的一个观察向量

为此可以采用局部奇异值向量的方法:先将图像分为多个小窗口,计算每个窗口的奇异值,然后从中选取出较大的奇异值构成一个一维向量来表示人脸特征。这样能更加充分地利用图像的细节信息,又增加了有效的特性,更好的反映人脸局部特征的差异。

3.3特征抽取

我们用宽度为W,高度为L的采样对图像从上到下进行采样,如图3,两个相邻采样窗之间的重叠部分为P。采样数也即序列的时间长度T由下式给出:

图3特征提取方法

参数L和P的选择在很大程度上影响着识别率。根据Samaria在[6]中的经验,在P足够大的情况下(P≤L-1),系统的识别率不敏感于L。

3.4HMM的训练、识别流程

隐马尔可夫模型的训练就是要为每一个人确定一组经过优化了的HMM参数。每个模型可以用单幅或多幅图像进行训练。计算

按以下步骤进行:

(1)对人脸图像进行采样并计算每一个采样窗矩阵的奇异值,用奇异值向量作为观察序列。

(2)建立一个通用的HMM模型),,(BA,确定模型的状态数,允许的状态转移和观测序列向量的大小。

(3)将训练数据均匀分割,与N个状态对应,计算模型的初始参数。

(4)用Viterbi分割取代均匀分割,重新进行参数的初始估计。

(5)采用Baum-Welch算法对参数进行重估计迭代调整模型参数以最大化观察概率。

这个过程的HMM参数被用来代表数据库中的人脸。

人脸识别的流程图可参见图4。

图4HMM识别过程

4实验结果及结论

实验是在ORL人脸数据库上完成的,人脸数据库由40个人的400幅图片组成,每人10幅,含各种表情。取每人5幅,共200

幅进行训练,用另外的200幅进行识别。取L=12,P=11,对采样串口的竖直和水平方向上等分,选取前面几个较大的奇异值构成局部奇异值向量,然后进行训练和识别,结果如表3.1。

表3.1等分采样窗口识别结果

从表中可以看出当子窗口数为1×1时,即为基于奇异值分解的方法,由于观测序列长度小,所以识别率不高。当子窗口数为2×4时,本方法取得了99%的识别率,可见对图像细节更加完备的表征弥补了观测序列少的不足。由此可见采用局部奇异值向量的方法优于传统的基于奇异值分解的方法。

参考文献:

[1]RabinerLR.ATutorialonHiddenMarkovModelsandSelectedApplicationsinSpeechRecognition[J].IEEEProc,1989,35:267-295.

[2]OthmanH,AboulnasrT.HybridHiddenMarkovModelforFaceRecognition[J].4thIEEESouthwestSymposiumImageAnalysisandInterpretation.2000,15(11):36-40.

[3]SamariaF,YongS.HMMBasedArchitectureforFaceIdentification[J].ImageandComputerVision,October.1994(12):537-583.

[4]SamariaF,Sam.FaceRecognitionusingHiddenMarkovModels[J].PhDThesisforUniversityofCambridge1995(1):28-34.

[5]NefianAV,HayesMH.FaceDetectionandRecognitionusingHiddenMarkovModels[J].InternationalConferenceonImageProcessing,2002(1):141-145.

[6]KanadT.PictureProcessingSystembyComputerandRecognitionofHumanFace[J].PhDDissertationKyotoUniversity,1973(6):86-92.