資源描述:
《人臉識(shí)別綜述.doc》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、人臉識(shí)別綜述1引言人臉識(shí)別技術(shù)的研究始于20世紀(jì)50年代,當(dāng)時(shí)的研究人員主要涉及的是社會(huì)心理學(xué)領(lǐng)域;最早AFR(AutoFaceRecognition)的研究論文見于1965年陳(Chan)和布萊索(Bledsoe)在PanoramicResearchInc.發(fā)表的技術(shù)報(bào)告。近年來,人臉識(shí)別研究得到了諸多研究人員的青睞,涌現(xiàn)出了諸多技術(shù)方法。尤其是1990年以來,人臉識(shí)別更得到了長足的發(fā)展。幾乎所有知名的理工科大學(xué)和主要IT產(chǎn)業(yè)公司都有研究組在從事相關(guān)研究。人臉識(shí)別研究的發(fā)展可分為以下三個(gè)階段:第一階段(1964年~1990年)。這一階
2、段人臉識(shí)別通常只是作為一個(gè)一般性的模式識(shí)別問題來研究,所采用的主要技術(shù)方案是基于人臉幾何結(jié)構(gòu)特征(Geometricfeaturebased)的方法。第二階段(1991年~1997年)。這一階段盡管時(shí)間相對(duì)短暫,但卻是人臉識(shí)別研究的高潮期,可謂碩果累累:不但誕生了若干代表性的人臉識(shí)別算法,美國軍方還組織了著名的FERET人臉識(shí)別算法測試,并出現(xiàn)了若干商業(yè)化運(yùn)作的人臉識(shí)別系統(tǒng),比如最為著名的Visionics(現(xiàn)為Identix)的FaceIt系統(tǒng)。美國麻省理工學(xué)院(MIT)媒體實(shí)驗(yàn)室的特克(Turk)和潘特(Pentland)提出的“特
3、征臉”方法無疑是這一時(shí)期內(nèi)最負(fù)盛名的人臉識(shí)別方法。第三階段(1998年~現(xiàn)在)。FERET’96人臉識(shí)別算法評(píng)估表明:主流的人臉識(shí)別技術(shù)對(duì)光照、姿態(tài)等由于非理想采集條件或者對(duì)象不配合造成的變化魯棒性比較差。因此,光照、姿態(tài)、表情、遮擋問題逐漸成為研究熱點(diǎn)。人臉識(shí)別是一項(xiàng)既有科學(xué)研究價(jià)值,又有廣泛應(yīng)用前景的研究課題。國際上大量研究人員幾十年的研究取得了豐碩的研究成果,自動(dòng)人臉識(shí)別技術(shù)已經(jīng)在某些限定條件下得到了成功應(yīng)用,人臉識(shí)別技術(shù)的研究對(duì)模式識(shí)別,人工智能,計(jì)算機(jī)視覺,圖像處理等領(lǐng)域的發(fā)展有巨大的推動(dòng)作用。人臉識(shí)別問題可以定義成:輸入(查
4、詢)場景中的靜止圖像或者視頻,使用人臉數(shù)據(jù)庫識(shí)別或驗(yàn)證場景中的一個(gè)人或者多個(gè)人。基于靜止圖像的人臉識(shí)別通常是指輸入(查詢)一幅靜止的圖像,使用人臉數(shù)據(jù)庫進(jìn)行識(shí)別或驗(yàn)證圖像中的人臉。而基于視頻的人臉識(shí)別是指輸入(查詢)一段視頻,使用人臉數(shù)據(jù)庫進(jìn)行識(shí)別或驗(yàn)證視頻中的人臉。如不考慮視頻的時(shí)間連續(xù)信息,問題也可以變成采用多幅圖像(時(shí)間上不一定連續(xù))作為輸入(查詢)進(jìn)行識(shí)別或驗(yàn)證。人臉自動(dòng)識(shí)別系統(tǒng)包括三個(gè)主要模塊[1]:首先是圖像預(yù)處理模塊,由于實(shí)際成像系統(tǒng)多少存在不完善的地方以及外界光照條件等因素的影響,在一定程度上增加了圖像的噪聲,使圖像變得
5、模糊、對(duì)比度低、區(qū)域灰度不平衡等。為了提高圖像的質(zhì)量,保證提取特征的有有效性,進(jìn)而提高識(shí)別系統(tǒng)的識(shí)別率,在提取特征之前,有必要對(duì)圖像進(jìn)行預(yù)處理操作;其次人臉的檢測和定位模塊,即從預(yù)處理的圖像中,利用人類檢測器(目前人臉檢測方法主要以Adaboost算法為主,OPENCV在這方面做的比較好)找出人臉及人臉?biāo)诘奈恢?,并將人臉從背景中分割出來,?duì)庫中所有的人臉圖像大小和各器官的位置歸一化;最后是對(duì)歸一化的人臉圖像進(jìn)行特征提取(提取局部特征已逐漸成為主流),建立特征描述子,將圖像之間的特征進(jìn)行匹配進(jìn)而完成識(shí)別。人臉檢測與定位特征提取與識(shí)別標(biāo)準(zhǔn)
6、人臉圖像識(shí)別結(jié)果輸入圖像圖像預(yù)處理準(zhǔn)圖像2概述人臉識(shí)別方法大致分為以下幾種:基于幾何特征、基于代數(shù)特征[2]、基于神經(jīng)網(wǎng)絡(luò)模型以及基于三維模型。(1)基于幾何特征基于幾何特征的人臉識(shí)別方法是在抽取人臉圖像上顯著特征的相對(duì)位置及其參數(shù)的基礎(chǔ)上進(jìn)行識(shí)別。最早的人臉識(shí)別是用手工的方法確定人臉特征點(diǎn)的位置并將其輸入計(jì)算機(jī)中。識(shí)別工作的流程大體如下:首先檢測出面部特征點(diǎn),通過測量這些關(guān)鍵點(diǎn)之間的相對(duì)距離(歐式距離、馬氏距離等),得到描述每個(gè)臉的特征矢量,比如眼睛、鼻子和嘴的位置和寬度,眉毛的厚度和彎曲程度等,以及這些特征之間的關(guān)系,用這些特征來表
7、示人臉。比較未知臉和庫中已知臉中的這些特征矢量,來決定最佳匹配[3]?;谛∧0迤ヅ涞姆椒▽儆趲缀翁卣髯R(shí)別,是已知一個(gè)小模板,在人臉的大圖像中進(jìn)行匹配,如果匹配成功,就可以確定其坐標(biāo)位置[4]。基于幾何特征的缺點(diǎn)顯而易見,對(duì)獲得的圖像要求很高,特征點(diǎn)的定位非常重要,通常人臉特征點(diǎn)的定位會(huì)存在誤差,這種方法對(duì)正面人臉可以取得一定識(shí)別效果,如果人臉姿態(tài)存在一定的偏轉(zhuǎn)或有遮擋都會(huì)很大程度上影響識(shí)別的準(zhǔn)確性。(2)基于代數(shù)特征基于代數(shù)特征的人臉識(shí)別方法具有代表性的是PCA(主元分析法)[5]、K-L(卡胡南-列夫)[6]變換和SVD(奇異值分解
8、)[7]等方法。其主要思想:對(duì)于一副由N個(gè)象素組成的圖像,可以看作是一個(gè)N維矢量空間,采用不同的變換方法,能夠有效的提取主分量,通過對(duì)人臉樣本集的自相關(guān)矩陣的特征矢量的選取,構(gòu)成一個(gè)正交的低維人臉空間,從而