資源描述:
《人臉識別原理》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
自動人臉識別基本原理 人臉識別經(jīng)過近40 年的發(fā)展,取得了很大的發(fā)展,涌現(xiàn)出了大量的識別算法.這些算法的涉及面非常廣泛,包括模式識別、圖像處理、計算機(jī)視覺、人工智能、統(tǒng)計學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、小波分析、子空間理論和流形學(xué)習(xí)等眾多學(xué)科。所以很難用一個統(tǒng)一的標(biāo)準(zhǔn)對這些算法進(jìn)行分類。根據(jù)輸入數(shù)據(jù)形式的不同可分為基于靜態(tài)圖像的人臉識別和基于視頻圖像的人臉識別。因?yàn)榛陟o態(tài)圖像的人臉識別算法同樣適用于基于視頻圖像的人臉識別,所以只有那些使用了時間信息的識別算法才屬于基于視頻圖像的人臉識別算法.接下來分別介紹兩類人臉識別算法中的一些重要的算法.特征臉 特征臉方法利用主分量分析進(jìn)行降維和提取特征.主分量分析是一種應(yīng)用十分廣泛的數(shù)據(jù)降維技術(shù),該方法選擇與原數(shù)據(jù)協(xié)方差矩陣前幾個最大特征值對應(yīng)的特征向量構(gòu)成一組基,以達(dá)到最佳表征原數(shù)據(jù)的目的.因?yàn)橛芍鞣至糠治鎏崛〉奶卣飨蛄糠祷爻蓤D像時,看上去仍像人臉,所以這些特征向量被稱為“特征臉”?!≡谌四樧R別中,由一組特征臉基圖象張成一個特征臉子空間,任何一幅人臉圖象(減去平均人臉后)都可投影到該子空間,得到一個權(quán)值向量.計算此向量和訓(xùn)練集中每個人的權(quán)值向量之間的歐式距離,取最小距離所對應(yīng)的人臉圖像的身份作為測試人臉圖像的身份?!∠聢D給出了主分量分析的應(yīng)用例子。圖中最左邊的為平均臉,其他地為對應(yīng)7個最大特征值的特征向量?!≈鞣至糠治鍪且环N無監(jiān)督學(xué)習(xí)方法,主分量是指向數(shù)據(jù)能量分布最大的軸線方向,因此可以從最小均方誤差意義下對數(shù)據(jù)進(jìn)行最優(yōu)的表達(dá).但是就分類任務(wù)而言,由主分量分析得到的特征卻不能保證可以將各個類別最好地區(qū)分開來.線性鑒別分析是一種著名的模式識別方法,通過將樣本線性變換到一個新的空間,使樣本的類內(nèi)散布程度達(dá)到最小,同時類間散布程度達(dá)到最大,即著名的Fisher準(zhǔn)則。標(biāo)準(zhǔn)特征臉
1同一個人不同圖像之間的的特征臉不同人的圖像之間的特征臉彈性圖匹配 Lades等人針對畸變不變性的物體識別問題提出了一種基于動態(tài)連接結(jié)構(gòu)的彈性圖匹配方法,并將其應(yīng)用于人臉識別。所有人臉圖像都有相似的拓?fù)浣Y(jié)構(gòu)。人臉都可表示成圖,圖中的節(jié)點(diǎn)是一些基準(zhǔn)點(diǎn)(如眼睛,鼻尖等),圖中的邊是這些基準(zhǔn)點(diǎn)之間的連線。每個節(jié)點(diǎn)包含40個Gabor小波(一種數(shù)字信號變換方法)系數(shù),包括相位和幅度,這些系數(shù)合起來稱為一個Jet ,這些小波系數(shù)是原始圖像和一組具有5個頻率、8個方向的Gabor 小波卷積(一種數(shù)字信號處理算子)得到的。這樣每幅圖就像被貼了標(biāo)簽一樣,其中的點(diǎn)被Jets標(biāo)定,邊被點(diǎn)之間的距離標(biāo)定.所以一張人臉的幾何形狀就被編碼為圖中的邊,而灰度值的分布被編碼為圖中的節(jié)點(diǎn)。如下圖所示:彈性圖匹配方法中人臉的彈性束圖表示為了識別一張新的人臉,需要從該人臉中找到基準(zhǔn)點(diǎn),提取出一個人臉圖,這可用彈性圖匹配得到.彈性圖匹配的目的是在新的人臉中找到基準(zhǔn)點(diǎn),并且提取出一幅圖,這幅圖和現(xiàn)有的人臉束圖之間的相似度最大。經(jīng)過彈性圖匹配后,新的人臉的圖就被提取出來了,此圖就表征了新的人臉,用它作為特征進(jìn)行識別。進(jìn)行識別時,計算測試人臉和現(xiàn)有人臉束圖中的所有人臉之間的相似度,相似度最大的人臉的身份即為測試人臉的身份。 由于該方法利用Gabor小波變換來描述面部特征點(diǎn)的局部信息,因此受光照影響較小。此外,在彈性匹配的過程中,網(wǎng)格的形狀隨著特征點(diǎn)的搜索而不斷變化,因此對姿態(tài)的變化也具有一定的自適應(yīng)性。該方法的主要缺點(diǎn)是搜索過程中代價函數(shù)優(yōu)化的計算量巨大,因而造成識別速度較慢,導(dǎo)致該方法的實(shí)用性不強(qiáng)?!。矰 形態(tài)模型
2人臉本質(zhì)上是3D空間中的一個表面,所以原則上用3D 模型能更好地表征人臉,特別是處理人臉的各種變化,如姿勢、光照等.Blanz 等人提出了一種基于3D形態(tài)模型的方法,該方法將形狀和紋理用模型參數(shù)編碼,同時提出了一個能從單張人臉圖像還原模型參數(shù)的算法.形狀和紋理參數(shù)可用來進(jìn)行人臉的識別。為了處理由于這些參數(shù)導(dǎo)致的圖像之間差異的極端情形,通常是預(yù)先產(chǎn)生一個通用的模型。而進(jìn)行圖像分析時,給定一張新的圖像,一般的做法是用通用模型去擬合新的圖像,從而根據(jù)模型來參數(shù)化新的圖像。基于視頻圖像的識別算法 一個典型的基于視頻圖像的人臉識別系統(tǒng)一般都是自動檢測人臉區(qū)域,從視頻中提取特征,最后如果人臉存在則識別出人臉的身份。在視頻監(jiān)控、信息安全和出入控制等應(yīng)用中,基于視頻的人臉識別是一個非常重要的問題,也是目前人臉識別的一個熱點(diǎn)和難點(diǎn).基于視頻比基于靜態(tài)圖像更具優(yōu)越性,因?yàn)锽ruce等人和Knight等人已證明,當(dāng)人臉被求反或倒轉(zhuǎn)時,運(yùn)動信息有助于(熟悉的)人臉的識別.雖然視頻人臉識別是基于靜態(tài)圖像的人臉識別的直接擴(kuò)展,但一般認(rèn)為視頻人臉識別算法需要同時用到空間和時間信息,這類方法直到近幾年才開始受到重視并需要進(jìn)一步的研究和發(fā)展。目前視頻人臉識別還有很多困難和挑戰(zhàn),具體來說有以下幾種:視頻圖像質(zhì)量比較差:視頻圖像一般是在戶外(或室內(nèi),但是采集條件比較差)獲取的,通常沒有用戶的配合,所以視頻人臉圖像經(jīng)常會有很大的光照和姿態(tài)變化.另外還可能會有遮擋和偽裝?!∪四槇D像比較小:同樣,由于采集條件比較差,視頻人臉圖像一般會比基于靜態(tài)圖像的人臉識別系統(tǒng)的預(yù)設(shè)尺寸小。小尺寸的圖像不但會影響識別算法的性能,而且還會影響人臉檢測,分割和關(guān)鍵點(diǎn)定位的精度,這必然會導(dǎo)致整個人臉識別系統(tǒng)性能的下降?! ∫曨l人臉識別起源于基于靜態(tài)圖像的人臉識別,即識別系統(tǒng)自動的檢測和分割出人臉,然后用基于靜態(tài)圖像的識別方法進(jìn)行識別。對這類方法的一個提高是加入了人臉跟蹤。在這類系統(tǒng)中,通過利用姿態(tài)和從視頻中估計到的深度信息合成一個虛擬的正面人臉。這個階段的另外一個能提高識別率的方法是利用視頻中充裕的幀圖像,基于每幀圖像的識別結(jié)果,使用”投票”機(jī)制。投票方法可以是確定的,但是概率投票方法一般來說更好。投票機(jī)制的一個缺點(diǎn)是計算結(jié)果的代價比較昂貴. 視頻人臉識別的第二個發(fā)展階段是利用多模態(tài)信息。因?yàn)槿祟愐话銜枚喾N信息識別人的身份,所以一個多模態(tài)系統(tǒng)將比只利用人臉的識別系統(tǒng)性能更好.更重要的是利用多模態(tài)信息提供了一種方法,它能全面解決那些只靠人臉無法識別的任務(wù)。例如,在一個完全沒有配合的環(huán)境(比如搶劫),歹徒的臉一般是蒙著的,這時唯一能進(jìn)行無人臉識別的方法就是分析歹徒軀體的運(yùn)動特性.除了指紋,人臉和聲音是最常用于身份識別的信息。它們已經(jīng)被用于很多多模態(tài)身份識別系統(tǒng)?!?997年以來,每兩年,就會召開一個專門關(guān)于基于視頻和語音身份識別的國際會議?!∽罱鼛啄辏曨l人臉識別進(jìn)入第三個發(fā)展階段,這個階段方法的特點(diǎn)是同時采用空間信息(在每幀中)和時間信息(比如人臉特征的運(yùn)動軌跡).區(qū)別于概率投票方法的一個很大的不同之處在于,此類方法是在時間和空間的聯(lián)合空間中描述人臉和識別人臉的。視頻圖像的一個非常重要的特性是它的時間連續(xù)性,以及由此產(chǎn)生的人臉信息的不確定性。在人臉跟蹤和識別中利用時間信息是視頻人臉識別算法和基于靜態(tài)圖像的人臉識別算法的最大區(qū)別。目前這類算法大致可分為兩類:1、跟蹤-然后—
3識別,這類方法首先檢測出人臉,然后跟蹤人臉特征隨時間的變化。當(dāng)捕捉到一幀符合一定標(biāo)準(zhǔn)(大小,姿勢)的圖像時,用基于靜態(tài)圖像的人臉識別算法進(jìn)行識別.這類方法中跟蹤和識別是單獨(dú)進(jìn)行的,時間信息只在跟蹤階段用到。識別還是采用基于靜態(tài)圖像的方法,沒用到時間信息.2、跟蹤—且- 識別,這類方法中,人臉跟蹤和識別是同時進(jìn)行的,時間信息在跟蹤階段和識別階段都用到.