資源描述:
《lvq神經(jīng)網(wǎng)絡(luò)在人臉朝向識(shí)別中的應(yīng)用文獻(xiàn)綜述》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、LVQ神經(jīng)網(wǎng)絡(luò)在人臉朝向識(shí)別中的應(yīng)用人臉識(shí)別作為一個(gè)復(fù)雜的模式識(shí)別問(wèn)題,近年來(lái)受到廣泛的關(guān)注,識(shí)別領(lǐng)域的各種方法在這個(gè)問(wèn)題上各顯所長(zhǎng),而且發(fā)展出了許多新方法,大大豐富和拓展了模式識(shí)別的方向。人臉識(shí)別、檢測(cè)、跟蹤、特征定位等技術(shù)近年來(lái)一直是研究的熱點(diǎn)。人臉識(shí)別是人臉應(yīng)用研究中重要的第一步,目的是從圖像中分割出不包括背景的人臉區(qū)域。由于人臉形狀的不規(guī)則性以及光線和背景條件多樣性,現(xiàn)有的人臉研究算法都是在試圖解決某些特定實(shí)驗(yàn)環(huán)境下的一些具體問(wèn)題,對(duì)人臉位置和狀態(tài)都有一定的要求。而在實(shí)際應(yīng)用中,大量圖像和視頻中人臉的位置、朝向和旋轉(zhuǎn)角度都不是固定的,
2、這就大大增加了人臉識(shí)別的難度。在人臉識(shí)別領(lǐng)域的眾多研究方向中,人臉朝向分析一直是一個(gè)少有人涉及的領(lǐng)域。在以往的研究成果中,一些研究者談及了人臉朝向問(wèn)題,但其中絕大多數(shù)都是希望在人臉識(shí)別過(guò)程中去除人臉?biāo)叫D(zhuǎn)對(duì)識(shí)別過(guò)程的不良影響。但是,實(shí)際問(wèn)題要復(fù)雜得多,人臉朝向是一個(gè)無(wú)法避免的問(wèn)題。因此,對(duì)于人臉朝向的判斷和識(shí)別,將會(huì)是一件非常有意義的工作。一、人臉朝向識(shí)別的研究意義研究人臉識(shí)別在理論和技術(shù)上都有重要的意義:一是可以推進(jìn)對(duì)人類視覺(jué)系統(tǒng)本身的認(rèn)識(shí);二是可以滿足人工智能應(yīng)用的需要。采用人臉識(shí)別技術(shù),建立自動(dòng)人臉識(shí)別系統(tǒng),用計(jì)算機(jī)實(shí)現(xiàn)對(duì)人臉圖像的自
3、動(dòng)識(shí)別有著廣闊的應(yīng)用領(lǐng)域和誘人的應(yīng)用前景。同時(shí)人臉識(shí)別作為一種生物體征識(shí)別與其它較成熟的識(shí)別方法(如指紋、虹膜、DAN檢測(cè)等)相比有以下幾個(gè)優(yōu)點(diǎn):(1)無(wú)侵犯性。人臉圖像的獲取不需要被檢測(cè)人發(fā)生身體接觸,可以在不驚動(dòng)被檢測(cè)人的情況下進(jìn)行。(2)低成本、易安裝。人臉識(shí)別系統(tǒng)只需要采用普通的攝像頭、數(shù)碼攝像機(jī)或手機(jī)上的嵌入式攝像頭等被廣泛使用的攝像設(shè)備即可,對(duì)用戶來(lái)說(shuō)也沒(méi)有特別的安裝要求。(3)無(wú)人工參與。整個(gè)人臉識(shí)別過(guò)程不需要用戶或被檢測(cè)人的主動(dòng)參與,計(jì)算機(jī)可以根據(jù)用戶預(yù)先的設(shè)置自動(dòng)進(jìn)行。由于具有以上優(yōu)點(diǎn),近幾年來(lái),人臉識(shí)別技術(shù)引起了越來(lái)越多科
4、研人員的關(guān)注。第4頁(yè)共5頁(yè)人臉檢測(cè)研究具有重要的學(xué)術(shù)價(jià)值。人臉是一類具有相當(dāng)復(fù)雜的細(xì)節(jié)變化的自然結(jié)構(gòu)目標(biāo),此類目標(biāo)的檢測(cè)問(wèn)題的挑戰(zhàn)性在于:(1)人臉由于外貌、表情、膚色等不同,具有模式的可變性;(2)一般可能存在眼鏡、胡須等附屬物;(3)作為三維物體的人臉的影像不可避免地受由光照產(chǎn)生的陰影的影響。因此,如果能夠找到解決這些問(wèn)題的方法,成功構(gòu)造出人臉檢測(cè)與跟蹤系統(tǒng),將為解決其它類似的復(fù)雜模式檢測(cè)問(wèn)題提供重要的啟示。二、文獻(xiàn)概述20世紀(jì)90年代以來(lái),隨著高速高性能計(jì)算機(jī)的出現(xiàn),人臉識(shí)別方法有了重大突破,進(jìn)入了真正的機(jī)器自動(dòng)識(shí)別階段。國(guó)外有許多大學(xué)
5、在此方面取得了很大進(jìn)展,他們研究涉及的領(lǐng)域很廣,其中有從感知和心理學(xué)角度探索人臉識(shí)別。美國(guó)TexasatDallas大學(xué)的Abdi和Toole小組,主要研究人臉感知機(jī)理的規(guī)律;由Stirling大學(xué)的Bruce教授和Glasgow大學(xué)的Burton教授合作領(lǐng)導(dǎo)的小組,主要是研究人類大腦在人臉認(rèn)知中的作用,并在此基礎(chǔ)上建立了人臉認(rèn)知的兩大功能模型,他們對(duì)熟悉和陌生人臉的識(shí)別規(guī)律以及圖像序列的人臉識(shí)別規(guī)律也進(jìn)行了研究;英國(guó)Aberdeen大學(xué)的Craw小組,主要研究人臉視覺(jué)表征方法,他們對(duì)空間頻率在人臉識(shí)別中的作用也進(jìn)行了分析;荷蘭Groning
6、en大學(xué)的Petkov小組,在此基礎(chǔ)上發(fā)展了并行模式識(shí)別方法。更多的學(xué)者則從事利用輸入圖像進(jìn)行計(jì)算機(jī)人臉識(shí)別的研究工作。在人臉識(shí)別的領(lǐng)域中,國(guó)際上逐步形成了以下幾個(gè)研究方向:(1)基于幾何特征的人臉識(shí)別方法,主要代表是MIT的Brunelli和Poggio小組,他們采用改進(jìn)的積分投影法提取出用歐氏距離表征的35維人臉特征矢量用于模式分類;(2)基于模板匹配的人臉識(shí)別方法,主要代表是Harvard大學(xué)Smith-Kettlewell他采用彈性模板來(lái)提取眼睛和嘴巴的輪廓,Chen和Huang研究中心的Yuille,則進(jìn)一步提出用活動(dòng)輪廓模板提取眉
7、毛、下巴和鼻孔等不確定形狀;(3)基于K-L變換的特征臉的方法,主要研究者是MIT媒體實(shí)驗(yàn)室的Pentland;(4)基于隱馬爾可夫模型的方法,主要代表有Cambridge大學(xué)的Samaria小組和Georgia技術(shù)研究所的Nefian小組;(5)基于神經(jīng)網(wǎng)絡(luò)識(shí)別的方法,如Poggio小組提出的HyperBF第4頁(yè)共5頁(yè)神經(jīng)網(wǎng)絡(luò)識(shí)別方法,英國(guó)Sussex大學(xué)的Buxton和Howell小組提出的RBF網(wǎng)絡(luò)識(shí)別方法等;(6)基于動(dòng)態(tài)鏈接結(jié)構(gòu)的彈性圖匹配方法,主要研究者是由C.VonderMalsburg領(lǐng)導(dǎo)的德國(guó)Bochum大學(xué)和美國(guó)South
8、ernCalifornia大學(xué)的聯(lián)合小組;(7)利用運(yùn)動(dòng)和顏色信息對(duì)動(dòng)態(tài)圖像序列進(jìn)行人臉識(shí)別的方法,主要代表是QueenMary和Westfield大學(xué)的Shaog