資源描述:
《人工神經(jīng)網(wǎng)絡(luò)論文 基于LVQ神經(jīng)網(wǎng)絡(luò)的人臉朝向識(shí)別》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、基于LVQ神經(jīng)網(wǎng)絡(luò)的人臉朝向識(shí)別摘要人臉識(shí)別是當(dāng)今模式識(shí)別和人工智能的一個(gè)重要的研究方向。人臉的朝向識(shí)別是一個(gè)復(fù)雜的模式識(shí)別問(wèn)題。在實(shí)際應(yīng)用中,大量圖像和視頻源中人臉的位置、朝向、旋轉(zhuǎn)角度都是不固定的,這大大增加了人臉識(shí)別的難度。為了解決這些問(wèn)題,本實(shí)驗(yàn)采用了LVQ神經(jīng)網(wǎng)絡(luò)模型對(duì)圖像中的人臉朝向識(shí)別進(jìn)行研究。本實(shí)驗(yàn)基于matlab平臺(tái)設(shè)計(jì)LVQ神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)對(duì)人臉朝向的判斷。實(shí)驗(yàn)結(jié)果表明,LVQ神經(jīng)網(wǎng)絡(luò)可以根據(jù)輸入圖像的二值信息,以較高的準(zhǔn)確率判別該圖像中的人臉朝向。關(guān)鍵字:人臉朝向識(shí)別;LVQ神經(jīng)網(wǎng)絡(luò);matlab;特征提取人臉識(shí)
2、別是一個(gè)活躍的研究領(lǐng)域。盡管相對(duì)于虹膜和指紋識(shí)別,人臉識(shí)別的準(zhǔn)確還比較低,但人臉的易采集、非接觸的優(yōu)點(diǎn),讓人臉識(shí)別受到越來(lái)越多的關(guān)注。人臉識(shí)別對(duì)人臉位置和狀態(tài)都有一定的限制,實(shí)際應(yīng)用中,圖像和視頻源中人臉的位置,朝向和旋轉(zhuǎn)都不是固定的,這就為我們后續(xù)的人臉識(shí)別有了更大的難度。在人臉識(shí)別的研究領(lǐng)域中,人臉朝向識(shí)別是其中的一個(gè)分支。在以往的研究中,絕大多數(shù)的研究人員希望能夠消除人臉朝向在人臉識(shí)別中的不良影響,但在復(fù)雜的實(shí)際環(huán)境中,我們無(wú)法忽略人臉朝向?qū)θ四樧R(shí)別的影響。因此,對(duì)人臉朝向的判定和識(shí)別是非常有必要和有意義的。1LVQ神經(jīng)網(wǎng)絡(luò)學(xué)
3、習(xí)向量量化(LearningVectorQuantization,LVQ)神經(jīng)網(wǎng)絡(luò),屬于前向神經(jīng)網(wǎng)絡(luò)類型,在模式識(shí)別和優(yōu)化領(lǐng)域有著廣泛的應(yīng)用。LVQ神經(jīng)網(wǎng)絡(luò)由三層組成,即輸入層、隱含層和輸出層,網(wǎng)絡(luò)在輸入層與隱含層間為全連接,而在隱含層與輸出層間為部分連接,每個(gè)輸出層神經(jīng)元與隱含層神經(jīng)元的不同組相連接。隱含層和輸出層神經(jīng)元之間的連接權(quán)值固定為1。輸入層和隱含層神經(jīng)元間連接的權(quán)值建立參考矢量的分量(對(duì)每個(gè)隱含神經(jīng)元指定一個(gè)參考矢量)。在網(wǎng)絡(luò)訓(xùn)練過(guò)程中,這些權(quán)值被修改。隱含層神經(jīng)元(或稱為Kohnen神經(jīng)元)和輸出神經(jīng)元都具有二進(jìn)制輸出
4、值。當(dāng)某個(gè)輸入模式被送至網(wǎng)絡(luò)時(shí),參考矢量最接近輸入模式的隱含神經(jīng)元因獲得激發(fā)而贏得競(jìng)爭(zhēng),因而允許它產(chǎn)生一個(gè)“1”,而其它隱含層神經(jīng)元都被迫產(chǎn)生“0”。與包含獲勝神經(jīng)元的隱含層神經(jīng)元組相連接的輸出神經(jīng)元也發(fā)出“1”,而其它輸出神經(jīng)元均發(fā)出“0”。產(chǎn)生“1”的輸出神經(jīng)元給出輸入模式的類,由此可見(jiàn),每個(gè)輸出神經(jīng)元被用于表示不同的類。1人臉朝向識(shí)別的設(shè)計(jì)2.1問(wèn)題描述現(xiàn)采集到一組不同人臉朝向的圖像,這組圖像來(lái)自于10個(gè)人,每人5張圖片,人臉朝向分為:左方、左前方、正面、右前方、右方,如圖2-1所示。創(chuàng)建一個(gè)LVQ神經(jīng)網(wǎng)絡(luò),對(duì)給出的人臉進(jìn)行朝
5、向的判定與識(shí)別。2-1人臉朝向識(shí)別圖1.2建立模型2.2.1設(shè)計(jì)思路通過(guò)觀察不難發(fā)現(xiàn),當(dāng)人臉朝向不同的方向時(shí),眼睛在圖像中的位置差別較大。所以,將眼睛位置的特征信息作為L(zhǎng)VQ神經(jīng)網(wǎng)絡(luò)識(shí)別的輸入,將5個(gè)朝向作為其輸出。在對(duì)訓(xùn)練集進(jìn)行訓(xùn)練之后,得到具有預(yù)測(cè)功能的神經(jīng)網(wǎng)絡(luò),對(duì)測(cè)試集中的圖片進(jìn)行人臉朝向的預(yù)測(cè)。2.2.2設(shè)計(jì)步驟根據(jù)上述的設(shè)計(jì)思路,可以歸納為如下步驟,如圖2-2所示。圖2-2設(shè)計(jì)步驟流程圖(1)眼部特征向量的提取在設(shè)計(jì)思路中,可以知道人臉朝向不同時(shí),其眼睛所在的位置也有所不同。因此,選取描述人眼位置的特征向量作為L(zhǎng)VQ神經(jīng)網(wǎng)
6、絡(luò)的輸入。方法:將整幅圖像分為6行8列,人眼的位置信息可以用第2行的8個(gè)子矩陣來(lái)描述,邊緣檢測(cè)后8個(gè)子矩陣中的值為“1”的像素點(diǎn)的個(gè)數(shù)與人臉朝向有直接關(guān)系。只要分別統(tǒng)計(jì)出第2行8個(gè)子矩陣中值為“1”的像素點(diǎn)的個(gè)數(shù)即可。(2)生成訓(xùn)練集和測(cè)試集為了保證訓(xùn)練集數(shù)據(jù)的隨機(jī)性,我們隨機(jī)選取圖像庫(kù)中的30張圖片作為訓(xùn)練數(shù)據(jù),選取20張圖片作為測(cè)試數(shù)據(jù)。(3)LVQ網(wǎng)絡(luò)的創(chuàng)建因?yàn)長(zhǎng)VQ神經(jīng)網(wǎng)絡(luò)具有不需要將輸入向量正交化、歸一化的優(yōu)點(diǎn),利用Matlab工具中的newlvq()函數(shù)構(gòu)建一個(gè)LVQ神經(jīng)網(wǎng)絡(luò)。(4)LVQ網(wǎng)絡(luò)的訓(xùn)練將訓(xùn)練集中輸入向量送入
7、LVQ神經(jīng)網(wǎng)絡(luò),之后對(duì)網(wǎng)絡(luò)中權(quán)值進(jìn)行迭代調(diào)整,達(dá)到要求。利用Matlab中的網(wǎng)絡(luò)訓(xùn)練函數(shù)train()對(duì)LVQ神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練學(xué)習(xí)。(5)人臉朝向的識(shí)別網(wǎng)絡(luò)訓(xùn)練收斂后,對(duì)測(cè)試集的數(shù)據(jù)進(jìn)行預(yù)測(cè)。對(duì)于任意給定的圖像,只需將其特征向量提取出來(lái),便可以進(jìn)行識(shí)別。1人臉朝向識(shí)別的實(shí)現(xiàn)Matlab提供了許多函數(shù)能夠讓我們?cè)贛atlab環(huán)境下可以實(shí)現(xiàn)上述步驟。3.1清空環(huán)境變量在程序運(yùn)行之前,需要清空工作空間中的變量和命令窗口的命令。源代碼如下:clearallclc1.2眼部特征向量的提取首先將圖像中描述眼部信息的特征向量提取出來(lái),即統(tǒng)計(jì)出第2
8、行8個(gè)子矩陣中值為“1”的像素點(diǎn)的個(gè)數(shù),源代碼如下:%%人臉特征向量提取%人數(shù)M=10;%人臉朝向類別數(shù)N=5;%特征向量提取pixel_value=feature_extraction(M,N);feature_extraction