資源描述:
《面向視頻人臉檢測(cè)的深度學(xué)習(xí)算法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、碩士學(xué)位論文題目面向視頻人臉檢測(cè)的深度學(xué)習(xí)算法研究研究生陳雪婷專(zhuān)業(yè)信號(hào)與信息處理指導(dǎo)教師葉學(xué)義副教授完成日期2016年3月杭州電子科技大學(xué)碩士學(xué)位論文面向視頻人臉檢測(cè)的深度學(xué)習(xí)算法研究研究生:陳雪婷指導(dǎo)教師:葉學(xué)義副教授2016年3月DissertationSubmittedtoHangzhouDianziUniversityFortheDegreeofMasterStudyonDeepLearningforFaceDetectioninVideoCandidate:ChenXuetingSupervisor:AssociateProf.YeXueyiMarch,2016杭州電子科技大學(xué)
2、學(xué)位論文原創(chuàng)性聲明和使用授權(quán)說(shuō)明原創(chuàng)性聲明本人鄭重聲明:所呈交的學(xué)位論文,是本人在導(dǎo)師的指導(dǎo)下,獨(dú)立進(jìn)行研巧工作所取得的成果。除文中己經(jīng)注明引用的內(nèi)容外,本論文不含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫(xiě)過(guò)^。的作品或成果。對(duì)本文的研巧做出重要貢獻(xiàn)的個(gè)人和集體,均已在文中^?明確方式標(biāo)明一申請(qǐng)學(xué)位論文與資料若有不實(shí)之處,本人承擔(dān)切相關(guān)責(zé)任。論文作者簽名:祗、賣(mài)遞日期:方^年3月惟日學(xué)位論文使用授權(quán)說(shuō)明目:本人完全了解杭州電子科技大學(xué)關(guān)于保留和使用學(xué)位論文的規(guī)定,P研巧生在校攻讀學(xué)位期間論文工作的知識(shí)產(chǎn)權(quán)單位屬杭州電子科技大學(xué)。本人保證畢業(yè)離校后,發(fā)表論文或
3、使用論文工作成果時(shí)署名單位仍然為杭州電子科技大學(xué)。學(xué)校有權(quán)保留送交論文的復(fù)印件,lii>?允許查閱巧借閱論文;學(xué)??桑薰颊撐牡娜炕虿糠謨?nèi)容,可l^化許采用影印、縮印或其它復(fù)制手段保存論文。(保密論文在解密后遵守此規(guī)定)'論文作者簽名日期:/年含月侈日;巧、^^乃名指導(dǎo)教師簽名:日期:^0/戶(hù)知多月I多曰杭州電子科技大學(xué)碩士學(xué)位論文摘要人臉檢測(cè)是人臉識(shí)別、表情分析、人臉跟蹤等人臉信息處理前提和基礎(chǔ)。隨著視頻監(jiān)控覆蓋面的不斷擴(kuò)大,人臉監(jiān)控所具有的不易被觀測(cè)對(duì)象發(fā)現(xiàn)的顯著優(yōu)勢(shì)使得視頻人臉檢測(cè)被越來(lái)越多的應(yīng)用在了犯罪分析、智慧安防、人工智能等領(lǐng)域?,F(xiàn)有的視頻人臉檢測(cè)算
4、法在處理非理想條件(包括背景復(fù)雜、光照影響、人臉旋轉(zhuǎn)等等)下的檢測(cè)問(wèn)題,往往僅針對(duì)其中某種情況有較好的效果,當(dāng)多種非理想條件并存時(shí),檢測(cè)性能急速下降。而實(shí)際的視頻信息中多種非理想條件并存是常態(tài),因此針對(duì)這種復(fù)雜條件下的視頻人臉檢測(cè),本文引入深度學(xué)習(xí)理論并結(jié)合視頻幀間的連續(xù)性,探討具有較強(qiáng)魯棒性、誤檢率和漏檢率低,且檢測(cè)速度快的方法,以期為智能監(jiān)控及智慧安防提供基礎(chǔ)支持。具體研究?jī)?nèi)容如下:首先,以深度學(xué)習(xí)理論和人臉檢測(cè)神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),提出一種級(jí)聯(lián)型概率態(tài)受限玻爾茲曼機(jī)學(xué)習(xí)網(wǎng)絡(luò)以實(shí)現(xiàn)視頻單幀的人臉檢測(cè)。它首先利用概率態(tài)受限玻爾茲曼機(jī)(Probabilitystate-RestrictedBol
5、tzmannMachine,P-RBM)中神經(jīng)元的概率表征來(lái)模擬人腦神經(jīng)元所具有的連續(xù)分布激活狀態(tài),然后通過(guò)級(jí)聯(lián)多個(gè)P-RBM構(gòu)建深度學(xué)習(xí)檢測(cè)網(wǎng)絡(luò)來(lái)仿真人腦對(duì)視覺(jué)的層次學(xué)習(xí)模式,并以逐層遞減隱藏層神經(jīng)元數(shù)來(lái)控制網(wǎng)絡(luò)規(guī)模,最后采用分層訓(xùn)練和整體優(yōu)化的機(jī)制來(lái)緩解魯棒性和準(zhǔn)確性的矛盾。該算法利用學(xué)習(xí)網(wǎng)絡(luò)在充分提取輸入數(shù)據(jù)各層次特征的基礎(chǔ)上建立從底層特征到高層語(yǔ)義的映射,繼而獲得輸入數(shù)據(jù)的語(yǔ)義信息以準(zhǔn)確地完成檢測(cè)任務(wù)。其次,上述這種面向視頻單幀的人臉檢測(cè)并未利用視頻特有的幀間連續(xù)性信息。因此,在上述研究基礎(chǔ)之上,進(jìn)一步研究視頻幀間的連續(xù)性,提出多幀間信息融合的視頻人臉檢測(cè)算法。針對(duì)視頻單幀的人臉檢
6、測(cè)結(jié)果,它首先利用人臉膚色區(qū)域長(zhǎng)寬比去除部分誤檢區(qū)域,其中長(zhǎng)寬比允許范圍的設(shè)定采用自適應(yīng)更新方式以獲得檢測(cè)視頻最適宜的邊界條件,然后通過(guò)視頻幀間人臉位置變化規(guī)律估計(jì)當(dāng)前幀的檢測(cè)結(jié)果,并與真實(shí)檢測(cè)結(jié)果進(jìn)行對(duì)比,利用對(duì)比規(guī)則對(duì)檢測(cè)結(jié)果進(jìn)行修正,刪去誤檢區(qū)域,補(bǔ)上漏檢區(qū)域,提高算法的檢測(cè)準(zhǔn)確率。實(shí)驗(yàn)數(shù)據(jù)表明,面向視頻單幀人臉檢測(cè)的級(jí)聯(lián)型P-RBM學(xué)習(xí)網(wǎng)絡(luò)不僅能實(shí)現(xiàn)較低漏檢率和誤檢率的人臉檢測(cè),同時(shí)對(duì)旋轉(zhuǎn)人臉的檢測(cè)具有較強(qiáng)魯棒性。另外,其檢測(cè)速度較快,基本能滿足實(shí)時(shí)檢測(cè)的要求;將其與多幀間信息融合算法相結(jié)合實(shí)現(xiàn)的視頻人臉檢測(cè)不僅保持了原有的較快檢測(cè)速度和較低誤檢率,同時(shí)顯著降低了漏檢率,還提高了對(duì)
7、部分被遮擋人臉的檢測(cè)性能。關(guān)鍵字:視頻人臉檢測(cè),深度學(xué)習(xí),概率態(tài)受限玻爾茲曼機(jī)(P-RBM),多幀間信息融合I杭州電子科技大學(xué)碩士學(xué)位論文ABSTRACTAstheprimarytechnologytoextractinformationfromface,facedetectionisthepremiseandfoundationoffacerecognition,facialexpressionanalysisandf