資源描述:
《面向視頻人臉檢測的深度學習算法研究》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。
1、碩士學位論文題目面向視頻人臉檢測的深度學習算法研究研究生陳雪婷專業(yè)信號與信息處理指導教師葉學義副教授完成日期2016年3月杭州電子科技大學碩士學位論文面向視頻人臉檢測的深度學習算法研究研究生:陳雪婷指導教師:葉學義副教授2016年3月DissertationSubmittedtoHangzhouDianziUniversityFortheDegreeofMasterStudyonDeepLearningforFaceDetectioninVideoCandidate:ChenXuetingSupervisor:AssociateProf.YeXueyiMarch,2016杭州電子科技大學
2、學位論文原創(chuàng)性聲明和使用授權說明原創(chuàng)性聲明本人鄭重聲明:所呈交的學位論文,是本人在導師的指導下,獨立進行研巧工作所取得的成果。除文中己經(jīng)注明引用的內(nèi)容外,本論文不含任何其他個人或集體已經(jīng)發(fā)表或撰寫過^。的作品或成果。對本文的研巧做出重要貢獻的個人和集體,均已在文中^?明確方式標明一申請學位論文與資料若有不實之處,本人承擔切相關責任。論文作者簽名:祗、賣遞日期:方^年3月惟日學位論文使用授權說明目:本人完全了解杭州電子科技大學關于保留和使用學位論文的規(guī)定,P研巧生在校攻讀學位期間論文工作的知識產(chǎn)權單位屬杭州電子科技大學。本人保證畢業(yè)離校后,發(fā)表論文或
3、使用論文工作成果時署名單位仍然為杭州電子科技大學。學校有權保留送交論文的復印件,lii>?允許查閱巧借閱論文;學??桑薰颊撐牡娜炕虿糠謨?nèi)容,可l^化許采用影印、縮印或其它復制手段保存論文。(保密論文在解密后遵守此規(guī)定)'論文作者簽名日期:/年含月侈日;巧、^^乃名指導教師簽名:日期:^0/戶知多月I多曰杭州電子科技大學碩士學位論文摘要人臉檢測是人臉識別、表情分析、人臉跟蹤等人臉信息處理前提和基礎。隨著視頻監(jiān)控覆蓋面的不斷擴大,人臉監(jiān)控所具有的不易被觀測對象發(fā)現(xiàn)的顯著優(yōu)勢使得視頻人臉檢測被越來越多的應用在了犯罪分析、智慧安防、人工智能等領域?,F(xiàn)有的視頻人臉檢測算
4、法在處理非理想條件(包括背景復雜、光照影響、人臉旋轉(zhuǎn)等等)下的檢測問題,往往僅針對其中某種情況有較好的效果,當多種非理想條件并存時,檢測性能急速下降。而實際的視頻信息中多種非理想條件并存是常態(tài),因此針對這種復雜條件下的視頻人臉檢測,本文引入深度學習理論并結(jié)合視頻幀間的連續(xù)性,探討具有較強魯棒性、誤檢率和漏檢率低,且檢測速度快的方法,以期為智能監(jiān)控及智慧安防提供基礎支持。具體研究內(nèi)容如下:首先,以深度學習理論和人臉檢測神經(jīng)網(wǎng)絡為基礎,提出一種級聯(lián)型概率態(tài)受限玻爾茲曼機學習網(wǎng)絡以實現(xiàn)視頻單幀的人臉檢測。它首先利用概率態(tài)受限玻爾茲曼機(Probabilitystate-RestrictedBol
5、tzmannMachine,P-RBM)中神經(jīng)元的概率表征來模擬人腦神經(jīng)元所具有的連續(xù)分布激活狀態(tài),然后通過級聯(lián)多個P-RBM構建深度學習檢測網(wǎng)絡來仿真人腦對視覺的層次學習模式,并以逐層遞減隱藏層神經(jīng)元數(shù)來控制網(wǎng)絡規(guī)模,最后采用分層訓練和整體優(yōu)化的機制來緩解魯棒性和準確性的矛盾。該算法利用學習網(wǎng)絡在充分提取輸入數(shù)據(jù)各層次特征的基礎上建立從底層特征到高層語義的映射,繼而獲得輸入數(shù)據(jù)的語義信息以準確地完成檢測任務。其次,上述這種面向視頻單幀的人臉檢測并未利用視頻特有的幀間連續(xù)性信息。因此,在上述研究基礎之上,進一步研究視頻幀間的連續(xù)性,提出多幀間信息融合的視頻人臉檢測算法。針對視頻單幀的人臉檢
6、測結(jié)果,它首先利用人臉膚色區(qū)域長寬比去除部分誤檢區(qū)域,其中長寬比允許范圍的設定采用自適應更新方式以獲得檢測視頻最適宜的邊界條件,然后通過視頻幀間人臉位置變化規(guī)律估計當前幀的檢測結(jié)果,并與真實檢測結(jié)果進行對比,利用對比規(guī)則對檢測結(jié)果進行修正,刪去誤檢區(qū)域,補上漏檢區(qū)域,提高算法的檢測準確率。實驗數(shù)據(jù)表明,面向視頻單幀人臉檢測的級聯(lián)型P-RBM學習網(wǎng)絡不僅能實現(xiàn)較低漏檢率和誤檢率的人臉檢測,同時對旋轉(zhuǎn)人臉的檢測具有較強魯棒性。另外,其檢測速度較快,基本能滿足實時檢測的要求;將其與多幀間信息融合算法相結(jié)合實現(xiàn)的視頻人臉檢測不僅保持了原有的較快檢測速度和較低誤檢率,同時顯著降低了漏檢率,還提高了對
7、部分被遮擋人臉的檢測性能。關鍵字:視頻人臉檢測,深度學習,概率態(tài)受限玻爾茲曼機(P-RBM),多幀間信息融合I杭州電子科技大學碩士學位論文ABSTRACTAstheprimarytechnologytoextractinformationfromface,facedetectionisthepremiseandfoundationoffacerecognition,facialexpressionanalysisandf