資源描述:
《基于深度學習的人臉表情識別算法研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、基于深度學習的人臉表情識別算法研究-->第1章緒論人臉表情是人類交流的重要載體和非語言交流的一種重要方式,它不僅能夠表達人類的情感狀態(tài)、認知活動和人格特征,而且它所富含的人體行為信息與人的情感狀態(tài)、精神狀態(tài)、健康狀態(tài)等其他因素有著極為密切的關聯。心理學家Mehrabian提出[1],在人類交流過程中,只有7%的信息量通過語言來表達,有38%通過輔助語言來傳達,如節(jié)奏、語音、語調等,而人臉表情是占比重最大的一部分——能夠達到信息總量的55%。因此,通過對于人臉表情的研究可以獲得很多有價值的信息,從而分析人類的心理活動和精神狀態(tài)。表情識別技術能夠實現通過計算機來理解人類的情感,是量化分析人類情感
2、的基礎和前提,對促進人機交互的發(fā)展起到重要作用。隨著計算機技術和人工智能技術的水平不斷提高以及、機器人等相關領域的蓬勃發(fā)展,市場對于智能化人機交互的需求也與日俱增。與此同時,眾多的圖像開源框架和高性能的硬件設備為表情識別的研究與應用在軟件與硬件上提供了強有力的技術支持。目前,表情識別作為計算機視覺和機器學習領域的研究熱點已經構成了跨越生物學、心理學和計算機視覺等多領域的交叉性課題。......第2章深度學習和卷積神經網絡2.1深度學習研究表明,哺乳動物的大腦視覺皮層采用一種分層機制對輸入信息進行處理[38]。信息從感知器官輸入后,在經過每一層神經元時,神經元抽取能夠體現對象本質的特征,再將這
3、些特征繼續(xù)傳遞到下一層,后繼的各層神經元也都以類似的方式處理和傳遞信息,最后傳至大腦。深度神經網絡受此啟發(fā),包含多層結點并使得信息得以逐層處理。一些淺層(指僅含一個隱含層)的算法層次較少,當給定有限的訓練樣本和神經元時,淺層結構難以有效地表示復雜的函數,并且對于復雜分類問題的表現性能及泛化能力均顯不足,難以刻畫目標對象的豐富含義。深度學習通過大量簡單神經元組成的網絡,利用輸入與輸出之間的非線性關系對復雜函數進行近似,對觀測樣本進行擬合,并在特征的抽取上體現了突出的能力。深度學習能夠廣泛普及有三個重要的原因,首先,計算機芯片的處理能力顯著提高了,例如,通用圖形處理單元(General-Purp
4、oseputingonGraphicsProcessingUnits,GPGPU)的出現,大大提高了深度神經網絡的學習和訓練速度。其次,硬件計算的成本顯著降低,第三,機器學習和信號/信息處理研究的進步。2.2多層前饋網絡其中參數ioid激活函數,如公式(2.4)所示。第3章人臉表情識別的深度連續(xù)卷積神經網絡模型........................223.1深度連續(xù)卷積神經網絡構建........223.2結構分析及參數優(yōu)化..............................243.3實驗與結果分析........273.第4章人臉表情識別系統(tǒng)的設計.......324.1
5、軟件設計方案....................324.2主要功能的詳細設計.................................354.3本章小結......................41第5章深度連續(xù)卷積神經網絡模型的其它應用實驗...................425.1手寫數字識別...............425.2復雜彩色圖像分類....................455.3本章小結.......46第5章深度連續(xù)卷積神經網絡模型的其它應用實驗5.1手寫數字識別ModifiedNIST(MNIST)數據集[56]由NISTSpecialDataba
6、se3和SpecialDatabase1構成,是NIST的一個子集,作為一個大型的手寫數字數據庫,被廣泛應用于機器學習等領域。NIST數據庫構建之初使用SD-3作為訓練數據集,SD-1作為測試數據集。但是由于SD-3的樣本數據于美國人口調查局(CensusBureau)的員工,而SD-1的樣本數據則于美國高中學生的手寫數據。故SD-3的樣本數據相比于SD-1的更加清晰且易于辨認。為了使得訓練結果和測試結果能更加獨立,免于所采用的數據集的影響,LeCun結合了這兩個數據集的特點,構建了MNIST數據集。MNIST中的訓練集選用了SD-3和SD-1中的各30000個樣例,共60000個。抽選的6
7、0000個樣例來自于大約250個不同的個體的手寫數據,并且保證了測試集和訓練集的數據來自于不同的個體。同樣,測試集也選用了SD-3和SD-1中各5000個樣例。MNIST數據集中的所有樣本數據都經過了尺寸標準化和中心化,每張圖片的尺寸為2828。數據集中部分數字的圖像如圖5.1所示,通過對圖中樣本數據的比較可以看出,手寫數字中相同標簽下不同圖像之間的差異還是很大的。5.2復雜彩色圖像分類CIFAR-10數據集