資源描述:
《基于深度卷積網(wǎng)絡(luò)的壓縮人臉超分辨率研究.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、碩士學(xué)位論文基于深度卷積網(wǎng)絡(luò)的壓縮人臉超分辨率研究RESEARCHONCOMPRESSEDFACEHALLUCINATIONBASEDONDEEPCONVOLUTIONALNETWORK韓馳哈爾濱工業(yè)大學(xué)2018年6月國內(nèi)圖書分類號:TP391學(xué)校代碼:10213國際圖書分類號:681.39密級:公開工學(xué)碩士學(xué)位論文基于深度卷積網(wǎng)絡(luò)的壓縮人臉超分辨率研究碩士研究生:韓馳導(dǎo)師:劉賢明教授申請學(xué)位:工程碩士學(xué)科:計算機技術(shù)所在單位:計算機科學(xué)與技術(shù)學(xué)院答辯日期:2018年6月授予學(xué)位單位:哈爾濱工業(yè)大學(xué)ClassifiedIndex:TP391U
2、.D.C:681.39DissertationfortheMasterDegreeinEngineeringRESEARCHONCOMPRESSEDFACEHALLUCINATIONBASEDONDEEPCONVOLUTIONALNETWORKCandidate:ChiHanSupervisor:Prof.XianmingLiuAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerTechnologyAffiliation:SchoolofComputerSciencea
3、ndTechnologyDateofDefence:June,2018Degree-Conferring-Institution:HarbinInstituteofTechnology哈爾濱工業(yè)大學(xué)碩士學(xué)位論文摘要人臉圖像是最常見的自然圖像類型之一,在社交媒體、視頻監(jiān)控等領(lǐng)域都起著重要的作用。然而,在實際應(yīng)用中,網(wǎng)絡(luò)和視頻監(jiān)控圖像都會進行壓縮,人臉圖像的質(zhì)量受到壓縮噪聲的影響而產(chǎn)生退化。此外,為了使得人臉細(xì)節(jié)變得更加清晰以提高后續(xù)識別、分析等任務(wù)的準(zhǔn)確度,通常也需要對人臉進行超分辨率重建。在本文中,我們研究壓縮人臉圖像超分辨率算法,聯(lián)合考慮壓
4、縮噪聲消除和超分辨率重建。壓縮人臉圖像超分辨率是一個病態(tài)問題,需要依賴額外的先驗知識。而人臉圖像具有很強的領(lǐng)域知識。對退化人臉圖像進行修復(fù)時,我們提出采用數(shù)據(jù)驅(qū)動的方式從大量人臉訓(xùn)練圖像中挖掘人臉?biāo)赜械慕Y(jié)構(gòu)信息,同時,利用量化區(qū)間所提供的很強的先驗約束。據(jù)此,本文提出了兩種針對壓縮人臉超分辨率的深度卷積網(wǎng)絡(luò)模型,具體而言:首先我們提出了一個新穎的端到端的深度卷積神經(jīng)網(wǎng)絡(luò)來對壓縮后的人臉進行超分辨率,通過對壓縮人臉圖像的退化過程進行建模,并基于該退化模型對模型的損失函數(shù)進行了改進,提出了一種新的損失函數(shù):軟解碼約束,使用該損失函數(shù)實現(xiàn)了非常好
5、的效果。其次我們針對雙分支網(wǎng)絡(luò)CBN[30]的不足,根據(jù)人臉的先驗知識設(shè)計了一種不同結(jié)構(gòu)的網(wǎng)絡(luò)模型:深度級聯(lián)網(wǎng)絡(luò)C-SDNet,其主要思路是使用人臉特征點檢測得到人臉的高頻區(qū)域,在網(wǎng)絡(luò)中針對該高頻區(qū)域進行特殊的處理。在CBN中,其中一個分支為公共分支,用于重建人臉的平滑區(qū)域,第二個分支為高頻分支,其通過人臉高頻先驗的指導(dǎo)來對高頻區(qū)域進行恢復(fù);而在深度級聯(lián)網(wǎng)絡(luò)C-SDNet中分為兩個階段來訓(xùn)練,第一階段將人臉圖像視為自然圖像,但由于該階段重建結(jié)果在高頻區(qū)域往往比較平滑,缺少一些必要的細(xì)節(jié)信息,所以在得到一個較好的效果后進入第二個階段,在第二階段
6、的訓(xùn)練中利用先驗知識,損失函數(shù)只對人臉高頻區(qū)域進行懲罰,從而在高頻區(qū)域恢復(fù)或者合成一些紋理細(xì)節(jié)。此外,我們也嘗試在損失函數(shù)中加入感知損失來進行訓(xùn)練,其結(jié)果將在正文部分進行展示。實驗證明,我們的方法在PSNR和SSIM評價標(biāo)準(zhǔn)上以較大的優(yōu)勢領(lǐng)先于其他方法,并公共基準(zhǔn)數(shù)據(jù)集上實現(xiàn)了目前最好的效果。關(guān)鍵詞:人臉超分辨率,深度卷積神經(jīng)網(wǎng)絡(luò),JPEG壓縮,人臉高頻先驗-I-哈爾濱工業(yè)大學(xué)碩士學(xué)位論文AbstractFaceimageisoneofthemostcommonnaturalimages,andplaysanimportantroleinso
7、cialmedia,videosurveillanceandotherfields.However,inpracticalapplications,theimagesinthesocialmediaandsurveillancevideoswillbecompressed,andthequalityofthefaceimagewillbedegradedbytheinfluenceofthecompressednoise.Inaddition,inordertomakethefacedetailsmorecleartoimprovetheac
8、curacyofsubsequentrecognition,analysisandothertasks,itisusuallynecessarytosuper-re