基于視覺特性的視頻編碼理論與方法研究畢業(yè)論文

基于視覺特性的視頻編碼理論與方法研究畢業(yè)論文

ID:845287

大?。?79.52 KB

頁數(shù):45頁

時間:2017-09-19

基于視覺特性的視頻編碼理論與方法研究畢業(yè)論文_第1頁
基于視覺特性的視頻編碼理論與方法研究畢業(yè)論文_第2頁
基于視覺特性的視頻編碼理論與方法研究畢業(yè)論文_第3頁
基于視覺特性的視頻編碼理論與方法研究畢業(yè)論文_第4頁
基于視覺特性的視頻編碼理論與方法研究畢業(yè)論文_第5頁
資源描述:

《基于視覺特性的視頻編碼理論與方法研究畢業(yè)論文》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、項目名稱:基于視覺特性的視頻編碼理論與方法研究44一、研究內(nèi)容由于可以有效節(jié)省通信帶寬和存儲容量,高效率的視頻編碼技術(shù)已經(jīng)成為數(shù)字視頻廣播(廣播網(wǎng))、數(shù)字媒體存儲與網(wǎng)絡(luò)傳輸(計算機網(wǎng)絡(luò))、以及多媒體通訊(通信網(wǎng))等數(shù)字媒體產(chǎn)業(yè)的共性關(guān)鍵技術(shù)。特別是近年來,我國的數(shù)字媒體產(chǎn)業(yè)迅猛發(fā)展,年均產(chǎn)值已近萬億元,使得音視頻編解碼標準技術(shù)的地位越來越重要。經(jīng)過多年努力,2006年中國終于有了自己的視頻編碼國家標準AVS。但我們?nèi)孕栉从昃I繆,從模型、理論、方法和技術(shù)上為下一代視頻編碼國家標準和國際標準的制定早做準備,確保在下一輪

2、的標準競爭中立于不敗之地。從視頻編碼的需求角度看,編碼的主要動機是在盡量保證高質(zhì)量視覺效果的前提下最大限度地降低碼率,達到壓縮的目的。眾所周知,人類視覺系統(tǒng)的信息處理能力遠遠超過目前的視頻處理系統(tǒng),因此,從方法論上借鑒人類視覺系統(tǒng)的視覺信息處理基本神經(jīng)機制和心理機理,構(gòu)建統(tǒng)一的圖像/視頻基本結(jié)構(gòu)與表示模型及其相應(yīng)的視覺計算方法,發(fā)展將香農(nóng)信息論與人類視覺系統(tǒng)信息處理原理相結(jié)合的高效視覺信息編碼理論與方法,就成為了本項目的基本出發(fā)點和立項依據(jù)。視頻編碼處理的核心環(huán)節(jié)要對視頻中包含的視覺信息進行高效的表達和準確的重建,

3、其本質(zhì)是視覺信息的基本結(jié)構(gòu)和有效表示問題。為此,我們需要探討以下關(guān)鍵科學(xué)問題:(1)視頻編碼可以借鑒的視覺信息處理機理是什么?作為長期進化的結(jié)果,人類視覺信息處理系統(tǒng)是至為精致的生物系統(tǒng)之一。但遺憾的是,其基本神經(jīng)機制、知覺和認知機理目前尚不完全清晰。本項目將從多學(xué)科交叉的角度出發(fā),探索視覺信息處理的基本神經(jīng)機制和認知機理,研究相應(yīng)的理論和模型,對其進行實驗驗證與計算仿真,以期能夠用以指導(dǎo)建立更加有效的視覺計算模型。(2)視頻編碼可以利用的符合視覺信息處理機理的計算模型是什么?盡管人類視覺系統(tǒng)的信息處理機理尚不完全

4、明了,但隨著技術(shù)手段的提高,腦科學(xué)、神經(jīng)科學(xué)和認知心理學(xué)專家已經(jīng)掌握了越來越多的規(guī)律并提出了很多假說和模型。如何基于這些發(fā)現(xiàn)構(gòu)建相應(yīng)的、可計算的視覺信息處理數(shù)學(xué)模型就成為一個重要的基礎(chǔ)科學(xué)問題。其解決不僅可以有效促進視覺編碼技術(shù)的發(fā)展,還可以從計算模擬的角度反過來推動視覺基本機理的研究。(3)與人類視覺系統(tǒng)特性相吻合的視頻表示及編碼的理論是什么?44香農(nóng)信息論雖然從理論上給出了編碼效率的上界和失真的關(guān)系,但并未考慮編碼的符號(事件)集,因而對視頻中高階相關(guān)缺乏有效的描述手段。視覺信息論試圖借鑒神經(jīng)生理學(xué)在不同感知階

5、段對感知對象的抽象,建立對應(yīng)的符號(事件)集,使之能夠方便地描述高階相關(guān)性,體現(xiàn)語義結(jié)構(gòu),從而豐富信息論理論。符號(事件)是借鑒稀疏編碼理論通過采用貝葉斯計算視覺感知的后驗概率建立的。這將為高效視頻編碼提供指導(dǎo)性的理論基礎(chǔ)。上述三個關(guān)鍵科學(xué)問題緊緊圍繞視覺信息處理系統(tǒng)中最核心的表示與編碼問題,分別從生理/心理基本機理、視覺信息處理計算模型、視頻編碼基礎(chǔ)理論三個層面展開。其中,視覺基本機理既是基本出發(fā)點也是落腳點,計算模型是橋梁和紐帶,視覺信息論則是設(shè)計和實現(xiàn)下一代視頻編碼方法和技術(shù)的理論基礎(chǔ)。圍繞上述三個關(guān)鍵科學(xué)問

6、題,我們提出的總體研究內(nèi)容框架如圖2所示,以期建立解決這些問題的模型、理論和方法,構(gòu)建相應(yīng)的驗證平臺和原型系統(tǒng)。如圖所示,對應(yīng)三個關(guān)鍵科學(xué)問題,本項目的主要研究內(nèi)容自底向上分別建立在三個層面,即:機理與模型層,理論與方法層,關(guān)鍵技術(shù)與驗證層。下面我們分別從這三個層面對本項目的主要研究內(nèi)容進行闡述。2.1視覺基本機理與模型層該層面的研究內(nèi)容面向的科學(xué)問題主要是前兩個:視覺信息處理的基本機理和符合這些基本機理的計算模型。不難理解,二者有天然的緊密聯(lián)系:一方面,視覺信息處理基本機理為視覺信息處理的計算仿真、計算模型建立等

7、提供了良好的生理學(xué)和心理學(xué)參照系,對其基本規(guī)律的認識為計算模型的建立提供了良好的技術(shù)可能性和努力方向。另一方面,計算模型也為基本機理的正確性和模型的有效性提供了驗證機會,有利于推動視覺基本機理的研究。下面分別敘述本項目在視覺基本機理和計算模型方面擬開展的研究。2.1.1視覺信息處理基本機理研究在視知覺機理方面,將主要從生理、心理角度,通過神經(jīng)電生理學(xué)、視覺行為學(xué)、藥物學(xué)等研究手段,在靈長類動物上采用包括微電極矩陣記錄方法、高時間分辨率的事件相關(guān)電位(ERP)、功能核磁共振(fMRI)等技術(shù)手段從初級視覺皮層V1神經(jīng)

8、元群體反應(yīng)特性入手,研究V1神經(jīng)元經(jīng)典和非經(jīng)典感受野與上級視覺皮層區(qū)域神經(jīng)元正向和反向聯(lián)系、V1神經(jīng)元之間的橫向聯(lián)系,以及視覺學(xué)習(xí)過程中神經(jīng)元群視覺編碼模式的變化特性,探索初級和44高級皮層中的神經(jīng)元群在視覺處理中對簡單和復(fù)雜視覺刺激的編碼模式以及動態(tài)反應(yīng)模式,各級皮層神經(jīng)元群對不同視覺模式識別的貢獻,考察視覺注意和知覺組織之間相互影響和交互作用,以驗證或改

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。