多視點視頻的編碼技術(shù)綜述

多視點視頻的編碼技術(shù)綜述

ID:20494736

大?。?2.27 KB

頁數(shù):6頁

時間:2018-10-13

多視點視頻的編碼技術(shù)綜述_第1頁
多視點視頻的編碼技術(shù)綜述_第2頁
多視點視頻的編碼技術(shù)綜述_第3頁
多視點視頻的編碼技術(shù)綜述_第4頁
多視點視頻的編碼技術(shù)綜述_第5頁
資源描述:

《多視點視頻的編碼技術(shù)綜述》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。

1、多視點視頻的編碼技術(shù)綜述摘要:闡述了多視點視頻(MVC)的幾種編碼技術(shù),包括其發(fā)展過程和主要原理并且比較這幾種方法的優(yōu)劣,以及提出了MVC在未來的可能的發(fā)展方向和研關(guān)鍵詞:綜述;多視點視頻編碼;算法;3d場景;時間相關(guān)性;視點間相關(guān)性;視差估計;運動估計1引言:多視點視頻指的是由不同視點的多個攝像機從不同視角拍攝同一場景得到的一組視頻信號,是一種有效的3D視頻表示方法,能夠更加生動地再現(xiàn)場景,提供立體感和交互功能。多視點視頻可廣泛應(yīng)用于任意視點視頻、二維電視、交融式會議電視、遠程醫(yī)學(xué)診療、虛擬現(xiàn)實以及視頻監(jiān)視系統(tǒng)等多種正在興起的多媒體業(yè)務(wù)。[1]與單視點視頻相

2、比,多視點視頻的數(shù)據(jù)量隨著攝像機的數(shù)目增加而線性增加。巨大的數(shù)據(jù)量己成為制約其廣泛應(yīng)用的瓶頸,為此,F(xiàn)TU-T和MPEG的聯(lián)合視頻組(JVT,jointvideoteam)提出了多視點視頻編碼(MVC,multiviewvideocoding)的概念。MVC主要致力于多視點視頻的高效壓縮編碼,是未來視頻通信領(lǐng)域中的一項關(guān)鍵技術(shù),也是國際視頻標準化組織,在研究的熱點問題。[1]多視點視頻最為顯著的特點在于視間的相關(guān)性。在傳統(tǒng)的單視點視頻編碼中,通常采用去除時間相關(guān)性和空間相關(guān)性的混合編碼方式,運動估計(MotionEstimation)/運動補償(MotionC

3、ompensation}、巾貞內(nèi)預(yù)測、巾貞間PB預(yù)測、多參考巾貞(Multi-referenceframes)預(yù)測,DCT或DWT變換等是最為常用的編碼技術(shù),這些技術(shù)也被眾多視頻編碼國際標準如H.26X[11]/MPEG-X所采用。MVC除采用傳統(tǒng)的單視點視頻混合編碼技術(shù)之外,進一步采用視差估計(DisparityEstimation)/視差補償(DisparityCompersation)[8]、深度圖技術(shù)(DepthImgge)等來提高多視點視頻的壓縮效率。此外,多視點視頻分布式編碼、多視點視頻的碼率控制技術(shù)等也被應(yīng)用到多視點視頻編碼之中。總之,要想多視點

4、視頻系統(tǒng)在實際生活中得到廣泛的應(yīng)用,僅通過提高網(wǎng)絡(luò)帶寬和擴大存儲容量是遠遠不夠的,還必須提高系統(tǒng)的整體編碼性能。[6]基于H.264架構(gòu)的編碼框圖[5]交換1—n反fi化反變換碼編熵幀內(nèi)禎問預(yù)涮選擇幀內(nèi)預(yù)測今2.國內(nèi)外研究現(xiàn)狀Z1視頻編碼技術(shù)概況[23,5]原始視頻的數(shù)據(jù)量雖然巨大,但它們在時域、空域、以及統(tǒng)計上都存在大量的信息亢余。從20世紀中期以來,由于數(shù)據(jù)壓縮技術(shù)的發(fā)展和完善,極大的推動了視頻編碼技術(shù)的前進。一些經(jīng)典的視頻編碼技術(shù)隨之出現(xiàn),主要技術(shù)分為以下幾個方面:(1)預(yù)測編碼預(yù)測編碼就是利用像素的相關(guān)性計算預(yù)測值,并對實際值和預(yù)測值之間的差異進行編碼

5、。預(yù)測編碼按預(yù)測方法可以分為線性預(yù)測編碼和非線性預(yù)測編碼。[17](2)變換編碼變換編碼[16]就是將空域圖像信號變換到另一個正交矢量空間中,然后對轉(zhuǎn)換后的系數(shù)進行量化和編碼。在目前所有的變換算法中,以Ahmed等人[6]于1974年提出的離散余弦變換(DiscreteCosineTransforrnDCT)對視頻編碼算法最為重要。隨著1977年Chen等人[5]以及1987年Hou等人[2]提出了針對DCT的一些快速算法,DCT很快被各種視頻編碼標準所采用。⑶熵編碼嫡編碼是利用信源的統(tǒng)計特性進行數(shù)據(jù)壓縮,它是一種無損壓縮編碼技術(shù)。常用的嫡編碼有霍夫曼編碼、算

6、術(shù)編碼和游程編碼。2.2多視點視頻編碼技術(shù)特點[13,20]:(1)預(yù)測結(jié)構(gòu);(2)運動跳過模式及其改進算法;(3)亮度和色度補償技術(shù);(4)視差合成預(yù)測.3.多視點視頻編碼的關(guān)鍵技術(shù)及主要研究內(nèi)容3..1MVC預(yù)測技術(shù)為了在多視點視頻系統(tǒng)中提高編碼效率以及隨機訪問性能,需要設(shè)計合理的預(yù)測結(jié)構(gòu),并采用多種預(yù)測技術(shù)來減少編碼幀在時間和和空間上的相關(guān)性。[7]3.2DMVC的邊信息生成技術(shù)DMVC的關(guān)鍵技術(shù)就是如何準確估計邊信息。分布式視頻編碼中的邊信息用于接收端的信道解碼和重建視頻,是對當前WZ幀的預(yù)測,相當于傳統(tǒng)編碼中對P幀或B幀的預(yù)測,只是預(yù)測是在解碼端進行

7、的,因此DMV將編碼端的計算復(fù)雜度移到了解碼端。預(yù)測精度越高,說明邊信息與WZ幀越接近,經(jīng)過信道解碼后誤碼率就越低,依據(jù)邊信息重建的視頻效果越好。[10]多視點分布式視頻編碼的邊信息,可以利用同一視點視頻序列的時間邊信息和不同視點視頻序列的視間邊信息共同生成,或?qū)牟煌朁c視頻圖像進行融合得到更加準確的邊信息。[7]3.3深度圖像高效編碼深度圖像表示場景中對象的深度信息,其統(tǒng)計特性有別于傳統(tǒng)的2D圖像,同時其在解碼端不是為了顯示,而是為了輔助合成任意視點,因此在設(shè)計編碼方法時就要充分考慮到深度圖像的特性。在[5,9,14,17,19,20]中都提出了相應(yīng)的保護

8、圖像對象邊緣信息的編碼技術(shù),主要有一下

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。