資源描述:
《多媒體技術(shù)原理及應(yīng)用 ppt課件.ppt》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第2章多媒體數(shù)據(jù)壓縮技術(shù)信息表示與編碼常用的數(shù)據(jù)壓縮技術(shù)靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEG運動圖像壓縮編碼標(biāo)準(zhǔn)MPEG視聽通信編碼解碼標(biāo)準(zhǔn)H.26X聲音壓縮技術(shù)2.1信息表示與編碼數(shù)字化表示彩色空間多媒體數(shù)據(jù)轉(zhuǎn)換2.1.1概述傳統(tǒng)上用模擬方式表示聲音和圖像信息。易出故障,常產(chǎn)生噪音和信號丟失,且拷貝過程中噪音和誤差逐步積累;模擬信號不適合數(shù)字計算機(jī)加工處理。數(shù)字化處理:巨大的數(shù)據(jù)量。采樣定理:僅當(dāng)采樣頻率≥2倍的原始信號頻率時,才能保證采樣后信號可被保真地恢復(fù)為原始信號。采用8bit數(shù)字化,從而1秒鐘電視信號的數(shù)據(jù)量約為99.2Mbits。即約為100Mbps。650MB的CD-ROM僅能存約1
2、分鐘的原始電視數(shù)據(jù)。若HDTV(1.2Gbps),一張CD-ROM還存不下6秒鐘的HDTV圖像。人說話的音頻一般在20Hz~4kHz,即人類語音的帶寬為4kHz。依據(jù)采樣定理,設(shè)數(shù)字化精度為8b,則1秒鐘信號量為64kbits。因此,人講1分鐘話的數(shù)據(jù)量為480kB。數(shù)字化處理的關(guān)鍵問題-數(shù)據(jù)壓縮壓縮的基礎(chǔ)-數(shù)據(jù)冗余空間冗余時間冗余信息熵冗余結(jié)構(gòu)冗余知識冗余視覺冗余其他冗余空間冗余這是圖像數(shù)據(jù)中經(jīng)常存在的一種冗余。在同一幅圖像中,規(guī)則物體和規(guī)則背景的表面物理特性具有相關(guān)性,這些相關(guān)性的光成象結(jié)構(gòu)在數(shù)字化其他中就表現(xiàn)為數(shù)據(jù)冗余。時間冗余這是序列圖像和語音數(shù)據(jù)中所經(jīng)常包含的冗余。圖像序列中
3、的兩幅相鄰的圖像之間有較大的相關(guān)性,這反映為時間冗余。在語言中,由于人在說話時發(fā)音的音頻是一連續(xù)的漸變過程,而不是一個完全時間上獨立的過程,因而存在時間冗余。信息熵冗余信息熵是指一組數(shù)據(jù)所攜帶的信息量,它定義為:H=-∑i=0N-1Pilog2PiN為數(shù)據(jù)類數(shù)或碼元個數(shù),Pi為碼元yi發(fā)生的概率.為使信息編碼單位數(shù)據(jù)量d接近于或等于H,應(yīng)設(shè):d=∑i=0N-1Pib(yi)其中b(yi)是分配給碼元yi的比特數(shù),理論上應(yīng)取b(yi)=-log2Pi.實際一般取b(y0)=b(y1)=…=b(yK-1).例如,英文字母編碼碼元長為7bit,即b(y0)=b(y1)=…=b(yK-1)=7
4、,這樣d必然大于H,由此帶來的冗余稱為信息熵冗余或編碼冗余。結(jié)構(gòu)冗余有些圖像從大域上看存著非常強(qiáng)的紋理結(jié)構(gòu),我們稱它們在結(jié)構(gòu)上存在有冗余。例如,布紋圖像和草席圖像。知識冗余有許多圖像的理解與某些基礎(chǔ)知識有相當(dāng)大的相關(guān)性。例如,人臉的圖像有固定的結(jié)構(gòu)。比如說嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正臉圖像的中線上等。這類規(guī)律性的結(jié)構(gòu)可由先驗知識和背景知識得到,我們稱此類冗余為知識冗余。視覺冗余人類視覺系統(tǒng)對于圖像場的任何變化,并不是都能感知的。例如,對于圖像的編碼處理時,由于壓縮或量化截斷引入了噪聲而使圖像發(fā)生了一些變化,如果這些變化不能為視覺所感知,仍認(rèn)為圖像足夠好。事實上人類視覺系
5、統(tǒng)一般分辨能力約為26灰度等級,而一般圖像量化采用28灰度等級,這類冗余我們稱為視覺冗余。其他冗余例如,由圖像的空間非定常特性所帶來的冗余。2.1.2數(shù)字圖像編碼技術(shù)1.彩色空間常見模型:RGB彩色空間HSI彩色空間YUV彩色空間YIQ彩色空間RGB彩色空間R、G、B是彩色最基本表示模型,也是計算機(jī)系統(tǒng)中所使用的彩色模型。RGB5:5:5方式用2個字節(jié)表示一個像素,具體位分配見圖2.1。圖2.1RGB5:5:5方式RGB8:8:8方式R、G、B三個分量各占一個字節(jié)。T(1b)R(5b)G(5b)B(5b)HSI彩色空間這種模型中,用H(Hue,色調(diào))、S(Saturation,飽和度
6、)、I(Intensity,光強(qiáng)度)3個分量來表示一種顏色,這種表示更適合人的視覺特性。YUV彩色空間Y為亮度信號,U、V是色差信號(B-Y,R-Y)。PAL制式彩色空間即為YUV。優(yōu)點是亮度和色差信號分離,容易使彩色電視系統(tǒng)與黑白電視信號兼容。國際無線電咨詢委員會根據(jù)實驗認(rèn)為采用雙倍度采樣4:2:2方案效果較好,提出CCIR601標(biāo)準(zhǔn)。變換公式(YUV<--->RGB)Y=0.299*R+0.587*G+0.114*B;U=-0.169*R-0.332*G+0.500*B;V=0.500*R+0.419*G-0.081*BYIQ彩色空間廣播電視系統(tǒng)另一種常用的亮度與色差分離的模型。N
7、TSC制式彩色空間即為YIQ。這里Y是亮度,I和Q共同描述圖像的色調(diào)和飽和度。變換公式(YIQ<--->RGB)Y=0.299*R+0.587*G+0.114*BI=0.211*R-0.523*G+0.312*BQ=0.596*R-0.275*G-0.322*B2.數(shù)字圖像文件格式TIFPCXGIF、TGA、BMP、DVI、JPEG等TIF文件格式由美國AldusDeveloper’sDesk和Microsoft制定結(jié)構(gòu)文件頭(8B)參數(shù)指針表