資源描述:
《《多媒體技術(shù)與應(yīng)用》PPT課件》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第二章數(shù)字音頻技術(shù)第二章數(shù)字音頻技術(shù)2.1數(shù)字音頻基礎(chǔ)2.2數(shù)字音頻壓縮標(biāo)準(zhǔn)2.3聲卡與電聲設(shè)備2.4MIDI與音樂合成2.5音頻編輯軟件2.6語音識別技術(shù)本章小結(jié)2-3一、聲音的基本概念聲音是通過一定介質(zhì)傳播的連續(xù)的波。t振幅周期A聲波振幅:音量的大小周期:重復(fù)出現(xiàn)的時間間隔頻率:指信號每秒鐘變化的次數(shù)重要指標(biāo)2.1數(shù)字音頻基礎(chǔ)2-4聲音按頻率分類:次聲波可聽聲波超聲波20Hz20kHzf(Hz)語音信號頻率范圍:300Hz-3kHz2.1數(shù)字音頻基礎(chǔ)1020502003.4k7k15k20kCD-DAFM廣播AM廣播電話f(Hz)頻帶
2、聲音質(zhì)量的頻率范圍:2-5聲音的傳播攜帶了信息,它是人類傳播信息的一種主要媒體。聲音的三種類型:波形聲音:包含了所有聲音形式語音:不僅是波形聲音,而且還有豐富的語言內(nèi)涵(抽象→提取特征→意義理解)音樂:與語音相比,形式更規(guī)范。音樂是符號化的聲音。2.1數(shù)字音頻基礎(chǔ)2-6二、聲音的數(shù)字化1.聲音信號的類型模擬信號(自然界、物理)數(shù)字信號(計算機)2.聲音數(shù)字化過程采樣量化編碼模擬信號數(shù)字信號模擬信號數(shù)字信號A/DADCD/ADAC2.1數(shù)字音頻基礎(chǔ)2-73.聲音數(shù)字化過程連續(xù)的模擬聲音信號聲音信號的采樣離散的音頻信號示意2.1數(shù)字音頻基礎(chǔ)2
3、-84.聲音數(shù)字化三要素采樣頻率量化位數(shù)聲道數(shù)每秒鐘抽取聲波幅度樣本的次數(shù)每個采樣點用多少二進(jìn)制位表示數(shù)據(jù)范圍使用聲音通道的個數(shù)采樣頻率越高聲音質(zhì)量越好數(shù)據(jù)量也越大量化位數(shù)越多音質(zhì)越好數(shù)據(jù)量也越大立體聲比單聲道的表現(xiàn)力豐富,但數(shù)據(jù)量翻倍11.025kHz22.05kHz44.1kHz8位=25616位=65536單聲道立體聲2.1數(shù)字音頻基礎(chǔ)2-95.聲音數(shù)字化的數(shù)據(jù)量音頻數(shù)據(jù)量=采樣頻率×量化位數(shù)×聲道數(shù)/8(字節(jié)/秒)采樣頻率(kHz)量化位數(shù)(bit)數(shù)據(jù)量(KB/s)單聲道立體聲11.025810.7721.531621.5343
4、.0722.05821.5343.071643.0786.1344.1843.0786.131686.13172.272.1數(shù)字音頻基礎(chǔ)2-10三、音頻的文件格式1.WAV文件WAV是Microsoft/IBM共同開發(fā)的PC波形文件。因未經(jīng)壓縮,文件數(shù)據(jù)量很大。特點:聲音層次豐富,還原音質(zhì)好2.1數(shù)字音頻基礎(chǔ)2.MP3文件MP3(MPEGAudiolayer3)是一種按MPEG標(biāo)準(zhǔn)的音頻壓縮技術(shù)制作的音頻文件。特點:高壓縮比(11:1),優(yōu)美音質(zhì)2-113.RA文件RA(RealAudio,即時播音系統(tǒng))新型流式音頻,RA、RM、RMX。
5、特點:在低速的廣域網(wǎng)上實時傳輸音頻4.WMA文件WMA(WindowsMediaAudio)是WindowsMedia格式中的一個子集(音頻格式)。特點:壓縮到MP3一半2.1數(shù)字音頻基礎(chǔ)2-125.MIDI和RMI文件MIDI(樂器數(shù)字接口)是由一組音樂、樂譜或樂器符號的數(shù)字集合。特點:播放效果與硬件相關(guān),數(shù)據(jù)量很小,音質(zhì)不高、音色單調(diào)等6.VOC文件創(chuàng)新公司開發(fā)的聲音文件格式,由文件頭塊和音頻數(shù)據(jù)塊組成。2.1數(shù)字音頻基礎(chǔ)2-13四、音頻的采集與處理1.聲音的采集錄音軟件專業(yè)錄音棚唱盤活錄音帶轉(zhuǎn)錄數(shù)字音頻庫2.1數(shù)字音頻基礎(chǔ)2.聲音的
6、處理剪接、降噪、均衡、效果、動態(tài)處理、格式轉(zhuǎn)換。2-142.2數(shù)字音頻壓縮標(biāo)準(zhǔn)一、音頻壓縮方法概述編碼器傳輸/存儲解碼器輸入音頻信號輸出音頻信號壓縮編碼技術(shù)是指用某種方法使數(shù)字化信息的編碼率降低的技術(shù)音頻信號能壓縮的基本依據(jù):聲音信號中存在大量的冗余度;人的聽覺具有強音抑制弱音的現(xiàn)象;低頻段敏感、高頻段不敏感。2-15音頻信號壓縮編碼的分類:①無損壓縮(熵編碼)霍夫曼編碼、算術(shù)編碼、行程編碼②有損壓縮波形編碼--PCM、DPCM、ADPCM子帶編碼、矢量量化參數(shù)編碼--LPC混合編碼--MPLPC、CELP2.2數(shù)字音頻壓縮標(biāo)準(zhǔn)2-162
7、.2數(shù)字音頻壓縮標(biāo)準(zhǔn)二、音頻壓縮技術(shù)標(biāo)準(zhǔn)分類標(biāo)準(zhǔn)說明電話語音質(zhì)量G.711采樣8kHz,量化8bit,碼率64kbpsG.721采用ADPCM編碼,碼率32kbpsG.723采用ADPCM有損壓縮,碼率24kbpsG.728采用LD-CELP壓縮技術(shù),碼率16kbps調(diào)幅廣播質(zhì)量G.722采樣16kHz,量化14bit,碼率224(64)kbps高保真立體聲MPEG音頻采樣44.1kHz,量化16bit,碼率705kbps(MPEG三個壓縮層次,384-64kbps)2-172.2數(shù)字音頻壓縮標(biāo)準(zhǔn)三、音頻壓縮工具音頻文件轉(zhuǎn)換:AudioC
8、onverter、另存為MP3壓縮工具:MP3Resizer2-182.3聲卡與音箱一、聲卡(聲音卡、音頻卡)1.聲卡的主要功能聲卡是負(fù)責(zé)錄音、播音和聲音合成的一種多媒體板卡。其功能包括:錄制