資源描述:
《第6章 多媒體音頻信息處理技術(shù)ppt課件.ppt》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、第6章多媒體音頻信息處理技術(shù)本章主要內(nèi)容6.1音頻信號(hào)及其概念6.2模擬音頻的數(shù)字化6.3音頻處理軟件6.1.1聲音處理技術(shù)歷史留聲機(jī)→唱片(磁帶)→數(shù)字音頻機(jī)械化→模擬電信號(hào)→數(shù)字電信號(hào)電聲轉(zhuǎn)換、音頻信號(hào)的存儲(chǔ)和重放技術(shù)、加工處理技術(shù)以及數(shù)字化音頻信號(hào)的編碼、壓縮、傳輸、存儲(chǔ)、糾錯(cuò)等技術(shù),是數(shù)字音頻技術(shù)的主要對(duì)象。6.1.1聲音處理技術(shù)歷史圖用磁帶記錄聲音的錄音機(jī)6.1.2聲音信號(hào)的形式聲音的產(chǎn)生是因?yàn)榘l(fā)聲體的振動(dòng)在物理介質(zhì)(氣體、液體、固體)中傳播的縱向壓力波。傳播到人的耳膜上產(chǎn)生有效聲壓。圖在自然界,聲波與水波一樣都是一種振動(dòng)波聲源●聲音感知的過(guò)程如下
2、:聲源傳播介質(zhì)具有聽(tīng)覺(jué)的人●聲音感知是作用于人耳膜上聲壓的客觀存在。6.1.2聲音信號(hào)的形式6.1.2聲音信號(hào)的形式聲波中復(fù)合了不同聲強(qiáng)和頻率的子聲波。悅耳的交響樂(lè);嘈雜的噪聲;音頻一般劃分為:語(yǔ)音信號(hào):人類發(fā)出的,豐富信息和內(nèi)涵;非語(yǔ)音信號(hào);各種物理的聲音還原設(shè)備或自然界中的其它生物發(fā)出的,簡(jiǎn)單,信息量低;機(jī)場(chǎng)的驅(qū)鳥(niǎo)裝置很有意思!6.1.2聲音信號(hào)的形式物理上,聲音可用連續(xù)的曲線描述,并且都可以分解為一組正弦函數(shù)。(傅立葉變換思想)圖用聲音錄制軟件記錄的英文單詞”Hello”語(yǔ)音的實(shí)際波形聲音是振動(dòng)波,它是在時(shí)間軸和幅度軸上都是連續(xù)的信號(hào)。6.1.2聲音信
3、號(hào)的形式1秒鐘波峰的個(gè)數(shù)頻率的倒數(shù)聲音的強(qiáng)弱6.1.2聲音信號(hào)的形式頻率(frequency):?jiǎn)挝粫r(shí)間內(nèi)信號(hào)振動(dòng)的次數(shù)或出現(xiàn)波峰(谷)的次數(shù)。1秒鐘產(chǎn)生5000個(gè)波峰,則聲音頻率為5kHZ;周期:每隔一定時(shí)間波形就重復(fù)出現(xiàn),則該時(shí)間就是周期;周期性聲音:元音、鳥(niǎo)鳴及風(fēng)聲;非周期性聲音:打擊樂(lè)、雷電聲、流水聲;振幅(Amplitude):基線到當(dāng)前波峰的距離或振動(dòng)的物質(zhì)偏離平衡位置的最大絕對(duì)值;●人耳可以感覺(jué)到的最低聲壓值是20uPa;●人耳可以感覺(jué)到的最高聲壓值是64.5Pa;可聽(tīng)閾痛閾●人耳的聽(tīng)覺(jué)特性是指數(shù)特性。20uPa6.1.3人對(duì)聲音的感知●語(yǔ)音信
4、號(hào)大概有20~40分貝的動(dòng)態(tài)范圍?!窠豁憳?lè)、戲劇等的動(dòng)態(tài)范圍可達(dá)80~90分貝。●當(dāng)超過(guò)130(64.5Pa)分貝時(shí),人耳會(huì)感到痛感。6.1.3人對(duì)聲音的感知●所以,人對(duì)聲音的強(qiáng)度的感知是有一個(gè)范圍的。●同時(shí),人對(duì)聲音的強(qiáng)度的感知與聲音頻率有關(guān)?!耦l率:聲音信號(hào)每秒鐘變化的次數(shù),單位Hz;次聲波人耳可聽(tīng)域超聲波<20Hz20~20,000Hz>20,000Hz聲音深沉聲音尖銳150Hz~10,000Hz100Hz~9,000Hz6.1.3人對(duì)聲音的感知6.1.3人對(duì)聲音的感知人類聽(tīng)覺(jué):20Hz~20000Hz人聲:80Hz~3400Hz語(yǔ)音:300Hz~30
5、00Hz傳統(tǒng)樂(lè)器:16Hz~7000Hz鋼琴:27.5Hz~4186Hz聲樂(lè):87Hz(男低音)~1318Hz(花腔女高音)●頻率帶寬越大,聲音質(zhì)量越好;電話語(yǔ)音200Hz~3,400Hz變好調(diào)幅廣播(AM)50Hz~7,000Hz變好調(diào)頻廣播(FM)20Hz~15,000Hz高級(jí)音響10Hz~40,000Hz變好6.1.3人對(duì)聲音的感知●音調(diào)的高低體現(xiàn)在聲音的頻率大小。男高音4000Hz以上男低音300Hz以下男中音300Hz~4000Hz6.1.3人對(duì)聲音的感知●聲波的振幅表示聲音信號(hào)的強(qiáng)弱程度。音量變大振幅變大6.1.3人對(duì)聲音的感知●振幅和頻率都沒(méi)有
6、發(fā)生改變的聲音稱為純音?!裼刹煌恼穹皖l率組成的聲音稱為復(fù)音。6.1.3人對(duì)聲音的感知●復(fù)音中的最低頻率稱為復(fù)音的基頻。●復(fù)音中還存在一些其它頻率,稱為諧音?!窕l和諧音合成復(fù)音,決定了特定的聲音音質(zhì)和音色?!裾Z(yǔ)音是復(fù)合音,語(yǔ)音由元音和復(fù)音構(gòu)成,它們共同構(gòu)成漢語(yǔ)語(yǔ)音。6.1.3人對(duì)聲音的感知6.1.4模擬數(shù)據(jù)與數(shù)字?jǐn)?shù)據(jù)模擬數(shù)據(jù)(AnalogData)是隨時(shí)間連續(xù)變化的值;數(shù)字?jǐn)?shù)據(jù)(DigitalData)是模擬數(shù)據(jù)經(jīng)數(shù)字化之后的離散值;模擬數(shù)據(jù)采用模擬信號(hào)傳送,如無(wú)線電;數(shù)字信號(hào)采用連續(xù)變化的脈沖表示;模數(shù)轉(zhuǎn)換及模數(shù)轉(zhuǎn)換器(AnalogDigitalCon
7、verter)數(shù)模轉(zhuǎn)換及數(shù)模轉(zhuǎn)換器(DigitalAnalogConverter)6.1.4模擬數(shù)據(jù)與數(shù)字?jǐn)?shù)據(jù)借助于A/D或D/A轉(zhuǎn)換器,模擬信號(hào)和數(shù)字信號(hào)可以互相轉(zhuǎn)換6.2模擬音頻的數(shù)字化模擬信號(hào)的主要缺點(diǎn)精確模擬信號(hào)的產(chǎn)生十分困難;模擬信號(hào)受環(huán)境影響大;模擬元部件開(kāi)發(fā)成本高;模擬信號(hào)的可重復(fù)性差。6.2模擬音頻的數(shù)字化數(shù)字信號(hào)的主要優(yōu)點(diǎn):數(shù)字信號(hào)計(jì)算的精確度高;它不受環(huán)境和時(shí)間的影響;數(shù)學(xué)運(yùn)算容易實(shí)現(xiàn);數(shù)字運(yùn)算部件的可擴(kuò)展性好;6.2模擬音頻的數(shù)字化模擬音頻信號(hào)時(shí)間上連續(xù);幅度上連續(xù);數(shù)字音頻信號(hào)時(shí)間上離散;幅度上離散;模擬音頻信號(hào)音頻信號(hào)時(shí)間離散化音頻
8、信號(hào)幅度的離散化6.2模擬音頻的數(shù)字化●時(shí)間軸離散化