語音信號的帶寬擴(kuò)展.docx

語音信號的帶寬擴(kuò)展.docx

ID:48995752

大?。?0.62 KB

頁數(shù):4頁

時間:2020-02-26

語音信號的帶寬擴(kuò)展.docx_第1頁
語音信號的帶寬擴(kuò)展.docx_第2頁
語音信號的帶寬擴(kuò)展.docx_第3頁
語音信號的帶寬擴(kuò)展.docx_第4頁
資源描述:

《語音信號的帶寬擴(kuò)展.docx》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫

1、2.3帶寬擴(kuò)展的基本方法首先有個待限語音信號snb(n),和窄帶激勵信號enb(n),然后從窄帶激勵信號enb(n)中生產(chǎn)處寬帶激勵信號e^bb(n).下一步就是用估計的寬帶譜包絡(luò)來對寬帶激勵信號進(jìn)行頻譜整形。原始信號是窄帶語音信號,因此需要一個高通濾波器來除掉冗余的頻率分量。最后,估計得到的高頻成分結(jié)合原始窄帶信號中的低頻成分得到寬帶語音信號,實現(xiàn)了帶寬擴(kuò)展。3.1線性預(yù)測分析基本思想:語音信號的每個取樣值都能夠用過去若干個取樣值的線性組合(預(yù)測值)來逼近,通過最小化是基于語音信號取樣值和線性預(yù)測值之間的均方誤差,賴覺決定一組預(yù)測器

2、的系數(shù)。為明確語音信號的時段和平均平方誤差,本文提供了兩種方法:方法自相關(guān)方法協(xié)方差方法適用條件限制輸入的語音信號限制平均平方誤差做法用長度是N的矩形窗用長度是N的矩形窗矩陣特性對稱并且是Toeplitz結(jié)構(gòu)對稱;在計算誤差范圍外的語音采樣點也是需要的3.2譜包絡(luò)的參數(shù)表示1.自回歸系數(shù)(AR):用離散時變?yōu)V波器來模擬嘴和鼻竅,適用于語音編碼和語音分析,2.倒譜系數(shù):語音信號是激勵信號和聲道響應(yīng)卷積得來的,利用倒譜法可以分別計算每個源信號和參數(shù)對語音的影響,倒譜法是對語音信號求FFT,然后在對其求對數(shù),再求逆運算。3.MFCCs:是利

3、用人的聽覺系統(tǒng),人類對單個音調(diào)的感知強(qiáng)度與MEL頻域的對數(shù)成正比;當(dāng)同時發(fā)出兩個頻率相近的音調(diào)時,人類只能識別一個,一次兩個頻率必須相差一定帶寬時,一定要有臨界帶寬。MFCC求取過程:a、語音信號的預(yù)處理:對語音進(jìn)行預(yù)加重、有音無音檢測、分幀及加窗處理、得到可以用于提取特征參數(shù)的語音向量。b、對已經(jīng)預(yù)處理的語音向量進(jìn)行DFT;c、將上步得到的離散頻譜用序列三角濾波器進(jìn)行濾波處理,得到一組系數(shù);d、利用DCT將濾波器輸出變換到倒譜域。MEL尺度把聲音信號的頻域空間向人的感知的頻域空間進(jìn)行映射,以使濾波器的空間尺度接近人類聽覺的感知尺度。

4、在語音頻帶擴(kuò)展方面,MFCCs不如LPC及倒譜系數(shù);在語音識別方面MFCCs卻比LPC及倒譜系數(shù)更有優(yōu)勢。4、線譜頻率:在對頻率量化時LFS的穩(wěn)定性要好于LPC3.3標(biāo)量語音特性這些特性獨立于譜包絡(luò):過零率:包含了一幀內(nèi)信號穿過過零電平的次數(shù)信息,清音和噪音的過零率較高,濁音的過零率較低。梯度指數(shù):這個特型描述了關(guān)于信號方向改變的信息,在沒有很大起伏的濁音幀時,梯度指數(shù)的值很小,在清音幀時,梯度指數(shù)很大?;纛l率:其語發(fā)音者的性別有關(guān),提取基頻的基本方法是自相關(guān)法:語音的短時自相關(guān)函數(shù)在基音周期的整數(shù)倍點上有很大的峰值,只要找到最大峰

5、值點的位置,便能估計出基音周期。問題是—最大峰值點的位置有時不能同基音周期相吻合,原因是a、可能是因為窗的長度太短,一般認(rèn)為窗長至少應(yīng)大于兩個基音周期,才有好效果,語音中最長基音周期約為20ms,因此窗長應(yīng)大于40ms。b、可能是聲道特性的影響,主要是省道共振峰的影響,解決問題是用電平消波法,消波電平的確定方法:將輸入的語音數(shù)據(jù)分為3個等長的子幀,分別在第一和第三子幀中尋找最大波峰值,消波電平取為兩個峰值中較小的峰值和一個比例因子的乘積。峰度:無量綱,一般濁音的峰度較低,在爆破音和元音的開始,局部峰度有很大的峰值,局部峰度很難區(qū)分強(qiáng)的

6、濁音和清音,因此一般不用這個特性。譜質(zhì)心:譜質(zhì)心定義為帶限語音幅度譜的重心,譜質(zhì)心的取值范圍是0—1,譜質(zhì)心的大小主要取決于語音的濁音,對于濁音,譜質(zhì)心的值是0.28左右?;谀芰刻卣鳎褐饕窃跇?biāo)量上可以整個語音的平均值。能夠區(qū)分語音與停頓;能夠區(qū)分元音和擦音,元音>擦音;可以運用在標(biāo)量和矢量上。歸一化幀能量:在長期的估計中通過歸一化短時能量,可以消除由于不同說話人、不同的記錄和傳播環(huán)境帶來的能量差別。相對幀能量:依于噪聲檢測,主要應(yīng)用于背景噪聲。歸一化相對幀能量:獨立于短時能量的差異高通能量與低通能量的比值:用于區(qū)分清濁音,對清音此

7、值很增大,應(yīng)用的是高通濾波器與低通濾波器的比值,來保證系統(tǒng)的穩(wěn)定性。3.4距離測量在語音質(zhì)量的測評,語音編碼的碼本訓(xùn)練,頻帶擴(kuò)展和碼書的研究都有重要作用。對數(shù)譜偏差:主要比較譜包絡(luò)對數(shù)譜的均方根偏差:倒譜距離:似然比距離:其他的譜距離測量:人類感覺系統(tǒng)的特性:頻率越高,人類的分辨率越低;如果估計譜的幅度高于原始譜的幅度,就會有人工語音的產(chǎn)生4激勵信號的擴(kuò)展4.1窄帶激勵信號的估計從窄帶語音信號中提取出窄帶激勵信號,首先運用低階的預(yù)測誤差濾波器來移動譜包絡(luò),也可以估計出窄帶譜包絡(luò),窄帶激勵信號運用在時間域內(nèi),若要要運用在頻域,可以運用D

8、FT/FFT來轉(zhuǎn)換到頻域4.2用非線性特性擴(kuò)展窄帶激勵信號1、Half-wayrectificationa、信號的平均值不在為0;b、不在節(jié)省能量;c、可能產(chǎn)生含有基帶頻率的諧波。2、Full-wayrectificat

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。