資源描述:
《基于matlab的譜相減語(yǔ)音增強(qiáng)算法的設(shè)計(jì)與實(shí)現(xiàn)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、http://www.paper.edu.cn基于MATLAB的譜相減語(yǔ)音增強(qiáng)算法的設(shè)計(jì)與實(shí)現(xiàn)湯維維(武漢理工大學(xué),信息工程學(xué)院,湖北武漢430070)摘要:譜減法是消除噪聲的經(jīng)典算法,它是處理寬帶噪聲的最通用技術(shù),即從帶噪語(yǔ)音估值中減去噪聲頻譜估值,而得到純凈語(yǔ)音的頻譜。本文基于MATLAB對(duì)譜減法算法進(jìn)行設(shè)計(jì)和實(shí)現(xiàn),并對(duì)傳統(tǒng)譜減法和改進(jìn)形式的譜減法進(jìn)行比較。仿真表明,改進(jìn)形式的譜減法可以有效地降低背景噪聲,提高信噪比。關(guān)鍵詞:語(yǔ)音增強(qiáng);傳統(tǒng)譜減法;改進(jìn)形式的譜減法;MATLAB聲。它的來(lái)源很多,包括風(fēng)、呼吸噪聲和1引言一般隨機(jī)噪聲源。量化噪聲通
2、常作為白噪人們?cè)谡Z(yǔ)音通信過(guò)程中不可避免地會(huì)聲來(lái)處理,也可以視為寬帶噪聲。由于寬受到來(lái)自周圍環(huán)境、傳輸媒介引入的噪聲、帶噪聲與語(yǔ)音信號(hào)在時(shí)域和頻域上完全重通信設(shè)備內(nèi)部電噪聲、乃至其它講話者的干疊,因而消除它最為困難。由于人耳對(duì)語(yǔ)擾。這些干擾最終將使接收者接收到的語(yǔ)音音頻譜分量的相位不敏感,所以譜減法主[1]已非純凈的原始語(yǔ)音信號(hào),而是受噪聲污染要針對(duì)短時(shí)幅度譜。的帶噪語(yǔ)音信號(hào)。MATLAB是一種既可交互使用又能語(yǔ)音增強(qiáng)是解決噪聲污染的一種有效解釋執(zhí)行的計(jì)算機(jī)編程語(yǔ)言,是解決工程方法,它的一個(gè)主要目標(biāo)是從帶噪語(yǔ)音信號(hào)技術(shù)問(wèn)題的計(jì)算平臺(tái)。通過(guò)MATLAB
3、編中提取盡可能純凈的原始語(yǔ)音。語(yǔ)音增強(qiáng)目程執(zhí)行譜減法算法進(jìn)行仿真,我們可以直前已發(fā)展成為語(yǔ)音信號(hào)數(shù)字處理的一個(gè)重觀地看到算法思想以及算法的執(zhí)行效果,要分支。它的應(yīng)用范圍是降低聽(tīng)覺(jué)噪聲、識(shí)有利于進(jìn)一步工程的開(kāi)展。別系統(tǒng)的預(yù)處理和線性預(yù)測(cè)編碼的預(yù)處理。2語(yǔ)音增強(qiáng)算法這種技術(shù)對(duì)語(yǔ)音識(shí)別和說(shuō)話人識(shí)別是十分重要的,可使識(shí)別裝置在通常環(huán)境中的含噪2.1傳統(tǒng)譜減法語(yǔ)音下進(jìn)行工作。然而,由于干擾通常都是假定語(yǔ)音為平穩(wěn)信號(hào),而噪聲和語(yǔ)音為隨機(jī)的,從帶噪語(yǔ)音中提取完全純凈的語(yǔ)音加性信號(hào)且彼此不相關(guān)。此時(shí)帶噪語(yǔ)音信號(hào)幾乎不可能。在這種情況下,語(yǔ)音增強(qiáng)的目可表示為的主要有
4、兩個(gè):一是改進(jìn)語(yǔ)音質(zhì)量,消除背()()()yn=+sndn01≤≤nN?(1)景噪聲,使聽(tīng)者樂(lè)于接受,不感覺(jué)疲勞,這式中,sn()為純凈語(yǔ)音信號(hào),dn()為平穩(wěn)是一種主觀度量;二是提高語(yǔ)音可懂度,這加性高斯噪聲。實(shí)際上,為避免分幀時(shí)的截是一種客觀度量。這兩個(gè)目的往往不能兼得。斷效應(yīng),應(yīng)對(duì)yn()加窗。為了書寫方便,語(yǔ)音增強(qiáng)不但與語(yǔ)音信號(hào)數(shù)字處理理這里用yn()代表加窗后的帶噪信號(hào)。設(shè)論有關(guān),而且涉及到人的聽(tīng)覺(jué)感知和語(yǔ)音yn()的傅里葉系數(shù)為YY=expjθ,kkk學(xué)。再則,噪聲來(lái)源眾多,隨應(yīng)用場(chǎng)合而異,它們的特性也各不相同,因此針對(duì)不sn()的傅里
5、葉系數(shù)為SSkk=expjαk,同的噪聲,我們將采取不同的語(yǔ)音增強(qiáng)對(duì)dn()的傅里葉系數(shù)為Nk,由(1)式,則有策。語(yǔ)音增強(qiáng)中的譜減法是處理寬帶噪聲YS=+N。而語(yǔ)音增強(qiáng)的任務(wù)就是利用kkk的最通用技術(shù),即從帶噪語(yǔ)音估值中減去已知的噪聲功率譜信息,從Y中估計(jì)出S。kk噪聲頻譜估值,而得到純凈語(yǔ)音的頻譜。由于人耳對(duì)相位不敏感,所以只要估計(jì)出寬帶噪聲通??梢约俣楦咚乖肼暫桶自隨,然后借用帶噪語(yǔ)音相位,進(jìn)行反傅里k-1-http://www.paper.edu.cn葉變換后就可得到增強(qiáng)的語(yǔ)音。2γkk=Y/λ(k),則式(5)可以改寫為yn()經(jīng)FFT
6、后,有YSkk=+Nk,由此1/2Gk=?(11/γk)(7)可得222**由式(7)可以清楚地看出譜相減的物Y=+SN+SN+SN(2)kkkkkkk理意義:它相當(dāng)于對(duì)帶噪語(yǔ)音的每一個(gè)頻譜式中,*表示復(fù)共軛。因?yàn)榧俣ㄔ肼暈椴幌喾至砍艘砸粋€(gè)系數(shù)G。當(dāng)信噪比高時(shí),含k關(guān)的,即sn()與dn()獨(dú)立,不會(huì)出現(xiàn)信號(hào)語(yǔ)音的可能性很大,衰減小。反之,則認(rèn)為和噪聲的乘積項(xiàng),則互譜的統(tǒng)計(jì)均值為0。含有語(yǔ)音的可能性小,衰減則增大。而N為零均值的高斯分布,所以有k2.2改進(jìn)的譜減法222EY??=+E?S?E?N?(3)??kk???k?式(5)中的λ(k)是以無(wú)聲
7、期間的統(tǒng)22只要從Y中減去N便可恢復(fù)計(jì)平均的噪聲方差代替當(dāng)前分析幀的噪聲kk頻譜,而實(shí)際上噪聲頻譜服從高斯分布2S。之所以能這樣是基于人耳對(duì)語(yǔ)音相位k1??()xm2/2σ2px()=e(8)不敏感(相聾)這一特點(diǎn)。因?yàn)樵肼暿蔷植?πσ平穩(wěn)的,故可以認(rèn)為語(yǔ)音前的噪聲與發(fā)語(yǔ)音其中,m為x的均值,σ為標(biāo)準(zhǔn)偏差。噪聲的期間的噪聲功率譜相同,因而可以利用發(fā)語(yǔ)幀功率譜隨機(jī)變化范圍很寬,在頻域中的最音前(或后)的“寂靜幀”來(lái)估計(jì)噪聲。對(duì)大、最小值之比往往達(dá)到幾個(gè)數(shù)量級(jí),而最于一個(gè)分析幀內(nèi)的短時(shí)平穩(wěn)過(guò)程,有大值與均值之比也達(dá)6~8倍。因而,在減去22YSkk=+
8、λ(k)(4)噪聲譜后,會(huì)有些較大的功率譜分量的剩余2部分,在頻譜上呈現(xiàn)出隨機(jī)出現(xiàn)的尖峰,在其中,λ(k)為無(wú)語(yǔ)音時(shí)N的統(tǒng)