資源描述:
《基于倒譜距離地語(yǔ)音端點(diǎn)檢測(cè)改進(jìn)算法.doc》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。
1、第7卷第1期2006年2月空軍工程大學(xué)學(xué)報(bào)(自然科學(xué)版)JOURNALOFAIRFORCEENGINEERINGUNIVERSITY(NATURALSCIENCEEDITION)Vol.7No.1Feb.2006基于倒譜距離的語(yǔ)音端點(diǎn)檢測(cè)改進(jìn)算法王博,郭英,李宏偉,韓立峰(空軍工程大學(xué)電訊工程學(xué)院,陜西西安710077)摘要:在討論傳統(tǒng)倒譜距離語(yǔ)音端點(diǎn)檢測(cè)算法不足的基礎(chǔ)上,提出了一種改進(jìn)方案,該方法首先估計(jì)短時(shí)信噪比,然后由統(tǒng)計(jì)方法確定短時(shí)信噪比與門(mén)限的關(guān)系,進(jìn)而完成正確的語(yǔ)音端點(diǎn)判決。通過(guò)對(duì)3種典型噪聲環(huán)境下信噪
2、比從-5dB到20dB的帶噪語(yǔ)音信號(hào)進(jìn)行的仿真實(shí)驗(yàn)結(jié)果表明,所提方法能更為準(zhǔn)確地檢測(cè)到語(yǔ)音端點(diǎn)。關(guān)鍵詞:端點(diǎn)檢測(cè);倒譜距離;判決準(zhǔn)則;語(yǔ)音增強(qiáng)中圖分類(lèi)號(hào):TN912.34文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3516(2006)01-0059-05準(zhǔn)確的語(yǔ)音信號(hào)端點(diǎn)檢測(cè)(VAD-VoiceActivityDetection)可以實(shí)現(xiàn)對(duì)噪聲譜的實(shí)時(shí)更新,從而提高譜減法語(yǔ)音增強(qiáng)系統(tǒng)的性能。傳統(tǒng)的檢測(cè)方法采用短時(shí)能量、過(guò)零率和自相關(guān)參數(shù),在高信噪比環(huán)境下可以獲得較好的檢測(cè)效果,但是在低信噪比環(huán)境下其檢測(cè)性能卻急劇下降。本文提
3、出了一種基于倒譜距離的改進(jìn)方法,通過(guò)分析信號(hào)的倒譜參數(shù)來(lái)進(jìn)行帶噪語(yǔ)音的端點(diǎn)檢測(cè)。仿真結(jié)果表明,在低信噪比環(huán)境下較之傳統(tǒng)的方法能更準(zhǔn)確地檢測(cè)出語(yǔ)音的端點(diǎn)。1基于倒譜距離的端點(diǎn)檢測(cè)算法1.1倒譜距離定義設(shè)信號(hào)s(n),其倒譜變換為c(n)。信號(hào)倒譜的一種定義是信號(hào)的能量譜密度函數(shù)s(ω)的對(duì)數(shù)的傅logS(ω)的傅里葉級(jí)數(shù)展開(kāi)[1],即里葉反變換,或者可以將信號(hào)s(n)的倒譜c(n)看成是∞π1-jnω2π∫-πc(0)=logS(ω)dωlogS(ω)=∑c(n)e,(1)n=-∞式中,c(n)為倒譜系數(shù),且c(n)
4、=c(-n)是實(shí)數(shù)。假設(shè)信號(hào)s(n)的Z變換具有有理函數(shù)的形式m1m0-1∏(1-akz)∏(1-bkz)S(z)=Ark=1k=1(2)zp1p0-1∏(1-ckz)∏(1-dkz)k=1k=1式中ak、bk、ck和dk的模都小于1,m1和m0分別表示單位圓內(nèi)和外的零點(diǎn)數(shù)目,外的極點(diǎn)數(shù)目。對(duì)logS(z)取逆Z變換得到倒譜系數(shù)的另一種表達(dá)式為p1和p0分別表示單位圓內(nèi)和log
5、A
6、n=0m1p1nanckk∑n+∑n-n>0c(n)=(3)k=1m0k=1p0-nb-ndkk∑+∑<0-nnnk=1k=1收稿日期
7、:2005-06-03式中λ是ak、bk、ck和dk模的最大值,ξ為一實(shí)常數(shù)。由式(4)可以看出,倒譜是一個(gè)快速衰減序列,其衰減速率至少為1/
8、n
9、[1],所以在誤差允許的范圍內(nèi)可以用有限階(比如p階)的倒譜系數(shù)近似無(wú)限階的倒譜系數(shù)。根據(jù)Parseval定理,對(duì)于兩個(gè)不同信號(hào)s0(n)和s1(n),其倒譜差異的均方值可用倒譜距離表示:∞πd212π∫-π=
10、22logS1(ω)-logS0(ω)
11、dω=∑(c1(n)-c0(n))(5)cepn=-∞式中dcep為倒譜距離,c0(n)和c1(n)分別是對(duì)應(yīng)于譜密度函
12、數(shù)S0(ω)和S1(ω)的倒譜系數(shù)。用數(shù)近似無(wú)限階倒譜系數(shù),式(5)可以近似為[1]pp階倒譜系22=413429(c1(n)-c0(n))+2∑(c1(n)-c0(n))(6)dcepn=1信號(hào)與其倒譜是一一對(duì)應(yīng)的變換,因此倒譜的均方距離可以反映兩個(gè)信號(hào)(比如語(yǔ)音與背景噪聲)譜的區(qū)別,倒譜距離可以作為端點(diǎn)檢測(cè)的一個(gè)判決參數(shù),屬于相似距離范疇。1.2傳統(tǒng)的倒譜距離檢測(cè)算法流程[5,7]1)預(yù)處理:對(duì)8kHz采樣信號(hào)進(jìn)行預(yù)加重處理,然后分幀加窗,幀長(zhǎng)取30ms(240個(gè)采樣點(diǎn)),幀移10ms,對(duì)每一幀信號(hào)加240點(diǎn)的
13、Hamming窗。2)估計(jì)噪聲倒譜系數(shù)和倒譜距離Dcepsil:階數(shù)p取12,首先假定抽樣信號(hào)起始10幀是背景噪聲,利用這10幀的前5幀倒譜系數(shù)的統(tǒng)計(jì)平均值作為背景噪聲倒譜系數(shù)的估計(jì)值,用向量c0表示。同時(shí)采用式(6)計(jì)算這10幀的后5幀倒譜距離平均值作為背景噪聲倒譜距離的估計(jì)值,其中c1(n)表示當(dāng)前幀的倒譜系數(shù),c0(n)為對(duì)應(yīng)于C0的倒譜系數(shù)。3)逐幀計(jì)算dcep值:逐幀計(jì)算倒譜系數(shù),然后由每幀信號(hào)的倒譜系數(shù)和噪聲倒譜系數(shù)的估計(jì)值通過(guò)式(6)計(jì)算倒譜距離。4)確定判決門(mén)限:采用類(lèi)似于短時(shí)能量檢測(cè)法所使用的動(dòng)態(tài)
14、門(mén)限判決準(zhǔn)則,設(shè)定兩個(gè)門(mén)限G1和G2Gi=dcepsilki,i=1,2(7)式中dcepsil為噪聲倒譜距離估值,k1,k2分別為兩個(gè)門(mén)限的乘系數(shù),且k2>k1,以保證G2>G1,這里取k1=110、k2=113。5)根據(jù)各幀的dcep值進(jìn)行端點(diǎn)檢測(cè):如果當(dāng)前幀的dcep值大于G1,則記錄該幀位置為start,然后繼續(xù)計(jì)算后面各幀的dcep值,若在該幀之后