抗噪連續(xù)語音識別的研究

抗噪連續(xù)語音識別的研究

ID:12331279

大?。?1.46 MB

頁數(shù):107頁

時(shí)間:2018-07-16

抗噪連續(xù)語音識別的研究_第1頁
抗噪連續(xù)語音識別的研究_第2頁
抗噪連續(xù)語音識別的研究_第3頁
抗噪連續(xù)語音識別的研究_第4頁
抗噪連續(xù)語音識別的研究_第5頁
資源描述:

《抗噪連續(xù)語音識別的研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、電子科技大學(xué)碩士學(xué)位論文抗噪連續(xù)語音識別的研究姓名:林劼申請學(xué)位級別:碩士專業(yè):計(jì)算機(jī)應(yīng)用技術(shù)指導(dǎo)教師:劉玓20060104摘要摘要目前的連續(xù)語音識別系統(tǒng)對純凈語音已能達(dá)到非常高的識別精度,但是無處不在的背景噪聲帶來了訓(xùn)練模型和測試語音之間的失配,這種失配使得連續(xù)語音識別系統(tǒng)的性能在噪聲環(huán)境中急劇下降。因此抗噪聲問題是語音識別的關(guān)鍵性問題。本論文首先分析并實(shí)現(xiàn)了一個(gè)以Mel頻率倒譜系數(shù)(MFCC)作為語音特征,基于隱馬爾可夫模型(HMM),針對連續(xù)數(shù)字串識別任務(wù)的基本連續(xù)語音識別系統(tǒng)。然后基于此基本連

2、續(xù)語音識別系統(tǒng)進(jìn)行了抗噪聲技術(shù)的研究。目前的抗噪聲技術(shù)主要分為四類:語音增強(qiáng)法、提取抗噪語音特征法、噪聲補(bǔ)償法、丟特征法。本論文分別對其中的語音增強(qiáng)法和基于丟特征法的條件概率聯(lián)合模型方法進(jìn)行了研究。其中通過對傳統(tǒng)Wiener?yàn)V波算法和傳統(tǒng)ANC算法的缺點(diǎn)進(jìn)行分析,提出了改進(jìn)型重復(fù)Wiener?yàn)V波算法和改進(jìn)型CTRANC算法。實(shí)驗(yàn)表明我們提出的這兩種方法相比傳統(tǒng)方法有更好的噪聲抑制效果。再者我們通過對條件概率聯(lián)合模型的優(yōu)缺點(diǎn)進(jìn)行研究后,我們提出了后驗(yàn)概率聯(lián)合模型PUM,提高了對時(shí)變噪聲的消噪效果。最終本

3、文提出了語音增強(qiáng)結(jié)合PUM模型的一種新的語音抗噪方法,弗且基于這種新方法我們從高識別率和低成本較高識別率兩方面出發(fā),構(gòu)建了改進(jìn)型CTRANC結(jié)合PUM新模型和改進(jìn)型重復(fù)Wiener?yàn)V波結(jié)合PUM新模型。這兩個(gè)新模型分別用改進(jìn)型CTRANC和改進(jìn)型重復(fù)Wiener?yàn)V波語音增強(qiáng)方法對含嗓語音中有先驗(yàn)知識的噪聲進(jìn)行濾除,較有效的消除了寬帶噪聲。從而為PUM模型提供了只有局部頻帶被噪聲污染的語音信號,彌補(bǔ)了PUM模型不適用于語音信號全頻帶被噪聲污染的情況。同時(shí)這兩個(gè)新模型利用PUM模型作為語音增強(qiáng)的后處理,有

4、效的消除了語音增強(qiáng)造成得語音失真,也正彌補(bǔ)了語音增強(qiáng)方法的缺點(diǎn)。實(shí)驗(yàn)結(jié)果表明,這兩個(gè)新模型相比其它模型在各種不同背景噪聲情況下有更好的語音識別率,其中改進(jìn)型重復(fù)Wiener?yàn)V波結(jié)合PUM新模型提高近15%的字語音識別率,改進(jìn)型CTRANC結(jié)合PUM新模型提高近30%的字語音識別率。關(guān)鍵詞:連續(xù)語音識別,抗噪語音識別,后驗(yàn)概率聯(lián)合模型,語音增強(qiáng),HMM,噪聲摘要removcsthenoisecomponentswithknownortrainablecharacteristics.Consequentl

5、y,itmaybeassumedthatintheoutputsignalfromtheenhancementstagethereareonlysomefrequencybandsremainingcorrupted,duetothelackoffullknowledgeofthenoise.Asthesecondstage,thePUMisusedtotackletheremainingunknownnan-ow-bandcorruptionbyfocusingtherecognitiononlyo

6、nthecleanfrequency。bandinformationwithintheenhancedsignal.Andweconstructedtwonewmodels:1)ImprovedIterationWienerfilter/PUMnewmodel,2)ImprovedCTRANCTPUMnewmodel.TheTIDIGITSdatabasewasusedtoevaluatetheproposedmethodsandencouragingresultsweFeobtained.There

7、sultsshowthatthenewmethodsalealleffectiveschemeresultingina25%reductioninwordserrorrateoVerconventionalmethodsinawiderangeofenvironments.Keywords:speechrecognition,robustness,noise,HMM,speechenhancement,PUM主要符q表FFTHMMDHMMCDHMMGMMsANNVQPMCMU蓋WPMJASMANC(1

8、mANCV氣DDCTPUMSTSAMFCCSNRSCRLMS主要符號表V11.快速傅立葉變換.隱式馬爾可夫模型.離散型HMM一連續(xù)型HMM.高斯混合模型.人工神經(jīng)網(wǎng)絡(luò)一矢量量化一并行模型合并.晟大似然線性回歸一加權(quán)投影.雅克比調(diào)整一統(tǒng)計(jì)匹配一自適應(yīng)噪聲消除器.抗干擾自適應(yīng)噪聲消除器.語音端點(diǎn)檢測.離散余弦變換.后驗(yàn)概率聯(lián)合模型.短時(shí)幅度譜.Mel頻率倒譜系數(shù).信噪比.信號干擾比.最小均方獨(dú)創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工’作

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會顯示錯(cuò)亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。