資源描述:
《噪聲環(huán)境下的語音激活檢測算法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、分類號TN912.3密級公開UDC004.93學(xué)位論文編號D-10617-308-(2016)-01009重慶郵電大學(xué)碩士學(xué)位論文中文題目噪聲環(huán)境下的語音激活檢測算法研究英文題目ResearchonVoiceActivityDetectionAlgorithminNoiseEnvironment學(xué)號S130101009姓名陳丁當(dāng)學(xué)位類別工學(xué)碩士學(xué)科專業(yè)信息與通信工程指導(dǎo)教師李強副教授完成日期2016年6月8日獨創(chuàng)性聲明本人巿明所呈巧的學(xué)拉論文是本人在導(dǎo)師指導(dǎo)下遜巧的研巧工作及巧語的研巧成果。盡我巧知,除了文中時別加標(biāo)注和致謝的地方外,論文中不包當(dāng)?shù)厝耍崳娂呵砂l(fā)
2、榮或巧寫社的巧究成泉I也不恒含為設(shè)得巧巧郵電大學(xué)或其他單化的學(xué)枯或證書而佛用過的材抖一。與戰(zhàn)同工作的人巧巧本立研巧破出的貢獻巧d在1論文||作7明飾的說明并被謝窟。作者澀名:円期:年月曰了考6?南、學(xué)位論文版權(quán)使用授權(quán)書本人完全7解重巧郵電大學(xué)有權(quán)保留,偵用學(xué)位論文紙質(zhì)版和電子版的規(guī)定I即學(xué)校有權(quán)向固塞有關(guān)部口或機拘遇莖也文,允許論文被查騎巧惜瞬等。本人授巧車巧M制丈學(xué)可試公布本學(xué)位祀文的令部或部分巧巧I可編入有共數(shù)強庫或信息系統(tǒng)進斤檢索、分巧或評機,可凹采用影巧、縮印、后抽或拷巧尊巧制于-段保巧、匯編本學(xué)化化文。(注:煤密
3、的學(xué)化論文在辭密后適怖本授巧巧。)作者簽名:恥了考導(dǎo)師袋名=曰期:年^巧》曰曰期;年石月S曰糾已〇2〇山?重慶郵電大學(xué)碩士學(xué)位論文摘要摘要變速率語音編碼技術(shù)在陸地蜂窩移動通信、衛(wèi)星移動通信、VoIP等數(shù)字通信系統(tǒng)中有著廣泛的應(yīng)用前景,而語音激活檢測(VoiceActivityDetection,VAD)算法是實現(xiàn)變速率語音編碼的關(guān)鍵技術(shù)之一。采用VAD算法實現(xiàn)的變速率聲碼器能在合成語音質(zhì)量和帶寬資源之間取得靈活的折衷,因此,研究出穩(wěn)健、可靠的VAD算法,尤其是在噪聲環(huán)境下,對變速率語音編碼技術(shù)的發(fā)展具有重要的意義。目前,語音激活檢測方面已有不少的
4、研究成果,其中,基于隱馬爾科夫模型(HiddenMarkovModel,HMM)的VAD算法能夠較好地區(qū)分話音信號和背景噪聲信號,是目前數(shù)字語音信號處理重點研究課題。本文從課題的研究背景與現(xiàn)狀入手,簡要闡述了VAD算法的基本原理和噪聲特性,介紹了自適應(yīng)多速率編碼(AdaptiveMulti-Rate,AMR)標(biāo)準(zhǔn)中和G.729B編碼標(biāo)準(zhǔn)中的VAD算法的實現(xiàn)過程,并分析其優(yōu)缺點。然后重點研究了基于HMM模型的VAD算法并進行改進。最后將其應(yīng)用到了低速率聲碼器中,實現(xiàn)了一種可變速率的聲碼器。具體工作如下:1.為了改善現(xiàn)有基于HMM模型VAD算法對噪聲的跟蹤性能,本文采用B
5、aum-Welch算法對具有不同特性的噪聲進行訓(xùn)練,并生成相應(yīng)的噪聲模型,建立了噪聲模型庫。在檢測時,根據(jù)待測語音背景噪聲的不同,動態(tài)地匹配噪聲庫中的噪聲模型。同時,本文對閾值計算方法進行改進,提高算法判決準(zhǔn)確率。實驗結(jié)果表明,本文算法具有較高的檢測準(zhǔn)確率及較好的噪聲跟蹤能力。2.將改進后的VAD算法通過非連續(xù)傳輸技術(shù)應(yīng)用到4kb/s混合激勵線性預(yù)測(MixedExcitationLinearPrediction,MELP)聲碼器中。編碼器端對VAD判決出的話音幀采用全速率編碼,而對判決出的背景噪聲幀采用較低速率編碼或者不編碼,從而實現(xiàn)了一種可變速率聲碼器。性能測試結(jié)
6、果表明,本文實現(xiàn)的可變速率聲碼器在保證合成語音語音質(zhì)量情況下,平均編碼速率大幅度降低,說明了本文VAD算法在實時語音中具有良好的實用性。關(guān)鍵詞:變速率語音編碼,MELP,VAD,HMMI重慶郵電大學(xué)碩士學(xué)位論文AbstractAbstractVariableratespeechcodingtechnologieshavebeenwidelyusedintheterrestrialcellularmobilecommunication,satellitemobilecommunication,VoIPandotherdigitalcommunicationsystems
7、.VoiceActivityDetection(VAD)algorithmisoneofthecriticaltechnologiestorealizethevariableratespeechcoding.VariableratespeechvocodercanuseVADalgorithmtogetflexiblecompromisebetweenspeechqualityandbandwidth.Therefore,researchonrobustandreliableVADalgorithmhasgreatsignificanceinvari