資源描述:
《基于語音存在不確定度的碼書驅動語音增強方法研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、中文圖書分類號:TN912.3密級:公開UDC:38學校代碼:10005碩士學位論文MASTERALDISSERTATION論文題目:基于語音存在不確定度的碼書驅動語音增強方法研究論文作者:王清學科:信息與通信工程指導教師:鮑長春論文提交日期:2016年4月UDC:38學校代碼:10005分類號:TN912.3學號:S201302068密級:公開北京工業(yè)大學工學碩士學位論文題目:基于語音存在不確定度的碼書驅動語音增強方法研究英文題目:CODEBOOK-BASEDSPEECHENHANCEMENTUSINGSPEE
2、CHPRESENCEUNCERTAINTY論文作者:王清學科專業(yè):信息與通信工程研究方向:語音增強申請學位:工學碩士指導教師:鮑長春教授所在單位:電子信息與控制工程學院答辯日期:2016年6月授予學位單位:北京工業(yè)大學獨創(chuàng)性聲明本人聲明所呈交的論文是我個人在導師指導下進行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標注和致謝的地方外,論文中不包含其他人已經發(fā)表或撰寫過的研究成果,也不包含為獲得北京工業(yè)大學或其它教育機構的學位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻均已在論文中作了明
3、確的說明并表示了謝意。簽名:王清日期:2016年04月05日關于論文使用授權的說明本人完全了解北京工業(yè)大學有關保留、使用學位論文的規(guī)定,即:學校有權保留送交論文的復印件,允許論文被查閱和借閱;學??梢怨颊撐牡娜炕虿糠謨热荩梢圆捎糜坝?、縮印或其他復制手段保存論文。(保密的論文在解密后應遵守此規(guī)定)簽名:王清導師簽名:鮑長春日期:2016年04月05日本論文的研究工作得到了國家自然科學基金(61471014)摘要摘要經過40多年的發(fā)展,研究者們提出了許多語音增強算法,如譜減算法、維納濾波算法和基于統(tǒng)計模型的算法
4、。這些算法在平穩(wěn)噪聲環(huán)境下能取得較好的增強效果,而在處理非平穩(wěn)噪聲時,其算法性能下降嚴重。碼書驅動算法克服了上述算法的局限性,即使在非平穩(wěn)噪聲環(huán)境下仍然能獲得較好的增強效果。碼書驅動算法將語音和噪聲的自回歸(Auto-Regressive,AR)系數作為先驗信息進行線下訓練存儲在碼書中,并在線上通過對數譜失真準則估計各自對應的AR增益,所獲得的AR參數用于構建維納濾波器,從而增強帶噪語音信號。但是碼書驅動算法仍然存在三方面不足:一是碼書驅動算法的AR參數估計不準確,導致在靜音段仍然殘留大量背景噪聲;二是該算法只考
5、慮提高語音的幅度譜估計性能,卻忽略了語音的相位譜估計;三是傳統(tǒng)先驗碼書只對語音和噪聲的譜包絡建模,而沒有對其譜細節(jié)進行建模,這造成增強語音的諧波間仍然殘留大量的背景噪聲。針對上述三點不足,本文提出了如下改進方法:1.針對碼書驅動算法的AR參數估計不準確問題,本文提出了一種基于語音存在不確定度的碼書驅動語音增強算法。該算法在原始Bayesian參數估計框架中考慮了兩種假設,即語音存在假設和語音不存在假設。與傳統(tǒng)方法不同,語音和噪聲的AR參數的Bayesian估計是在兩個假設條件下得到的AR參數估計的加權和,其中的加
6、權系數是線上基于幀變化的語音存在概率(speechpresenceprobability,SPP)和語音不存在概率(speechabsenceprobability,SAP)。增強語音譜仍然由重構的維納濾波器得到。由于所提算法在Bayesian框架中結合了SPP和SAP,因此能夠提高AR參數的估計精度。2.針對傳統(tǒng)碼書驅動算法忽略語音相位譜估計的問題,本文提出了一種純凈語音相位譜估計算法。該算法利用純凈語音、噪聲和含噪語音之間的向量關系得到含噪語音與純凈語音相位差的余弦表達式,進而利用反余弦函數和含噪語音的相位得
7、到純凈語音的相位估計。所估計的語音相位譜取代傳統(tǒng)含噪語音相位譜與增強語音幅度譜相結合來得到純凈語音信號,進一步提高了低信噪比下的增強語音的感知質量。3.在前述的基于語音存在不確定度的碼書驅動算法中,SPP和SAP存在估計精度不高以及無法抑制增強語音諧波間噪聲的問題,為此,本文提出了一種基于貝葉斯AR參數估計的碼書驅動語音增強算法。為了提高SPP和SAP的估計精度,該算法結合當前幀和過去幀的含噪語音信號來估計語音和噪聲的AR參數。同時,利用隱馬爾可夫模型(HiddenMarkovModel,HMM)理論來推導SPP
8、和-I-北京工業(yè)大學工學碩士學位論文SAP,并利用歸一化互相關系數對HMM中語音存在狀態(tài)和語音不存在狀態(tài)之間的轉移概率進行調整,此外,該算法將基于頻點的語音存在概率與維納濾波器相結合,有效抑制了增強語音諧波間的噪聲。實驗證明,所提算法要優(yōu)于參考算法。關鍵詞:語音增強;碼書驅動;語音存在不確定度;自回歸系數;隱馬爾可夫模型-II-AbstractAbstractThroug