資源描述:
《基于稀疏表示的魯棒性說話人識別技術(shù)研究.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、10巧3單位代碼:密級:公開碩去緣像哈乂J論文題目:基于稀疏表示的魯椿性說話人識別技術(shù)研究-"-;片:.:起'?■?'■?1012010523學(xué)號j':一-馬運杰記姓名導(dǎo)師楊震教授芒苗'-.?.■■1學(xué)科專業(yè)信號與信息處理:早'.'...|.研究方向語音信號處理與語音通信V?:巧工學(xué)碩古.盧r申請學(xué)位類別—論文提交日期二五生吉.-三■.-..’一‘-y:.r..I','■.1,‘?一:'
2、.-?南京郵電大學(xué)學(xué)位論文原創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是我個人在導(dǎo)師指導(dǎo)下進行的研究工作及取得的研究成果。盡我所知,論文中不包含其他人已經(jīng)發(fā)表或撰寫過,除了文中特別加W標(biāo)法和致謝的地方外。的研究成果,也不包含為獲得南京郵電大學(xué)或其它教育機構(gòu)的學(xué)位或證書而使用過的材料與我一同工作的同志對本研巧所做的任何貢獻均己在論文中作了明確的說明并表示了謝意。一本人學(xué)位論文及涉及相關(guān)資料若有不實,愿意承擔(dān)切相關(guān)的法律責(zé)任。-.研究生簽名;ly日期:AI[南京郵電大學(xué)學(xué)位論文使用授權(quán)聲明本人授權(quán)南京郵電大學(xué)可W保留并向國家有關(guān)部口或機構(gòu)
3、送交論文的復(fù)印件和電子文檔;允許論文被查閱和借閱;可lil將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索;可W采用影印、縮印或掃描等復(fù)制手段保存、匯編本學(xué)位論文。本文電子文檔的內(nèi)容和紙質(zhì)一致。論文涉的內(nèi)容相論文的公布(包括刊登)授權(quán)南京郵電大學(xué)研究生院辦理。研密學(xué)位論文在解密后適用本授權(quán)書。巧生簽名:Jy支i一導(dǎo)師簽名;日期;.i.fkResearchontherobustspeakerrecognitionbasedonsparserepresentationThesisSubmittedtoNanjingUniversityofPos
4、tsandTelecommunicationsfortheDegreeofMasterofEngineeringByMaYunJieSupervisor:Prof.YangZhenMar.2015摘要經(jīng)過了幾十年的研究發(fā)展,說話人識別技術(shù)憑借其快速、簡便的優(yōu)勢,在人機接入領(lǐng)域得到了大家廣泛的關(guān)注和研究。匹配模型是說話人識別研究中的關(guān)鍵技術(shù),模型性能的優(yōu)劣對識別系統(tǒng)識別率的影響重大。信號的稀疏表示技術(shù)近幾年被廣泛應(yīng)用于說話人識別之中,它與高斯混合模型相結(jié)合,顯著提高了識別系統(tǒng)的準(zhǔn)確率。目前,說話人識別研究的主要方向是進一步提高系統(tǒng)的魯棒性,具體表現(xiàn)為解決信道失配問題和環(huán)
5、境噪聲問題;另一方面,在智能終端廣泛普及情況下,借助智能終端進行快速準(zhǔn)確的身份識別,需要進一步解決系統(tǒng)復(fù)雜性問題。本文主要對基于稀疏表示的魯棒性說話人識別技術(shù)進行了深入研究,在此基礎(chǔ)上,本文主要工作和創(chuàng)新如下:(1)在訓(xùn)練基于高斯混合模型均值超向量的稀疏表示字典時,需要大量的訓(xùn)練語音以達到字典冗余的條件,本文提出使用高斯混合模型均值矩陣代替均值超向量進行字典訓(xùn)練來解決這個問題,同時,每個說話人即可形成一個冗余字典進行說話人識別,識別時的計算量也得到了降低。(2)對比了樣本字典和學(xué)習(xí)字典這兩種字典在干凈語音環(huán)境與有噪語音環(huán)境下的性能,發(fā)現(xiàn)學(xué)習(xí)字典的抗噪能力要弱于樣本字典
6、,并且提出在訓(xùn)練語音中加入噪聲以減小識別環(huán)境和訓(xùn)練環(huán)境的差異,從而提高識別率。(3)針對識別時的環(huán)境噪聲問題,提出一種適用于稀疏表示說話人識別的全局補償方法。該方法對不同階特征參數(shù)進行逐一分析,目的是為了找出被噪聲影響最嚴(yán)重的一階參數(shù)并去除之,以此增強測試語音與訓(xùn)練語音之間的相關(guān)性,提高了識別系統(tǒng)適應(yīng)不同噪聲環(huán)境的魯棒性。仿真實驗結(jié)果表明本文方法明顯加強了說話人識別系統(tǒng)的抗噪能力,在背景噪聲為白噪聲,信噪比為15dB的情況下,識別率可達到96%,與無噪環(huán)境下的識別率相差無幾。關(guān)鍵詞:說話人識別,稀疏表示,魯棒性,全局補償,超向量IAbstractAfterdecade
7、sofresearchanddevelopment,speakerrecognitiontechnologyhasgotwideattentioninbecauseofitsunionadvantages.Intheresearchofspeakerrecognition,modelisoneofkeytechnologiesandhasagreatinfluenceontheperformanceofthesystem.Thetheoryofsparserepresentationhasbeenwidelyemployedinspeakerreco