基于區(qū)分性說話人模型和文本無關說話人確認的研究

基于區(qū)分性說話人模型和文本無關說話人確認的研究

ID:32425790

大?。?.31 MB

頁數(shù):71頁

時間:2019-02-04

基于區(qū)分性說話人模型和文本無關說話人確認的研究_第1頁
基于區(qū)分性說話人模型和文本無關說話人確認的研究_第2頁
基于區(qū)分性說話人模型和文本無關說話人確認的研究_第3頁
基于區(qū)分性說話人模型和文本無關說話人確認的研究_第4頁
基于區(qū)分性說話人模型和文本無關說話人確認的研究_第5頁
資源描述:

《基于區(qū)分性說話人模型和文本無關說話人確認的研究》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫

1、UniversityofScienceandTechnologyofChinaAdissertationforMaster’SdegreeReaserchontext—-independentspeakerverificationbasedondiscriminativespeakermodelsAuthor’SName:XinFangspeciality:Supervisor:Finishedtime:CircuitsandsystemAssociateProf.LiHuiMay2硼,2013中國科學

2、技術大學學位論文原創(chuàng)性聲明本人聲明所呈交的學位論文,是本人在導師指導下進行研究工作所取得的成果。除己特別加以標注和致謝的地方外,論文中不包含任何他人已經(jīng)發(fā)表或撰寫過的研究成果。與我一同工作的同志對本研究所做的貢獻均己在論文中作了明確的說明。作者簽名:摒簽字日期:—2壘蔓出中國科學技術大學學位論文授權使用聲明作為申請學位的條件之一,學位論文著作權擁有者授權中國科學技術大學擁有學位論文的部分使用權,即:學校有權按有關規(guī)定向國家有關部門或機構送交論文的復印件和電子版,允許論文被查閱和借閱,可以將學位論文編入《

3、中國學位論文全文數(shù)據(jù)庫》等有關數(shù)據(jù)庫進行檢索,可以采用影印、縮印或掃描等復制手段保存、匯編學位論文。本人提交的電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相一致。保密的學位論文在解密后也遵守此規(guī)定??诿撮_口保密(——年)作者簽名:簽字日期:\7_二葚年一導師簽名:簽字目期:j泣目L畢摘要說話人確認憑借簡便的設備與非接觸式交互成為目前廣泛應用的生物信息認證技術之一,也是語音識別領域的一個非常重要的研究方向,所以,它的研究不僅具有重大的理論意義而且還有非常強的應用價值。概率統(tǒng)計模型是說話人確認的主流建模技術,基于該模型的

4、說話人確認系統(tǒng)取得了不錯的性能,然而,這種模型并不能精確地描述說話人確認這類二元分類問題的邊界。近年來,支持向量機以其強大的區(qū)分性描述能力,使得它比概率統(tǒng)計模型更好地解決了這類二元分類問題,因而被大量應用到說話人確認上。本文以支持向量機結合其他說話人確認技術作為主要研究內(nèi)容,并將其用于與文本無關的說話人確認。利用因子分析和Ivector構建了聯(lián)合說話人確認系統(tǒng),對聯(lián)合系統(tǒng)的區(qū)分性說話人模型的訓練矢量及測試矢量的選取、信道失配補償策略以及參數(shù)的選擇等關鍵問題作了詳細的研究,并對它們的性能進行了比較。首先,

5、針對G刪-UBM—SVM系統(tǒng)在復雜語音環(huán)境下不能對語音進行失配信道補償?shù)膯栴},我們運用因子分析技術對語音特征進行連續(xù)失配信道補償,使其更凸顯說話人信息,并將其與SVM相結合,構建了FA-SVM說話人確認系統(tǒng),并研究了失配信息子空間的大小對系統(tǒng)性能的影響,最后通過實驗驗證了經(jīng)過失配信道補償后的區(qū)分性說話人確認系統(tǒng)性能確實有了提高。接著,針對FA-SVM系統(tǒng)存在的說話人信息損失的問題,本文研究了Ivector特征矢量,并將Ivector特征矢量與SVM相結合,構建了Ivector—SVM說話人確認系統(tǒng),詳細

6、討論了系統(tǒng)核函數(shù)的選取、系統(tǒng)失配信道補償方法以及全變量信息子空間大小對系統(tǒng)性能的影響,并通過實驗證明Ivector—SVM區(qū)分性說話人確認系統(tǒng)性能比FA-SVM系統(tǒng)又有了提高。最后,針對Ivector-SVM說話人確認系統(tǒng)計算復雜度過高的問題,本文提出了一種基于選擇通用背景模型的快速Ivector—SVM說話人確認系統(tǒng),利用TopN選擇策略,在基本保持確認性能的基礎上有效地減少了計算復雜度,提高了系統(tǒng)的實用性。關鍵詞:說話人確認支持向量機區(qū)分性模型因子分析Ivector選擇通用背景模型摘要Abstrac

7、tABSTRACTWithitsportableequipmentandnon—contactinteraction,speakerverificationbecomesoneofthewidely-usedbioinformaticsidentificationtechnologiesanditisalsoallimportantresearchdirectioninspeechsignalprocessing.Therefore,researchesonitpossessesimportantthe

8、oreticalsignificanceandpracticalvalues.Probabilitystatisticalmodelhasbeenthemostpopularmodelingtechniqueonspeakerverificationandthecorrespondingspeakerverificationsystembasedonitalwaysperformswell.However,probabilitystatis

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。