資源描述:
《基于區(qū)分性說話人模型和文本無關(guān)說話人確認(rèn)的研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、UniversityofScienceandTechnologyofChinaAdissertationforMaster’SdegreeReaserchontext—-independentspeakerverificationbasedondiscriminativespeakermodelsAuthor’SName:XinFangspeciality:Supervisor:Finishedtime:CircuitsandsystemAssociateProf.LiHuiMay2硼,2013中國(guó)科學(xué)
2、技術(shù)大學(xué)學(xué)位論文原創(chuàng)性聲明本人聲明所呈交的學(xué)位論文,是本人在導(dǎo)師指導(dǎo)下進(jìn)行研究工作所取得的成果。除己特別加以標(biāo)注和致謝的地方外,論文中不包含任何他人已經(jīng)發(fā)表或撰寫過的研究成果。與我一同工作的同志對(duì)本研究所做的貢獻(xiàn)均己在論文中作了明確的說明。作者簽名:摒簽字日期:—2壘蔓出中國(guó)科學(xué)技術(shù)大學(xué)學(xué)位論文授權(quán)使用聲明作為申請(qǐng)學(xué)位的條件之一,學(xué)位論文著作權(quán)擁有者授權(quán)中國(guó)科學(xué)技術(shù)大學(xué)擁有學(xué)位論文的部分使用權(quán),即:學(xué)校有權(quán)按有關(guān)規(guī)定向國(guó)家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱,可以將學(xué)位論文編入《
3、中國(guó)學(xué)位論文全文數(shù)據(jù)庫(kù)》等有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。本人提交的電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相一致。保密的學(xué)位論文在解密后也遵守此規(guī)定??诿撮_口保密(——年)作者簽名:簽字日期:\7_二葚年一導(dǎo)師簽名:簽字目期:j泣目L畢摘要說話人確認(rèn)憑借簡(jiǎn)便的設(shè)備與非接觸式交互成為目前廣泛應(yīng)用的生物信息認(rèn)證技術(shù)之一,也是語音識(shí)別領(lǐng)域的一個(gè)非常重要的研究方向,所以,它的研究不僅具有重大的理論意義而且還有非常強(qiáng)的應(yīng)用價(jià)值。概率統(tǒng)計(jì)模型是說話人確認(rèn)的主流建模技術(shù),基于該模型的
4、說話人確認(rèn)系統(tǒng)取得了不錯(cuò)的性能,然而,這種模型并不能精確地描述說話人確認(rèn)這類二元分類問題的邊界。近年來,支持向量機(jī)以其強(qiáng)大的區(qū)分性描述能力,使得它比概率統(tǒng)計(jì)模型更好地解決了這類二元分類問題,因而被大量應(yīng)用到說話人確認(rèn)上。本文以支持向量機(jī)結(jié)合其他說話人確認(rèn)技術(shù)作為主要研究?jī)?nèi)容,并將其用于與文本無關(guān)的說話人確認(rèn)。利用因子分析和Ivector構(gòu)建了聯(lián)合說話人確認(rèn)系統(tǒng),對(duì)聯(lián)合系統(tǒng)的區(qū)分性說話人模型的訓(xùn)練矢量及測(cè)試矢量的選取、信道失配補(bǔ)償策略以及參數(shù)的選擇等關(guān)鍵問題作了詳細(xì)的研究,并對(duì)它們的性能進(jìn)行了比較。首先,
5、針對(duì)G刪-UBM—SVM系統(tǒng)在復(fù)雜語音環(huán)境下不能對(duì)語音進(jìn)行失配信道補(bǔ)償?shù)膯栴},我們運(yùn)用因子分析技術(shù)對(duì)語音特征進(jìn)行連續(xù)失配信道補(bǔ)償,使其更凸顯說話人信息,并將其與SVM相結(jié)合,構(gòu)建了FA-SVM說話人確認(rèn)系統(tǒng),并研究了失配信息子空間的大小對(duì)系統(tǒng)性能的影響,最后通過實(shí)驗(yàn)驗(yàn)證了經(jīng)過失配信道補(bǔ)償后的區(qū)分性說話人確認(rèn)系統(tǒng)性能確實(shí)有了提高。接著,針對(duì)FA-SVM系統(tǒng)存在的說話人信息損失的問題,本文研究了Ivector特征矢量,并將Ivector特征矢量與SVM相結(jié)合,構(gòu)建了Ivector—SVM說話人確認(rèn)系統(tǒng),詳細(xì)
6、討論了系統(tǒng)核函數(shù)的選取、系統(tǒng)失配信道補(bǔ)償方法以及全變量信息子空間大小對(duì)系統(tǒng)性能的影響,并通過實(shí)驗(yàn)證明Ivector—SVM區(qū)分性說話人確認(rèn)系統(tǒng)性能比FA-SVM系統(tǒng)又有了提高。最后,針對(duì)Ivector-SVM說話人確認(rèn)系統(tǒng)計(jì)算復(fù)雜度過高的問題,本文提出了一種基于選擇通用背景模型的快速Ivector—SVM說話人確認(rèn)系統(tǒng),利用TopN選擇策略,在基本保持確認(rèn)性能的基礎(chǔ)上有效地減少了計(jì)算復(fù)雜度,提高了系統(tǒng)的實(shí)用性。關(guān)鍵詞:說話人確認(rèn)支持向量機(jī)區(qū)分性模型因子分析Ivector選擇通用背景模型摘要Abstrac
7、tABSTRACTWithitsportableequipmentandnon—contactinteraction,speakerverificationbecomesoneofthewidely-usedbioinformaticsidentificationtechnologiesanditisalsoallimportantresearchdirectioninspeechsignalprocessing.Therefore,researchesonitpossessesimportantthe
8、oreticalsignificanceandpracticalvalues.Probabilitystatisticalmodelhasbeenthemostpopularmodelingtechniqueonspeakerverificationandthecorrespondingspeakerverificationsystembasedonitalwaysperformswell.However,probabilitystatis