資源描述:
《基于GMMUBMSVM的哈薩克語話者識別技術研究》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。
1、廈門大學碩士學位論文基于GMM--UBM/SVM的哈薩克語話者識別技術研究姓名:張奔申請學位級別:碩士專業(yè):軟件工程指導教師:曾文華201204摘要當前對話者識別技術的研究已經(jīng)成為一個比較熱門的話題,而以哈薩克語作為研討對象還處于起步階段。隨著社會的發(fā)展,電話和手機的普及,電話語音在日常生活中占有一定的地位,新疆作為一個多民族的地區(qū),由于哈薩克語語音的特性,與漢語之間的語言差異很大,因此,研究哈薩克語說話人識別技術是新疆經(jīng)濟發(fā)展的一個緊迫任務。另外,它的研究還將促進其他相似語言體系的語音研究工作,如維吾爾語、柯爾克孜語以及阿拉伯語等。因此開發(fā)以哈薩克語作為
2、研討對象的技術具有很大的應用價值和實際意義。本文結(jié)合哈薩克語的發(fā)音特點規(guī)律,為實現(xiàn)一個面向?qū)嶋H應用話者識別系統(tǒng),主要做以下工作:(1)根據(jù)哈薩克語語音庫的設計規(guī)范,建立了50人的哈薩克電話自由會話語音庫。(2)針對在大樣本情況下僅采用聲道倒譜特征參數(shù)時的支持向量機(SvM)話者模型訓練效率低,本文提出了一種結(jié)合統(tǒng)計特征參數(shù)的GMM-UBM(混合高斯模型一統(tǒng)一背景模型)話者模型,由目標說話人和背景說話人的混合高斯模型提取的話者統(tǒng)計模型訓練建立SVM話者模型。有效的解決了SVM訓練時的大樣本問題。(3)研究討論了語音信號中所攜帶的激勵特征及其動態(tài)參數(shù)對話者識別
3、性能的影響,提出了一種以激勵源信息作為輔助系統(tǒng)的主從系統(tǒng)策略,主系統(tǒng)采用GMM-UBM模型,輔助系統(tǒng)為SVM模型,進一步提高了系統(tǒng)的識別率。(4)在嵌入式Linux下利用Perl語言及C語言編寫了以哈薩克語作為研討對象的話者識別系統(tǒng)。(5)基于GMM_UBM/SⅧ的方法在50個目標人訓練集時,在目標人測試數(shù)據(jù)在20秒左右時,該提案方法G刪一UBM/SvM的識別精度達到94%。關鍵詞:說話人識別;哈薩克語;GMM-UBM;SVMAbstractInrecentyears,thestudytothespeakerrecognitiontechnologyhas
4、becomeahottopicathomeandabroad,whilethespeakerrecognitionsystemofkazakhhasbeeninitial.W池thepopularityoftelephoneandmobilephone,telephonevoiceplaysanimportantroleindailylife,andtheuseoftelephonevoiceforspeakerrecognitionhasbeenconvenient,Therefore,ithasgreatvalueandpracticalsignifi
5、cancetobulidthespeakerrecognitionsystemofkazakh.Inthispaper,wecombinesthecharacteristicsandrulesofkazaidapronunciationtoachieveapracticalapplication-orientedspeakerrecognitionsystem,mainlytodothefollowingwork:(1)Accordingtothedesignrulerofkazakhspeechdatabase,weestablished50phonef
6、reeconversationspeechdatabaseofkazakh.(2)Forthecaseofusingonlychannelcepstrumparametersofsupportvectormachine(SVM)speakermodeltrainingandlowefficiencyinlargesamples,thispaperproposesacombinationofstatisticalparametersoftheGMM-UBMspeakermodel,theTargetspeakerandthebackgroundspeaker
7、'sGaussianmixturemodel(GMM)wereextracted,thenbuildstatisticalmodelsandtrainSVMspeakermodel.ItisveryeffectivetosolvetheproblemofthelargesamplefortheSVMtraining.(3)Weresearchedanddiscussedtheinflunessoftheincentivecharacteristicsandthedynamicparameterscarriedbythespeechsignaltohowto
8、recognitionperformance,introduced