基于fmfcc和hmm的說話人識別

基于fmfcc和hmm的說話人識別

ID:33925815

大小:269.23 KB

頁數(shù):4頁

時(shí)間:2019-02-28

基于fmfcc和hmm的說話人識別_第1頁
基于fmfcc和hmm的說話人識別_第2頁
基于fmfcc和hmm的說話人識別_第3頁
基于fmfcc和hmm的說話人識別_第4頁
資源描述:

《基于fmfcc和hmm的說話人識別》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、第27卷第5期計(jì)算機(jī)仿真2010年5月文章編號:1006—9348(2010)05-0352—03基于FMFCC和HMM的說話人識別張永亮,張先庭,魯宇明(1.南昌航空大學(xué)電子信息工程學(xué)院,江西南昌330063;2.南京航空航天大學(xué)自動化學(xué)院,江蘇南京210016)摘要:美爾頻率倒譜系數(shù)(MFCC)是說話人識別中常用的特征參數(shù),而語音信號是非平穩(wěn)信號,MFCC并不能很好的反映語音的時(shí)頻特性。針對這一缺陷,為了提高說話人的識別率,結(jié)合新的時(shí)頻分析工具分?jǐn)?shù)傅立葉變換(FRF1.)。將MFCC推廣到分?jǐn)?shù)形式,得到分?jǐn)?shù)美爾頻率倒譜系數(shù)(

2、FMFCC),用以表征語音信號的特征;并利用可分性測度驗(yàn)證了特征參數(shù)的有效性;通過建立20個(gè)不同說話人的FMFCC特征庫,采用隱馬爾可夫模型(HMM)對說話人進(jìn)行仿真識別。仿真結(jié)果表明,在合適的變換階次下,說話人的平均識別率可達(dá)93%以上。關(guān)鍵詞:分?jǐn)?shù)傅立葉變換;頻率倒譜系數(shù);隱馬爾可夫模型中闊分類號:TIY391.4文獻(xiàn)標(biāo)識碼:BSpeakerRecognitionBasedonFM[Ii’CCandHMMZHANGYong—liang,ZHANGXian—ting,LUYu—ming(1.CollegeofElectroni

3、csandInformationEngineering,NanChangHangKongUniversity,NanehangJiangxi330063,China;2.CollegeofAutomationEngineering,NanJingUniversityofAeronauticsandAstronautics,NanjingJiangsu210016,China)ABSTRACT:Melfrequencycepstralcoeficient(MFCC)isafrequently—usedcharacteristici

4、nspeakerrecogniton.Inevidence,speecharenon—stationarysignals,thetime—frequencycharacteristicofspeechisnotclearlyexpressedthr0ughMFCC.Thus,inthecalculationofMFCCparameter,fractionalFouriertransform(FRn’)isadoptedtore—placediscreteFouriertransform.ThenfractionalMelfreq

5、uencycepstralcoeficient(FMFCC)isacquired,andtheeffectivityoftheparameterisverified.Finally,theHiddenMarkovModel(HMM)of20diferentspeakersisestab—lished,andspeakeridentificationisperformed.Thesimulationshowsthatindifferenttransformorders,theaverageofrightspeakerrecogni

6、tionrateisupto93%.KEYWORDS:FractionalFouriertransform;Frequencycepstralcoeficient;HiddenMarkovmodel1引言仿,它具有較好的區(qū)分能力,并且計(jì)算簡便,是目前使用最為說話人識別是一項(xiàng)根據(jù)語音波形中反映說話人生理、心廣泛的語音特征之一。但是,MFCC特征的獲取是基于傳統(tǒng)理和行為特征的語音參數(shù),自動識別說話人身份的生物認(rèn)證的傅立葉變換(FT)。FI"最適宜處理的是頻率不隨時(shí)間變化技術(shù)”J。與其它生物識別技術(shù)(諸如人臉、指紋、血液、的平穩(wěn)信號,

7、而語音信號是一種非平穩(wěn)的時(shí)變信號,因此,標(biāo)DNA、虹膜、視網(wǎng)膜等)相比,說話人識別所采用的語音信號準(zhǔn)Fr并不能完全刻畫語音信號的特征。FRFY是傳統(tǒng)Fr在具有不會遺失、無需記憶和使用方便等優(yōu)點(diǎn),在生物識別技分?jǐn)?shù)階次上的推廣,其變換譜包含空域和頻域的雙域信息,術(shù)領(lǐng)域中,說話人識別技術(shù)以其獨(dú)特的方便性和經(jīng)濟(jì)性等優(yōu)作為一種有效的時(shí)頻分析工具,目前已經(jīng)被廣泛地應(yīng)用于信勢,日益成為一種重要的安全驗(yàn)證方式。個(gè)人特征的提取和息安全、模式識別、光學(xué)系統(tǒng)分析J、量子理論等領(lǐng)識別模型的建立是說話人識別的兩個(gè)關(guān)鍵技術(shù),其中尤以個(gè)域。本文利用FReT的

8、時(shí)頻特性,在計(jì)算MFCC特征參數(shù)時(shí),人特征的提取最為關(guān)鍵,特征提取是說話人識別算法的重用FRFY替換Fr,將MFCC特征參數(shù)推廣到分?jǐn)?shù)形式,得到點(diǎn),也是難點(diǎn)。在說話人識別中,常用的特征參數(shù)有基音周分?jǐn)?shù)美爾頻率倒譜系數(shù)(FMFCC),通過數(shù)值實(shí)驗(yàn)驗(yàn)證了其有期、共振

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時(shí)可能會顯示錯(cuò)亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。