資源描述:
《清華大學(xué)論文》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、國(guó)立清華大學(xué)碩士論文題目:應(yīng)用於哼唱式檢索之連續(xù)性隱藏式馬可夫模型及其強(qiáng)化方法ContinuousHMManditsenhancementforsinging/Hummingqueryretrieval系別資訊工程學(xué)系組別學(xué)號(hào)姓名924304許肇凌(Chao-LingHsu)指導(dǎo)教授張智星博士(Jyh-ShingRogerJang)中華民國(guó)九十四年六月摘要在過(guò)去數(shù)十年間,隱藏式馬可夫模型(HiddenMarkovModels,HMM)已經(jīng)被成功的應(yīng)用於語(yǔ)音辨識(shí)方面的各種研究。然而,將連續(xù)性隱藏式馬可夫模型(ContinuousHMM,CHMM)應(yīng)用於聲音輸入的
2、旋律辨識(shí)(MelodyRecognitionviaAcousticInput,MRAI咸是稱(chēng)作哼唱式檢索的研究卻相當(dāng)少見(jiàn),一部分的原因可能是基於語(yǔ)音和哼唱的聽(tīng)覺(jué)特徵的不同。這篇論文將會(huì)探討對(duì)於以音框(frame)為基礎(chǔ)之哼唱式檢索的連續(xù)性隱藏式馬可夫模型訓(xùn)練的方法,並更進(jìn)一步地說(shuō)明其加強(qiáng)連續(xù)性隱藏式馬可夫模型的方式,再以實(shí)驗(yàn)方式與動(dòng)態(tài)時(shí)間伸縮(DynamicTimewarping,DTW)比較其效率及正確率。AbstractTheuseofHMM(HiddenMarkovModels)forspeechrecognitionhasbeensuccessfulf
3、orvariousapplicationsinthepastdecades-However,theuseofcontinuousHMM(CHMM)formelodyrecognitionofacousticinput(MRAIforshort),ortheso-calledquerybysinging/humming,hasseldombeenreported,partlyduetothedifferenceinacousticcharacteristicsbetweenspeechandsinging/humminginputs.Thispaperwilld
4、erivetheformulaofCHMMtrainingforframe-basedMRAC.Inparticular,weshallproposeenhancementtoCHMManddemonstratethatwiththeenhancementscheme,CHMMcancomparefavourablywithDTWinbothefficiencyandeffectiveness.目錄第1章序論61.1簡(jiǎn)介61.2哼唱式音樂(lè)檢索相關(guān)研究71.2.1利用音符距離檢索71.2.2動(dòng)態(tài)時(shí)間伸縮71.2.3藏式馬可夫模型124三種方法的比較1.3本論文主
5、要成果91.4章節(jié)概要第2章使用於哼唱式檢索的連續(xù)性隱藏式馬可夫筷型122.1連續(xù)性隱藏式馬可夫模型結(jié)構(gòu)112.2連續(xù)性隱藏式馬可夫模型估算142.3連續(xù)性隱藏式馬可夫模型訓(xùn)練15231以樂(lè)譜為基礎(chǔ)的訓(xùn)練152.3.2以語(yǔ)料為基礎(chǔ)的訓(xùn)練16第3章其他哼唱式查詢的方法213.1線性縮放203.2動(dòng)態(tài)時(shí)間伸縮21第4章其他哼唱式查詢相關(guān)議題244.1音咼追蹤234.2音調(diào)轉(zhuǎn)換234.3休止符的處理264.4狀態(tài)轉(zhuǎn)移機(jī)率值的權(quán)重係數(shù)27第5章實(shí)驗(yàn)結(jié)果28歌曲資料庫(kù)以及歌聲語(yǔ)料275.2連續(xù)性隱藏式馬可夫模型及其加強(qiáng)方法285.3休止符的處理以及狀態(tài)轉(zhuǎn)移機(jī)率權(quán)重的調(diào)整
6、305.4資料庫(kù)的大小對(duì)於辨識(shí)率的影響313433第6章結(jié)論及未來(lái)工作參考文獻(xiàn)圖表目錄圖1?「十個(gè)印地安人」的連續(xù)性隱藏式馬可夫模型圖2.狀態(tài)轉(zhuǎn)移機(jī)率限制示意圖14圖3.—個(gè)典型的模型估算例子,此歌曲為十個(gè)印地安人。(a)原始的觀測(cè)音高(實(shí)線)和其算出的相對(duì)應(yīng)標(biāo)準(zhǔn)音高(虛線)。(b)HMM表格以3D表面方式表??????????1圖4?一個(gè)典型的線性縮放例子。輸入音高線性縮放了5次,而最佳的長(zhǎng)度為原輸入音咼的1.5倍長(zhǎng)時(shí)????????<21????????圖5.—個(gè)典型的音高平移範(fàn)例,只畫(huà)出兩個(gè)重複過(guò)程圖6.資料庫(kù)中每一首歌曲所包含的錄音資料個(gè)數(shù)28圖7.(
7、a)—個(gè)典型連續(xù)性隱藏式馬可夫模型對(duì)應(yīng)的音高(虛線)沒(méi)有產(chǎn)生辨識(shí)正確的結(jié)果。(b)用了線性縮放後,對(duì)應(yīng)音高(虛線)變得合理且辨識(shí)結(jié)果也正確30圖&各種方法的第一名的辨識(shí)率及其平均計(jì)算時(shí)間31圖9.對(duì)於不同設(shè)定值的LS+HMM2第一名辨識(shí)率32圖10.各種方法在不同資料庫(kù)大小時(shí)第一名的辨識(shí)率。(CHMM1是CHMM使用樂(lè)譜訓(xùn)練,CHMM2是CHMM使用歌聲語(yǔ)料訓(xùn)練,DTW:動(dòng)態(tài)時(shí)間伸縮,33LS:線性縮放)第1章序論1.1簡(jiǎn)介眾所皆知隱藏式馬可夫模型(HMM)過(guò)去數(shù)十年來(lái)在語(yǔ)音辨識(shí)方面的研究及實(shí)際開(kāi)發(fā)上相當(dāng)成功,幾乎已經(jīng)成為了一種標(biāo)準(zhǔn)作業(yè)。尤其是連續(xù)性隱藏式馬可
8、夫模型,非常成功地被實(shí)際應(yīng)用於大詞彙語(yǔ)