資源描述:
《基于GMM的漢語語音轉(zhuǎn)換系統(tǒng)研究.pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、分類號密級公開編號夫擘碎士研究被營像俗式題目基于的漢語語音轉(zhuǎn)換系統(tǒng)研究學(xué)院(所、中心)信息學(xué)院專業(yè)名稱電子與通信工禾呈研究生姓名李健學(xué)號導(dǎo)師姓名楊鑒職稱教授年月論文獨(dú)創(chuàng)性聲明及使用授權(quán)本論文是作者在導(dǎo)師指導(dǎo)下取得的研究成果。除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研宄成果,不存在剽竊或抄襲行為。與作者一同工作的同志對本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說明并表示了謝意?,F(xiàn)就論文的使用對云南大學(xué)授權(quán)如下:學(xué)校有權(quán)保留本論文(含電子版),也可以采用影印、縮印或其他復(fù)制手段保存論文;學(xué)校有權(quán)公布論
2、文的全部或部分內(nèi)容,可以將論文用于查閱或借閱服務(wù);學(xué)校有權(quán)向有關(guān)機(jī)構(gòu)送交學(xué)位論文用于學(xué)術(shù)規(guī)范審查、社會(huì)監(jiān)督或評獎(jiǎng);學(xué)校有權(quán)將學(xué)位論文的全部或部分內(nèi)容錄入有關(guān)數(shù)據(jù)庫用于檢索服務(wù)。內(nèi)部或保密的論文在解密后應(yīng)遵循此規(guī)定)研究生簽名:導(dǎo)師簽名:期:摘要摘要語音轉(zhuǎn)換的目的就是在保持源說話人語音語義不變的情況下,使之具有目標(biāo)說話人的語音個(gè)性特征。是一套在環(huán)境下用語言編譯運(yùn)行的用于語音信號處理的工具包,包含了諸如分析、分析、分析、矢量量化技術(shù)等大多數(shù)的語音信號處理的技術(shù)。本文以開發(fā)漢語語音轉(zhuǎn)換系統(tǒng)為目的,基于高斯混合模型),以工具為實(shí)驗(yàn)平臺(tái)研
3、宄漢語語音轉(zhuǎn)換技術(shù)。論文的主要工作包括:闡述了語音轉(zhuǎn)換系統(tǒng)的整體框架以及漢語語音庫的構(gòu)建,在考慮到漢語的發(fā)音特性以及漢語音節(jié)覆蓋率的前提下收集挑選了句錄音語料,邀請位發(fā)音人進(jìn)行語料錄制。在所挑選的句錄音語料中,句作為模型訓(xùn)練語料,句作為集外測試語料。以工具為實(shí)驗(yàn)平臺(tái),對源說話人和目標(biāo)說話人的語音進(jìn)行分幀,使之成為幀長為,幀移為的信號,再使用布拉克曼窗函數(shù)進(jìn)行加窗,然后再提取階梅爾倒譜系數(shù),利用的方法將提取的譜參數(shù)在時(shí)間上進(jìn)行對齊,最后釆用算法得到最優(yōu)的音子的轉(zhuǎn)換模型。將需要測試的語音按照訓(xùn)練階段的分幀、加窗以及提取階梅爾倒譜系數(shù)
4、的過程進(jìn)行處理,再利用訓(xùn)練階段得到的最優(yōu)的轉(zhuǎn)換模型將提取的譜參數(shù)進(jìn)行轉(zhuǎn)較,最后結(jié)合測試語音的基音頻率合成出目標(biāo)語音。構(gòu)建完整的漢語語音轉(zhuǎn)換實(shí)驗(yàn)系統(tǒng),并對轉(zhuǎn)換后的語音進(jìn)行主觀評測。實(shí)驗(yàn)結(jié)果表明:本文所釆用的方法,以工具包為實(shí)驗(yàn)平臺(tái)所實(shí)現(xiàn)的漢語語音轉(zhuǎn)換系統(tǒng),使得轉(zhuǎn)換后的語音在可懂性與自然度上可以達(dá)到語音轉(zhuǎn)換的要求。另外,本文的漢語語音轉(zhuǎn)換的主觀評測得分為:集內(nèi),集外,說明該語音轉(zhuǎn)換系統(tǒng)的性能是比較優(yōu)秀的。關(guān)鍵詞:高斯混合模型;語音轉(zhuǎn)換;平臺(tái)AbstractAbstractThegoaloftheVoiceConversionisto
5、changethepersonalcharactersofspeaker'svoice,,,,,,,,,,,,AbstractmethodoftheMOS(MeanOpinionScore)toevaluatethespeech.Experimentalresultsshowthat:Inthispaper,,,目錄目錄觀目錄第一章緒論引言語音轉(zhuǎn)換的定義及意義語音轉(zhuǎn)換技術(shù)研究的現(xiàn)狀常用語音轉(zhuǎn)換的方法論文研宄的主要內(nèi)容及作者的工作論文研宄的主要內(nèi)容作者的工作論文的組織機(jī)構(gòu)第二章語音轉(zhuǎn)換的理論基礎(chǔ)語音產(chǎn)生機(jī)理語音信號產(chǎn)生模型語音信號
6、的個(gè)性特征參數(shù)語音信號分析語音信號的預(yù)處理基音周期估計(jì)語音信號的梅爾頻率倒譜分析語音轉(zhuǎn)換性能評價(jià)標(biāo)準(zhǔn)第三章基于語音轉(zhuǎn)換的實(shí)現(xiàn)語音轉(zhuǎn)換系統(tǒng)的描述構(gòu)建語音庫訓(xùn)練模型目錄語音信號特征參數(shù)提取模型訓(xùn)練實(shí)現(xiàn)基于的漢語語音轉(zhuǎn)換的實(shí)現(xiàn)第四章實(shí)驗(yàn)結(jié)果與評測第五章總結(jié)與展望總結(jié)展望參考文獻(xiàn)雜第一章緒論第一章緒論引言不管是在文字還未形成的遠(yuǎn)古時(shí)代,還是在現(xiàn)在科技高速發(fā)展的時(shí)代,語音一直都是人與人之間相互傳遞信息最重要、最普遍和最實(shí)用的工具。隨著現(xiàn)在社會(huì)的不斷發(fā)展進(jìn)步,語音信號領(lǐng)域的發(fā)展也取得了長足的進(jìn)步,同時(shí)也逐漸的吸引了眾多的語音方面的科研工作者
7、。這是由于語音信號對我們現(xiàn)在信息化的生活中具有非常重要的實(shí)用性,另外它的發(fā)展與現(xiàn)在社會(huì)中的許多最為前沿的科學(xué)技術(shù)的發(fā)展相互關(guān)聯(lián)⑴。語音轉(zhuǎn)換是最近的年才被提出的新的研宄方向,雖然研宄的時(shí)間并不是很長,但是國內(nèi)外對語音轉(zhuǎn)換的研究取得了比較廣泛的成果。語音轉(zhuǎn)換技術(shù)有著非常巨大的發(fā)展?jié)摿?,同樣的也存在著許多關(guān)鍵性的問題等待著解決。語音轉(zhuǎn)換的定義及意義語音轉(zhuǎn)換(,或是指對一個(gè)說話人(源說話人,的語音中所包含的某些個(gè)性特征信息參數(shù)進(jìn)行轉(zhuǎn)換,使轉(zhuǎn)換后的語音在語音語義信息不變的前提下具有另外一個(gè)說話人(目標(biāo)說話人,的語音個(gè)性特征信息。在說話人聲
8、音的每個(gè)句子包含很多重要的信息,但最重要的是,也是我們最關(guān)心的信息主要集中在兩個(gè)方面,即語音的語義信息和語音特征信息。這里說的語音的語義信息是指在說話人所說的一句語音中所要表達(dá)的內(nèi)容信息。而說話人語音的特征信息是指說話人語音的個(gè)性化信息,也就是表征了該說話人的身