大詞匯連續(xù)漢語語音的mlp聲學(xué)特征的研究.doc

ID：20488121

大小：94.57 KB

頁數(shù)：9頁

時(shí)間：2018-10-12

資源描述：

《大詞匯連續(xù)漢語語音的mlp聲學(xué)特征的研究.doc》由會(huì)員上傳分享，免費(fèi)在線閱讀，更多相關(guān)內(nèi)容在工程資料-天天文庫。

1、吻合器經(jīng)腹聯(lián)合斷流術(shù)56例療效分析［摘要］目的總結(jié)56參數(shù)如MFCC，PLP作為輸入向量的高斯混合模型(GMM)的隱馬爾可夫模型(H麗)的經(jīng)典模型在大詞匯連續(xù)語音識(shí)別系統(tǒng)(LVCSR)已取得了良好識(shí)別效果。但針對(duì)短時(shí)聲學(xué)特征區(qū)分性差的特點(diǎn)，本文提出采用神經(jīng)網(wǎng)絡(luò)多層感知器(MLP)產(chǎn)生的兩種類型差異特征HATs與TANDEM代替短時(shí)特征，分別訓(xùn)練G酮參數(shù)模型。實(shí)驗(yàn)結(jié)果表明，差異特征的GMH畫的LVCSR系統(tǒng)優(yōu)于傳統(tǒng)的短時(shí)特征的系統(tǒng)；為了更進(jìn)一步提高系統(tǒng)識(shí)別率，該文又將兩種類型差異特征HATs與TANDEM進(jìn)行復(fù)合，

2、構(gòu)成MLPs特征流重建GMH麗，系統(tǒng)的錯(cuò)字率(CER)有2%?％的明顯改善。關(guān)鍵詞：多層感知器；差異特征；隱馬爾可夫；高斯混合模型分類號(hào)：TN912文獻(xiàn)標(biāo)識(shí)碼：A文章編號(hào)：1009-3044(XX)13-3470-02MLPFeaturesforLargeVocabularyContinuousMandarinSpeechRecognitionSystemLVDan-jul,Ch.Plahl2,(ScienceDept.,SouthwestForestryUniversity,Kunming650224,Chin

3、a；Furlnformatik6-ComputerScienceDepartmentRWTHAachenUniversity,Aachen52056,Germany)Abstract：TypicallyHiddenMarkovModel(HMM)iniargevocabularycontitionsystem(LVCSR)ousticfeaturesvectutfeaturestotheGauGMM),hasachievedgots.However,fortheprmfeaturesondiscriworkmul

4、tilayerperctoproducetwotypesoturesHATsandTANDEMures,andrespectivegGMMparametermodelmentalresultsshowtRsystembasedondiscissuperiortothesysdontheshort-termfeprovethesystemrecotypesofdiscriminatTANDEMarecombinedaretrainGMHMM,thatlinuousspeechrecogn,usingshort-te

5、rmacors(MFCC/PLP)asinpssianmixturemodel(odrecognitionresulooroftheseshort-temination,neuralneteptron(MLP)areusedfdiscriminativefeainsteadofshortfeatly,thecorrespondinsaretrained.ExperihattheG順MMtheLVCSriminativefeaturestemtraditionalbaseatures；Tofurtherimgnit

6、ionrate,thetwoivefeaturesHATsandsMLPsfeatureflowtoeadstoanabsolutereductionofthecharactererrorrate(CER)ofabout2%^%.Keywords：MLP；discriminativefeatures；HMM；GMM對(duì)語音信號(hào)特征參數(shù)的研究是建立良好的語音識(shí)別系統(tǒng)的基礎(chǔ)與關(guān)鍵。在過去的研究中，語音識(shí)別系統(tǒng)的特征提取成分主要包括頻譜包絡(luò)預(yù)測(cè)，特別是經(jīng)過某些簡(jiǎn)單變化后的特征，目前前端大部分是基于短時(shí)軌跡（約10ms）信

7、號(hào)分析的美爾倒譜（MFC）或是感知線性預(yù)測(cè)（PLP）。但這些傳統(tǒng)的短時(shí)特征參數(shù)存在著對(duì)信號(hào)變化過于敏感，不能反映連續(xù)幀之間的相關(guān)特性，區(qū)分性差等方面的不足。近年來，國外很多語音研究機(jī)構(gòu)在語音信號(hào)的特征提取、聲學(xué)建模方面引入了神經(jīng)網(wǎng)絡(luò)ANN，其中由Berkeley國際計(jì)算機(jī)學(xué)院（ICSI）提出用基于MLPs的特征取代傳統(tǒng)特征，系統(tǒng)的識(shí)別率得到了明顯改善［1-3］?；贛LPs特征的差異性的優(yōu)勢(shì)和GMM/H畫模型的成熟性，本文提出將變換后的MLPs差異特征后驗(yàn)概率看作是G腿畫的輸入向量，重新構(gòu)建GMHMM模型。實(shí)驗(yàn)結(jié)

8、果表明MLPs特征具有更好的特性，LVCSR的識(shí)別率得到了明顯的改善。1基于MLP的差異聲學(xué)特征為彌補(bǔ)了來自言語感知和倒譜的短時(shí)分析的不足，獲取時(shí)序相關(guān)聯(lián)的多幀語音信息（即音素信息），文本引入了神經(jīng)網(wǎng)絡(luò)ANN的MLP,以提取基于非短時(shí)軌跡的非傳統(tǒng)特征。本文采用的MLP特征為HATs和TANDEM兩種。長(zhǎng)時(shí)HATs特征參數(shù)HATs特征基于人對(duì)不同頻帶的感覺不同，HATs特征

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 9



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件，查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常，文件下載后無此問題，請(qǐng)放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤，付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。

大詞匯連續(xù)漢語語音的mlp聲學(xué)特征的研究.doc

大詞匯連續(xù)漢語語音的mlp聲學(xué)特征的研究.doc

相關(guān)文章

相關(guān)標(biāo)簽