大詞匯連續(xù)漢語(yǔ)語(yǔ)音的MLP聲學(xué)特征的研究

大詞匯連續(xù)漢語(yǔ)語(yǔ)音的MLP聲學(xué)特征的研究

ID:19561268

大?。?8.79 KB

頁(yè)數(shù):9頁(yè)

時(shí)間:2018-10-03

大詞匯連續(xù)漢語(yǔ)語(yǔ)音的MLP聲學(xué)特征的研究_第1頁(yè)
大詞匯連續(xù)漢語(yǔ)語(yǔ)音的MLP聲學(xué)特征的研究_第2頁(yè)
大詞匯連續(xù)漢語(yǔ)語(yǔ)音的MLP聲學(xué)特征的研究_第3頁(yè)
大詞匯連續(xù)漢語(yǔ)語(yǔ)音的MLP聲學(xué)特征的研究_第4頁(yè)
大詞匯連續(xù)漢語(yǔ)語(yǔ)音的MLP聲學(xué)特征的研究_第5頁(yè)
資源描述:

《大詞匯連續(xù)漢語(yǔ)語(yǔ)音的MLP聲學(xué)特征的研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)

1、大詞匯連續(xù)漢語(yǔ)語(yǔ)音的MLP聲學(xué)特征的研究  摘要:短時(shí)聲學(xué)特征參數(shù)如MFCC,PLP作為輸入向量的高斯混合模型(GMM)的隱馬爾可夫模型(HMM)的經(jīng)典模型在大詞匯連續(xù)語(yǔ)音識(shí)別系統(tǒng)(LVCSR)已取得了良好識(shí)別效果。但針對(duì)短時(shí)聲學(xué)特征區(qū)分性差的特點(diǎn),本文提出采用神經(jīng)網(wǎng)絡(luò)多層感知器(MLP)產(chǎn)生的兩種類(lèi)型差異特征HATs與TANDEM代替短時(shí)特征,分別訓(xùn)練GMM參數(shù)模型。實(shí)驗(yàn)結(jié)果表明,差異特征的GMHMM的LVCSR系統(tǒng)優(yōu)于傳統(tǒng)的短時(shí)特征的系統(tǒng);為了更進(jìn)一步提高系統(tǒng)識(shí)別率,該文又將兩種類(lèi)型差異特征HATs與TANDEM進(jìn)行復(fù)合,構(gòu)成MLPs特征流重

2、建GMHMM,系統(tǒng)的錯(cuò)字率(CER)有2%~%的明顯改善?! £P(guān)鍵詞:多層感知器;差異特征;隱馬爾可夫;高斯混合模型  中圖分類(lèi)號(hào):TN912文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(XX)13-3470-02  MLPFeaturesforLargeVocabularyContinuousMandarinSpeechRecognitionSystem  LVDan-ju1,Ch.Plahl2,  (ScienceDept.,SouthwestForestryUniversity,Kunming50224,China;.LehrstuhlFur

3、Informatik-ComputerScienceDepartmentRWTHAachenUniversity,Aachen2056,Germany)  Abstract:TypicallyHiddenMarkovModel(HMM)inlargevocabularycontinuousspeechrecognitionsystem(LVCSR),usingshort-termacousticfeaturesvectors(MFCC/PLP)asinputfeaturestotheGaussianmixturemodel(GMM),hasach

4、ievedgoodrecognitionresults.However,forthepooroftheseshort-termfeaturesondiscrimination,neuralnetworkmultilayerperceptron(MLP)areusedtoproducetwotypesofdiscriminativefeaturesHATsandTANDEMinsteadofshortfeatures,andrespectively,thecorrespondingGMMparametermodelsaretrained.Exper

5、imentalresultsshowthattheGMHMMtheLVCSRsystembasedondiscriminativefeaturesissuperiortothesystemtraditionalbasedontheshort-termfeatures;Tofurtherimprovethesystemrecognitionrate,thetwotypesofdiscriminativefeaturesHATsandTANDEMarecombinedasMLPsfeatureflowtoretrainGMHMM,thatleadst

6、oanabsolutereductionofthecharactererrorrate(CER)ofabout%~%.  Keywords:MLP;discriminativefeatures;HMM;GMM  對(duì)語(yǔ)音信號(hào)特征參數(shù)的研究是建立良好的語(yǔ)音識(shí)別系統(tǒng)的基礎(chǔ)與關(guān)鍵。在過(guò)去的研究中,語(yǔ)音識(shí)別系統(tǒng)的特征提取成分主要包括頻譜包絡(luò)預(yù)測(cè),特別是經(jīng)過(guò)某些簡(jiǎn)單變化后的特征,目前前端大部分是基于短時(shí)軌跡(約10ms)信號(hào)分析的美爾倒譜(MFC)或是感知線性預(yù)測(cè)(PLP)。但這些傳統(tǒng)的短時(shí)特征參數(shù)存在著對(duì)信號(hào)變化過(guò)于敏感,不能反映連續(xù)幀之間的相關(guān)特性,區(qū)分

7、性差等方面的不足。近年來(lái),國(guó)外很多語(yǔ)音研究機(jī)構(gòu)在語(yǔ)音信號(hào)的特征提取、聲學(xué)建模方面引入了神經(jīng)網(wǎng)絡(luò)ANN,其中由Berkeley國(guó)際計(jì)算機(jī)學(xué)院(ICSI)提出用基于MLPs的特征取代傳統(tǒng)特征,系統(tǒng)的識(shí)別率得到了明顯改善[1-3]?;贛LPs特征的差異性的優(yōu)勢(shì)和GMM/HMM模型的成熟性,本文提出將變換后的MLPs差異特征后驗(yàn)概率看作是GMHMM的輸入向量,重新構(gòu)建GMHMM模型。實(shí)驗(yàn)結(jié)果表明MLPs特征具有更好的特性,LVCSR的識(shí)別率得到了明顯的改善?! ?基于MLP的差異聲學(xué)特征  為彌補(bǔ)了來(lái)自言語(yǔ)感知和倒譜的短時(shí)分析的不足,獲取時(shí)序相關(guān)聯(lián)的多

8、幀語(yǔ)音信息(即音素信息),文本引入了神經(jīng)網(wǎng)絡(luò)ANN的MLP,以提取基于非短時(shí)軌跡的非傳統(tǒng)特征。本文采用的MLP特征為HATs和TANDE

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。