應(yīng)用htk搭建語(yǔ)音撥號(hào)系統(tǒng)

應(yīng)用htk搭建語(yǔ)音撥號(hào)系統(tǒng)

ID:5274356

大?。?81.41 KB

頁(yè)數(shù):14頁(yè)

時(shí)間:2017-12-07

應(yīng)用htk搭建語(yǔ)音撥號(hào)系統(tǒng)_第1頁(yè)
應(yīng)用htk搭建語(yǔ)音撥號(hào)系統(tǒng)_第2頁(yè)
應(yīng)用htk搭建語(yǔ)音撥號(hào)系統(tǒng)_第3頁(yè)
應(yīng)用htk搭建語(yǔ)音撥號(hào)系統(tǒng)_第4頁(yè)
應(yīng)用htk搭建語(yǔ)音撥號(hào)系統(tǒng)_第5頁(yè)
資源描述:

《應(yīng)用htk搭建語(yǔ)音撥號(hào)系統(tǒng)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。

1、應(yīng)用HTK搭建語(yǔ)音撥號(hào)系統(tǒng)蘇統(tǒng)華哈爾濱工業(yè)大學(xué)人工智能研究室2006年10月30日聲明:版權(quán)所有,轉(zhuǎn)載請(qǐng)注明作者和來(lái)源該系統(tǒng)能夠識(shí)別連續(xù)說(shuō)出的數(shù)字串和若干組姓名。建模是針對(duì)子詞(sub-word,eg.音素),具有一定的可擴(kuò)充性。當(dāng)加入一個(gè)新名字時(shí),只需修改發(fā)音詞典和任務(wù)語(yǔ)法即可。模型為連續(xù)混合高斯輸出,運(yùn)用語(yǔ)音決策樹(shù)聚類形成的綁定狀態(tài)式三音素。1.數(shù)據(jù)準(zhǔn)備需要錄制訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)。為進(jìn)行校準(zhǔn),還需要數(shù)據(jù)的標(biāo)注文本。這里用任務(wù)語(yǔ)法(taskgrammar)產(chǎn)生真值文本(groundtruth)。為了處理訓(xùn)練數(shù)據(jù),需要定義一個(gè)語(yǔ)音集合和一個(gè)字典用以涵蓋訓(xùn)練和測(cè)試數(shù)據(jù)中涉及的單詞。[step1

2、]任務(wù)語(yǔ)法定義任務(wù)語(yǔ)法以包含變量的正則表達(dá)式形式定義,存儲(chǔ)在文件gram里:文件名:gram$digit=ONE

3、TWO

4、THREE

5、FOUR

6、FIVE

7、SIX

8、SEVEN

9、EIGHT

10、NINE

11、OH

12、ZERO;$name=[SUE]LAW

13、[JULIAN]TYLER

14、[DAVE]WOOD

15、[PHIL]LEE

16、[STEVE]YOUNG;(SENT-START(DIAL<$digit>

17、(PHONE

18、CALL)$name)SENT-END)上面的語(yǔ)法是高層表示,必須通過(guò)HParse轉(zhuǎn)成HTK可用的底層表示。底層表示存于文件wnet中:HParsegramwdnet文件名:wdnetVERSIO

19、N=1.0N=31L=62I=0W=SENT-ENDI=1W=YOUNG……J=0S=2E=0……J=61S=0E=29蘇統(tǒng)華.哈爾濱工業(yè)大學(xué)人工智能研究室.2006[step2]字典定義此例中利用BEEP語(yǔ)音字典,除去其中的重音符,并在每個(gè)發(fā)音后加入sp(shortpause,小停頓)。如果有啞音標(biāo)志,就用MP命令把sil和sp合并成sil。這些處理命令放在global.ded編輯腳本中:文件名:global.dedASspRScmuMPsilsilsp執(zhí)行HDMan生成與任務(wù)相關(guān)的發(fā)音詞典dict1:HDMan-m-w.listswlist-n.listsmonophones1-

20、ldlog.dictdict1.dictbeep.dictames上面的names文件是手工制作的專有人名的發(fā)音(包括SEND-START,SEND-END),文件wlist是出現(xiàn)在任務(wù)語(yǔ)法中的所有單詞的有序列表,文件monophones1是用到的音素的列表,dlog為參數(shù)文件。注1:實(shí)際上,這里應(yīng)該手工修改dict1,為SENT-END和SENT-START加上無(wú)輸出標(biāo)志,為了展示隊(duì)后面步驟地影響,這里故意不添加。文件名:.dictdict1CALLkaolspDAVEdeyvspDIALdayaxlspEIGHTeytspFIVEfayvspFOURfaospFOURf

21、aorspJULIANjhuwlianspJULIANjhuwlyaxnspLAWlaospLEEliyspNINEnaynspOHowspONEwahnspPHILfihlspPHONEfownspSENT-ENDsilSENT-STARTsilSEVENsehvnspSIXsihksspSTEVEstiyvspSUEsuwspSUEsyuwspTHREEthriysp2應(yīng)用HTK搭建語(yǔ)音撥號(hào)系統(tǒng)TWOtuwspTYLERtaylaxspWOODwuhdspYOUNGyahngspZEROziarowsp文件名:.dictamesDAVEdeyvJULIANjhuwlyaxnJULI

22、ANjhuwlianLAWlaoLEEliyPHILfihlSENT-END[]silSENT-START[]silSTEVEstiyvSUEsuwSUEsyuwTYLERtaylaxWOODwuhdYOUNGyahng為了避免在dlog里出現(xiàn)煩人的wanning,那就在names和beep同一目錄下分別建立同名的編輯腳本,內(nèi)容為空即可。文件名:names.ded文件名:beep.ded[step3]錄制語(yǔ)音數(shù)據(jù)HSGen工具可以生成符合taskgrammar的句子,用來(lái)指導(dǎo)錄音(HTKbook里叫sentenceprompts):HSGen-l-n140wdnet.dictdict1>

23、.labelstrainpromptsHSGen-l-n15wdnet.dictdict1>.labelstestprompts根據(jù)上述指令文件,錄制相應(yīng)的140個(gè)訓(xùn)練用語(yǔ)音數(shù)據(jù)文件和15個(gè)測(cè)試用語(yǔ)音數(shù)據(jù)文件。一個(gè)錄制的例子如下:HSLab.dataTrainspeechS0001注2:隨本文的壓縮包沒(méi)有包括這些數(shù)據(jù)文件,但包括了它們對(duì)應(yīng)的特征文件,所以對(duì)整個(gè)實(shí)驗(yàn)沒(méi)有什么影響。3蘇統(tǒng)華.哈

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。