資源描述:
《應(yīng)用htk搭建語(yǔ)音撥號(hào)系統(tǒng)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、應(yīng)用HTK搭建語(yǔ)音撥號(hào)系統(tǒng)蘇統(tǒng)華哈爾濱工業(yè)大學(xué)人工智能研究室2006年10月30日聲明:版權(quán)所有,轉(zhuǎn)載請(qǐng)注明作者和來(lái)源該系統(tǒng)能夠識(shí)別連續(xù)說(shuō)出的數(shù)字串和若干組姓名。建模是針對(duì)子詞(sub-word,eg.音素),具有一定的可擴(kuò)充性。當(dāng)加入一個(gè)新名字時(shí),只需修改發(fā)音詞典和任務(wù)語(yǔ)法即可。模型為連續(xù)混合高斯輸出,運(yùn)用語(yǔ)音決策樹(shù)聚類形成的綁定狀態(tài)式三音素。1.數(shù)據(jù)準(zhǔn)備需要錄制訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)。為進(jìn)行校準(zhǔn),還需要數(shù)據(jù)的標(biāo)注文本。這里用任務(wù)語(yǔ)法(taskgrammar)產(chǎn)生真值文本(groundtruth)。為了處理訓(xùn)練數(shù)據(jù),需要定義一個(gè)語(yǔ)音集合和一個(gè)字典用以涵蓋訓(xùn)練和測(cè)試數(shù)據(jù)中涉及的單詞。[step1
2、]任務(wù)語(yǔ)法定義任務(wù)語(yǔ)法以包含變量的正則表達(dá)式形式定義,存儲(chǔ)在文件gram里:文件名:gram$digit=ONE
3、TWO
4、THREE
5、FOUR
6、FIVE
7、SIX
8、SEVEN
9、EIGHT
10、NINE
11、OH
12、ZERO;$name=[SUE]LAW
13、[JULIAN]TYLER
14、[DAVE]WOOD
15、[PHIL]LEE
16、[STEVE]YOUNG;(SENT-START(DIAL<$digit>
17、(PHONE
18、CALL)$name)SENT-END)上面的語(yǔ)法是高層表示,必須通過(guò)HParse轉(zhuǎn)成HTK可用的底層表示。底層表示存于文件wnet中:HParsegramwdnet文件名:wdnetVERSIO
19、N=1.0N=31L=62I=0W=SENT-ENDI=1W=YOUNG……J=0S=2E=0……J=61S=0E=29蘇統(tǒng)華.哈爾濱工業(yè)大學(xué)人工智能研究室.2006[step2]字典定義此例中利用BEEP語(yǔ)音字典,除去其中的重音符,并在每個(gè)發(fā)音后加入sp(shortpause,小停頓)。如果有啞音標(biāo)志,就用MP命令把sil和sp合并成sil。這些處理命令放在global.ded編輯腳本中:文件名:global.dedASspRScmuMPsilsilsp執(zhí)行HDMan生成與任務(wù)相關(guān)的發(fā)音詞典dict1:HDMan-m-w.listswlist-n.listsmonophones1-
20、ldlog.dictdict1.dictbeep.dictames上面的names文件是手工制作的專有人名的發(fā)音(包括SEND-START,SEND-END),文件wlist是出現(xiàn)在任務(wù)語(yǔ)法中的所有單詞的有序列表,文件monophones1是用到的音素的列表,dlog為參數(shù)文件。注1:實(shí)際上,這里應(yīng)該手工修改dict1,為SENT-END和SENT-START加上無(wú)輸出標(biāo)志,為了展示隊(duì)后面步驟地影響,這里故意不添加。文件名:.dictdict1CALLkaolspDAVEdeyvspDIALdayaxlspEIGHTeytspFIVEfayvspFOURfaospFOURf
21、aorspJULIANjhuwlianspJULIANjhuwlyaxnspLAWlaospLEEliyspNINEnaynspOHowspONEwahnspPHILfihlspPHONEfownspSENT-ENDsilSENT-STARTsilSEVENsehvnspSIXsihksspSTEVEstiyvspSUEsuwspSUEsyuwspTHREEthriysp2應(yīng)用HTK搭建語(yǔ)音撥號(hào)系統(tǒng)TWOtuwspTYLERtaylaxspWOODwuhdspYOUNGyahngspZEROziarowsp文件名:.dictamesDAVEdeyvJULIANjhuwlyaxnJULI
22、ANjhuwlianLAWlaoLEEliyPHILfihlSENT-END[]silSENT-START[]silSTEVEstiyvSUEsuwSUEsyuwTYLERtaylaxWOODwuhdYOUNGyahng為了避免在dlog里出現(xiàn)煩人的wanning,那就在names和beep同一目錄下分別建立同名的編輯腳本,內(nèi)容為空即可。文件名:names.ded文件名:beep.ded[step3]錄制語(yǔ)音數(shù)據(jù)HSGen工具可以生成符合taskgrammar的句子,用來(lái)指導(dǎo)錄音(HTKbook里叫sentenceprompts):HSGen-l-n140wdnet.dictdict1>
23、.labelstrainpromptsHSGen-l-n15wdnet.dictdict1>.labelstestprompts根據(jù)上述指令文件,錄制相應(yīng)的140個(gè)訓(xùn)練用語(yǔ)音數(shù)據(jù)文件和15個(gè)測(cè)試用語(yǔ)音數(shù)據(jù)文件。一個(gè)錄制的例子如下:HSLab.dataTrainspeechS0001注2:隨本文的壓縮包沒(méi)有包括這些數(shù)據(jù)文件,但包括了它們對(duì)應(yīng)的特征文件,所以對(duì)整個(gè)實(shí)驗(yàn)沒(méi)有什么影響。3蘇統(tǒng)華.哈