資源描述:
《基于子帶加權(quán)和GMM的魯棒性話者確認(rèn)的研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、第19卷增刊信號(hào)處理117SIGNALPROCESSING基于子帶加權(quán)和GMM的魯棒性話者確認(rèn)的研究王金明,張雄偉(解放軍理工大學(xué)通信工程學(xué)院,南京210007摘要:噪聲魯棒性是話者確認(rèn)系統(tǒng)實(shí)用化的關(guān)鍵問(wèn)題之一,本文設(shè)計(jì)了一種基于子帶加權(quán)和GMM的話者確認(rèn)系統(tǒng),該系統(tǒng)將語(yǔ)音譜分為若干子帶,采用基于短時(shí)能量分布的算法估計(jì)各子帶噪聲強(qiáng)度,并根據(jù)噪聲強(qiáng)度來(lái)進(jìn)行子帶加權(quán),最終生成具有更高魯棒性的語(yǔ)音特征,語(yǔ)音識(shí)別模型采用簡(jiǎn)化的GMM。實(shí)驗(yàn)表明,上述方法能有效提高話者確認(rèn)系統(tǒng)的性能,增強(qiáng)其噪聲魯棒性,而且在低噪聲環(huán)境下,仍能保證系統(tǒng)性
2、能不下降。關(guān)鍵詞:子帶加權(quán);話者確認(rèn):高斯混合模型;魯棒性:美爾倒譜系數(shù)ResearchonRobustSpeakerVerificationBasedonSub-bandWeightingandGMMWangJinmingZhangXiongwei(InstituteofCommunicationEngineering,PLAUST,Nanjing210007)Abstract:Thenoiserobustnessisoneofthekeyproblemsforthepracticabilityofaspeakerviri
3、ficationsystem,inthispaper,aspeakervirificationsystembasedonsub-bandweightingandGMMispresented,inthissystem,thespeechsignalisdivdedintoseveralsub-bands,foreachsub-band,aalgorithmbasedonshort-timeenergydistributionisusedtoestimatethenoiseintension,thentheenergyofeve
4、rysub-bandisweightedaccordingtoit'snoiseintension,atlast,morerobustspeechparametersareproduced,modifiedgaussionmixturemodelsadoptedhereasspeakermodels.Itisshownthroughexperimentsthatthesemethodscaneffectivelyimprovetheperformanceandnoiserubostnessofthespeakerverifi
5、cationsystem,furthermore,inlownoiseconditionthesystemcanstillworkwell.KeyWords:Sub-bandWeighting;SpeakerVerification;GMM(GaussionMixtureModels);Robustness;MFCC(Mel-FrequencyCepstrumCoeficients)目前已有若干文獻(xiàn)和資料針對(duì)以上問(wèn)題提出解決辦法:引言比如,用語(yǔ)音增強(qiáng)、特征補(bǔ)償、模型自適應(yīng)等技術(shù)來(lái)適應(yīng)環(huán)境的改變,文獻(xiàn)[I]中提出用倒譜歸一化(
6、CepstralMean說(shuō)話者確認(rèn)技術(shù)己取得了很大進(jìn)展,目前在實(shí)用中遇到Normalization)來(lái)避免常值卷積性噪聲帶來(lái)的影響;文獻(xiàn)[2l的主要問(wèn)題在于系統(tǒng)的魯棒性,體現(xiàn)在以下一些方面:在實(shí)中利用語(yǔ)音信息在人的聽(tīng)覺(jué)系統(tǒng)中的冗余性來(lái)提高抗噪聲際環(huán)境中,不可避免有各種噪聲的存在,主要有加性噪聲和性能;文獻(xiàn)[3]中則對(duì)HMM模型作了改進(jìn),以使在強(qiáng)噪環(huán)境卷積性噪聲,這樣使很多在實(shí)驗(yàn)室具有良好識(shí)別性能的話者下,魯棒性好的特征參數(shù)起主導(dǎo)作用。確認(rèn)系統(tǒng)在實(shí)際環(huán)境中性能顯著降低;在利用電話語(yǔ)音的話本文針對(duì)噪聲魯棒性,提出一種基于子帶加權(quán)
7、和GMM者確認(rèn)系統(tǒng)中,語(yǔ)音經(jīng)過(guò)電話信道傳輸,3KHz頻帶外的說(shuō)的說(shuō)話者確認(rèn)方法,該方法將語(yǔ)音譜分成子帶,采用基于短話人信息丟失,若信道不匹配,語(yǔ)音信號(hào)還會(huì)產(chǎn)生畸變:另時(shí)能量分布的算法估計(jì)每個(gè)子帶的噪聲強(qiáng)度,根據(jù)噪聲強(qiáng)度外,說(shuō)話人的聲道特征、發(fā)音方式等隨時(shí)間、情緒以及身體進(jìn)行子帶能量加權(quán),最終生成具有更高魯棒性的語(yǔ)音特征矢狀況的變化均會(huì)產(chǎn)生變化。以上各種因素均是魯棒性話者確量,再對(duì)該語(yǔ)音特征利用簡(jiǎn)化的GMM模型進(jìn)行話者確認(rèn)。認(rèn)系統(tǒng)需要研究解決的問(wèn)題。實(shí)驗(yàn)表明,該方法對(duì)窄帶噪聲具有良好的抑制作用。并且克118信號(hào)處理第19卷增刊
8、SIGNALPROCESSING服了許多魯棒性方法在千凈語(yǔ)音或低噪聲環(huán)境下,系統(tǒng)性能倒譜域得到倒譜系數(shù)。反而降低的缺點(diǎn),能保證系統(tǒng)性能不下降。(1)Ck=客log(X;,一““一2)N1;“=1,2,A,P2子帶加權(quán)算法式中P為子帶MFCC參數(shù)的階數(shù),N為濾波器個(gè)數(shù),X為第i個(gè)子帶能量,(