資源描述:
《說話人識(shí)別中改進(jìn)特征提取算法的研究.pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。
1、2014年5月計(jì)算機(jī)工程與設(shè)計(jì)Mav.2014第35卷第5期COMPUTERENGINEERINGANDDESIGNVo1.35No.5說話人識(shí)別中改進(jìn)特征提取算法的研究宋樂,白靜+(太原理工大學(xué)信息工程學(xué)院,山西太原030024)摘要:為了提取到能夠區(qū)分不同說話人個(gè)性特征的最優(yōu)特征參數(shù),采用在Mel頻率倒譜系數(shù)(Mel—frequencycepstrumcoefficients,MFCC)基礎(chǔ)上進(jìn)行改進(jìn)的復(fù)合參數(shù),即增加歸一化短時(shí)能量參數(shù)和一階差分所構(gòu)成的特征矢量作為特征。針對(duì)高維特征參數(shù),提出了一種基于相關(guān)距離Fisher準(zhǔn)則的特征選取方法
2、,利用該方法對(duì)提取出的參數(shù)進(jìn)行加權(quán)降維。通過實(shí)驗(yàn)對(duì)比結(jié)果表明,該算法提高了識(shí)別率,具備可行性與優(yōu)越性,是一種有效的特征提取算法。關(guān)鍵詞:說話人識(shí)別;特征提?。粴w一化短時(shí)能量;梅爾倒譜復(fù)合參數(shù);相關(guān)距離Fisher準(zhǔn)則中圖法分類號(hào):TP309文獻(xiàn)標(biāo)識(shí)號(hào):A文章編號(hào):1000—7024(2014)05—1772—04StudyofimprovingfeatureextractionalgorithminspeakerrecognitionSONGLe,BAIJing+(CollegeofInformationEngineering,TaiyuanU
3、niversityofTechnology,Taiyuan030024,China)Abstract:Toextractspeaker’Spersonalitycharacteristicsthatdifferentspeakerscanbedistinguishedbetter.Firstly,adesignmethodofMelcepstrumcompositecoefficientsbasedontheMelFrequencycepstrumcoefficient(MFCC)isconstructed.Thenormalizedshort
4、-timeenergyparametersandfirst-orderdifferenceareusedtobetheimprovedfeatureparameters.Then,inviewofthehighdimensionalparameters。aalgorithmforfeatureselectionaboutFishercriterionwithcorrelationdistanceisintro—duced.TheweightedalgorithmdesignedtOlowerdimensionforMelcepstrumcomp
5、ositecoefficients.Finally,ansimulationexampleispresentedtoprovetherecognitionrateisimprovedaswellasthefeasibilityandsuperiorityoftheproposedmethod,indicatedthatthisstudyisaneffectivefeatureextractionalgorithm.Keywords:speakerrecognition;featureextraction;thenormalizedshort—t
6、ermenergy;Melcepstrumcompositecoefficients;Fishercriterionwithcorre】ationdistancecoefficients,MCCC)。另外,為了去除特征各維分量間存0引言在的相關(guān)性及大量冗余信息,大多數(shù)的學(xué)者基于Fisher準(zhǔn)特征提取是說話人識(shí)別系統(tǒng)中的一個(gè)重要環(huán)節(jié)[1]。根則法嘲進(jìn)行加權(quán)降維,還有一些研究致力于運(yùn)用主分量分據(jù)人耳的聽覺特性所提出的MFCC特征提取算法運(yùn)用普析方法]、Fisher準(zhǔn)則和特征聚類用于特征選擇的方遍l2。],但其存在高噪音下識(shí)別率低的缺點(diǎn),因此許多學(xué)者
7、法[1o]及兩者結(jié)合的方法進(jìn)行降維,但并未提高識(shí)別率。本對(duì)MFCC算法進(jìn)行改進(jìn),例如將MFCC與反美爾域下提取文提出一種新的相關(guān)距離的Fisher準(zhǔn)則,根據(jù)每一維分量出的R-MFCC[相結(jié)合;利用時(shí)頻的分?jǐn)?shù)傅立葉變換(FR—對(duì)識(shí)別率的貢獻(xiàn)分別對(duì)提取出的MCCC降維加權(quán),并通過FT)替換傳統(tǒng)的傅里葉變換(FT)等_5],都取得了很好的實(shí)驗(yàn)驗(yàn)證系統(tǒng)的識(shí)別率和魯棒性。識(shí)別效果。但是語(yǔ)音信號(hào)是典型的非平穩(wěn)性信號(hào),而時(shí)頻1特征提取的基本算法分析的方法是分析非平穩(wěn)性信號(hào)有力的工具,于是文獻(xiàn)E6]在MFCC基礎(chǔ)上加入一階、二階差分的時(shí)頻特性參1.1MFCC的
8、提取過程數(shù)[6]。本文的改進(jìn)算法是用歸一化短時(shí)能量參數(shù)代替二階MFCC是從Mel刻度頻率域中提取出的特征參數(shù),具差分,組成Mel倒譜復(fù)合參數(shù)(Melc