資源描述:
《一種新的基于瓶頸深度信念網(wǎng)絡的特征提取方法及其在語種識別中的應用-論文.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應用文檔-天天文庫。
1、第41卷第3期計算機科學VOI.41No.32014年3月ComputerScienceMar2014一種新的基于瓶頸深度信念網(wǎng)絡的特征提取方法及其在語種識別中的應用李晉徽楊俊安王一(電子工程學院合肥230037)(電子制約技術(shù)安徽省重點實驗室合肥230037)摘要在語種識別中,傳統(tǒng)的MFCC特征由于每幀信號上的信息量不足,很容易受到噪聲污染,且抗噪能力較弱。同時,目前普遍使用的sDC特征提取方法在參數(shù)選擇上需要人為設定,這增加了識別結(jié)果的不確定性。針對上述不足,將深度學習方法引入特征提取之中,提出了基于瓶頸深度信念
2、網(wǎng)絡的特征提取方法。最后在NIST2007數(shù)據(jù)庫上對瓶頸層的大小、隱層數(shù)目以及瓶頸層位置進行了相關(guān)的對比實驗,結(jié)果表明,提出的方法相對于傳統(tǒng)的特征提取方法能夠取得更高的識別率。關(guān)鍵詞語種識別,瓶頸特征,深度信念網(wǎng)絡中圖法分類號TM344.1文獻標識碼ANewFeatureExtractionMethodBasedonBottleneckDeepBeliefNetworksanditsApplicationinLanguageRecognitionLIJin-huiYANGJun-anWANGYi(Electronic
3、EngineeringInstitute,Hefei230037,China)(AnhuiKeyLaboratoryofElectronicRestriction,Hefei230037,China)AbstractInlanguagerecognition。duetotheinsufficiencyofinformationineachframe,traditionalMFCCfeatureex—tractioniseasilysufferedfromnoisepollution.Meanwhile,thegene
4、ra1methodofSIX;featureextractiondependsonat-tificiallysettinginparameterselectionwhichincreasestheuncertaintyofrecognitionperformance.Inordertoovercomethesedrawbacks,thedeeplearningmethodwasintroducedandanovelfeatureextractionapproachnamedBN-DBNwhichisbasedonde
5、eplearningwasproposed.Finally,therelevantcomparativeexperimentsforthebottlenecklayersize。thenumberofhidden1ayersandthepositionofthebottlenecklayerwerecarriedoutinNIST2007database.Exper—imentalresultsshoWthatextractionmethodofthebottleneckfeaturesbasedondeepbeli
6、efnetworksaremoreeffectiveinlanguagerecognition.comparedwithtraditiona1methods.KeywordsLanguagerecognition,Bottleneckfeatures,Deepbeliefnetworks包含20~30毫秒的語音信號,很容易受到噪聲污染,其抗噪1引言能力較弱[4]。對于另一種特征提取方法——差分倒譜參數(shù)語種識別(1anguageIdentification,LID)是語音識別的一(shiftedDeltaCepstra
7、,SIX:)[6]而言,其雖然相對于MFCC參個重要分支,其目的是通過對給定的語音段進行分析處理,識數(shù)進行了很大的改進,但是由于scC的參數(shù)均是人為設定,別出所屬語言種類。近年來,隨著全球一體化進程的不斷加使得其無法通用于所有的語音數(shù)據(jù),通用性較差??欤煌Z言間的信息交互日趨頻繁,LID在自動轉(zhuǎn)換服務、針對上述問題,本文將瓶頸結(jié)構(gòu)(Bottle-Neck:BN)和近多語種信息補償?shù)刃畔z索領域有著重要的應用。此外,似人工神經(jīng)網(wǎng)絡(ArtificialNeuralNetworks,以下簡稱LID還可在軍事上用來對目標
8、身份和國籍進行監(jiān)聽或判別。ANN)[7的深度信任神經(jīng)網(wǎng)絡(DeepBeliefNetwork,DBN)隨著信息時代的到來以及因特網(wǎng)的發(fā)展,語種識別越來越顯相結(jié)合,提出了一種新的特征提取方法,稱為BN-DBN方法。示出其應用價值。DBN由于具有對輸入數(shù)據(jù)的內(nèi)部統(tǒng)計結(jié)構(gòu)和密度函數(shù)的要語種識別技術(shù)的研究最早可追溯到1974年,TI公司采求不嚴格,可對