資源描述:
《一種新的基于瓶頸深度信念網絡的特征提取方法及其在語種識別中的應用-論文.pdf》由會員上傳分享,免費在線閱讀,更多相關內容在應用文檔-天天文庫。
1、第41卷第3期計算機科學VOI.41No.32014年3月ComputerScienceMar2014一種新的基于瓶頸深度信念網絡的特征提取方法及其在語種識別中的應用李晉徽楊俊安王一(電子工程學院合肥230037)(電子制約技術安徽省重點實驗室合肥230037)摘要在語種識別中,傳統(tǒng)的MFCC特征由于每幀信號上的信息量不足,很容易受到噪聲污染,且抗噪能力較弱。同時,目前普遍使用的sDC特征提取方法在參數選擇上需要人為設定,這增加了識別結果的不確定性。針對上述不足,將深度學習方法引入特征提取之中,提出了基于瓶頸深度信念
2、網絡的特征提取方法。最后在NIST2007數據庫上對瓶頸層的大小、隱層數目以及瓶頸層位置進行了相關的對比實驗,結果表明,提出的方法相對于傳統(tǒng)的特征提取方法能夠取得更高的識別率。關鍵詞語種識別,瓶頸特征,深度信念網絡中圖法分類號TM344.1文獻標識碼ANewFeatureExtractionMethodBasedonBottleneckDeepBeliefNetworksanditsApplicationinLanguageRecognitionLIJin-huiYANGJun-anWANGYi(Electronic
3、EngineeringInstitute,Hefei230037,China)(AnhuiKeyLaboratoryofElectronicRestriction,Hefei230037,China)AbstractInlanguagerecognition。duetotheinsufficiencyofinformationineachframe,traditionalMFCCfeatureex—tractioniseasilysufferedfromnoisepollution.Meanwhile,thegene
4、ra1methodofSIX;featureextractiondependsonat-tificiallysettinginparameterselectionwhichincreasestheuncertaintyofrecognitionperformance.Inordertoovercomethesedrawbacks,thedeeplearningmethodwasintroducedandanovelfeatureextractionapproachnamedBN-DBNwhichisbasedonde
5、eplearningwasproposed.Finally,therelevantcomparativeexperimentsforthebottlenecklayersize。thenumberofhidden1ayersandthepositionofthebottlenecklayerwerecarriedoutinNIST2007database.Exper—imentalresultsshoWthatextractionmethodofthebottleneckfeaturesbasedondeepbeli
6、efnetworksaremoreeffectiveinlanguagerecognition.comparedwithtraditiona1methods.KeywordsLanguagerecognition,Bottleneckfeatures,Deepbeliefnetworks包含20~30毫秒的語音信號,很容易受到噪聲污染,其抗噪1引言能力較弱[4]。對于另一種特征提取方法——差分倒譜參數語種識別(1anguageIdentification,LID)是語音識別的一(shiftedDeltaCepstra
7、,SIX:)[6]而言,其雖然相對于MFCC參個重要分支,其目的是通過對給定的語音段進行分析處理,識數進行了很大的改進,但是由于scC的參數均是人為設定,別出所屬語言種類。近年來,隨著全球一體化進程的不斷加使得其無法通用于所有的語音數據,通用性較差???,不同語言間的信息交互日趨頻繁,LID在自動轉換服務、針對上述問題,本文將瓶頸結構(Bottle-Neck:BN)和近多語種信息補償等信息檢索領域有著重要的應用。此外,似人工神經網絡(ArtificialNeuralNetworks,以下簡稱LID還可在軍事上用來對目標
8、身份和國籍進行監(jiān)聽或判別。ANN)[7的深度信任神經網絡(DeepBeliefNetwork,DBN)隨著信息時代的到來以及因特網的發(fā)展,語種識別越來越顯相結合,提出了一種新的特征提取方法,稱為BN-DBN方法。示出其應用價值。DBN由于具有對輸入數據的內部統(tǒng)計結構和密度函數的要語種識別技術的研究最早可追溯到1974年,TI公司采求不嚴格,可對