資源描述:
《基于深度學(xué)習(xí)的與文本無(wú)關(guān)話者確認(rèn)研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、來(lái)';!*¥岳盧奪留鐘參名來(lái)大賽UniversitofScienceandTechnoloofChinaygy碩±學(xué)位論文'—-'V#t.、:試?:取成坪:V^^s::;;吁氣'.、!纖:典,畔,論義題目基于深度學(xué)習(xí)的與文木無(wú)關(guān)巧者確認(rèn)巧堯作者姓名吳明輝學(xué)科專業(yè)化洛與條統(tǒng)導(dǎo)師姓名專辭到教投完成時(shí)間二〇—六年五月木擔(dān)#《若乂大賽碩±學(xué)位論文嚷基于本無(wú)!醫(yī)誠(chéng)霜作者姓名:吳明輝學(xué)科專業(yè):電路與系統(tǒng)專業(yè)導(dǎo)師姓名:李輝
2、副教授一、miiUnive巧ityofScenceandTechnologyofChna’AdissertationIbrmastersdegree#Researchontex-tindependentspeakerverificationbasedondeeplearningAuthor:MinhuiWugSecialit:Circuitsandss化mpyySuervisorAitPr.HuiLip:ssocaeofFini
3、shedTime;Ma2016y,一、中國(guó)科學(xué)技術(shù)大學(xué)學(xué)位論文原創(chuàng)性聲明本人聲明所呈交的學(xué)位論文,是本人在導(dǎo)師指導(dǎo)下進(jìn)行研巧工作所取得的成果。除己恃別加W標(biāo)注和致謝的地方外,論文中不包含任何他人己經(jīng)發(fā)表或撰寫過的研巧成果-。與我同工作的同志對(duì)本研巧所做的貢獻(xiàn)均己在論文中作了明確的說(shuō)明。作者簽名:簽字日期:居.中國(guó)科學(xué)技術(shù)大學(xué)學(xué)位論文授權(quán)使用聲明一作為申請(qǐng)學(xué)位的條件之,學(xué)位論文著作權(quán)擁有者授權(quán)中國(guó)科學(xué)技術(shù)大學(xué)擁有學(xué)位論文的部分使用權(quán),即:學(xué)校有權(quán)按有關(guān)規(guī)定向國(guó)家有關(guān)部口或機(jī)構(gòu),
4、允許論文被査閱和借閱^送交論文的復(fù)印件和電子版,可文將學(xué)位論文編入《中國(guó)學(xué)位論文全文數(shù)據(jù)庫(kù)》等有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢索,可W采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。本人提交的電子文培的內(nèi)容和紙質(zhì)論文的內(nèi)容相一致。保密的學(xué)位論文在解密后也進(jìn)守此規(guī)定。白4開□保密年作者篇名:灰^鳴導(dǎo)師簽名:^丈;i簽字日期:簽字日期7/oLL摘要摘要一隨著科學(xué)技術(shù)的不斷進(jìn)步,電話己經(jīng)成為人們?nèi)粘I钪胁豢苫蛉钡牟浚崳姺帧T谏矸菡J(rèn)證技術(shù)研巧領(lǐng)域,越來(lái)越多的研究人員開始關(guān)注如何使用電話語(yǔ)音進(jìn)行身份認(rèn)
5、證,因?yàn)橄鄬?duì)于其它身份認(rèn)證技術(shù)來(lái)說(shuō),使用電話語(yǔ)音進(jìn)斤身份認(rèn)證所需的設(shè)備簡(jiǎn)單、成本低、易獲取,更重要的是在使用電話語(yǔ)音進(jìn)行身份一認(rèn)證的過程中,用戶不需要接觸設(shè)備,只需要簡(jiǎn)單的說(shuō)句話,,便可完成認(rèn)證大大提商了用戶的接受率。另外,說(shuō)話人確認(rèn)技術(shù)還是語(yǔ)音識(shí)別技術(shù)研巧領(lǐng)域的一個(gè)重要研巧方向,所W說(shuō)話人確認(rèn)技術(shù)的研巧不僅具有重要的理論研究意義而且還具有廣泛的應(yīng)用前景。目前在說(shuō)話人確認(rèn)研巧領(lǐng)域中,主流的說(shuō)話人建模方法都是基于概率統(tǒng)計(jì)模型的,其中最具代表性的概率統(tǒng)計(jì)說(shuō)話人模型當(dāng)屬離斯混合模型(GaussianMi
6、xtureModel,GMM)。髙斯混合模型采用非常多的高斯概率密度函數(shù)分量,對(duì)說(shuō)話人的語(yǔ)音特征分布進(jìn)行了較好的描述,從而取得了不錯(cuò)的效果;但說(shuō)話人確認(rèn)是一個(gè)二元分類問題一,而商斯海合模型只是種概率生成性模型,其區(qū)分能力非常有限,所W需要尋找同時(shí)具有強(qiáng)大表征能力和很強(qiáng)區(qū)分能力的模型進(jìn)行說(shuō)話人建模。近年來(lái),深度學(xué)習(xí)(DeeLearnin,DL)理論在模式識(shí)別領(lǐng)pg域掀起了一股非常大的研究熱潮一個(gè)復(fù)雜的神經(jīng)網(wǎng)絡(luò)橫型,其出發(fā)點(diǎn)是想構(gòu)建來(lái)模擬人腦的思維方式,然后對(duì)數(shù)據(jù)進(jìn)行分析和處理。目前深度學(xué)習(xí)理論所依
7、托的實(shí)現(xiàn)載體是深度神經(jīng)網(wǎng)絡(luò)(DeepNeuralNetwork,DNN)。深度神經(jīng)網(wǎng)絡(luò)憑借多隱層的結(jié)構(gòu)特點(diǎn),使得其具有很好的表征能力和區(qū)分能力,目前在摸式識(shí)別的諸多研巧方向都取得了成功應(yīng)用。本文主要研巧內(nèi)容就是將具有強(qiáng)大表征能力及區(qū)分能力的深度神經(jīng)網(wǎng)絡(luò)應(yīng)用于說(shuō)話人確認(rèn)系統(tǒng)中進(jìn)行說(shuō)話人建模,構(gòu)建基于深度神經(jīng)網(wǎng)絡(luò)的話者確認(rèn)系統(tǒng),針對(duì)建模過程中深度神經(jīng)網(wǎng)絡(luò)輸入特征的選擇、網(wǎng)絡(luò)結(jié)構(gòu)W及網(wǎng)絡(luò)訓(xùn)練方法等關(guān)鍵問趙進(jìn)行了深入的研巧,并對(duì)多種基于深度神經(jīng)網(wǎng)絡(luò)的說(shuō)話人確認(rèn)系統(tǒng)的結(jié)構(gòu)及性能進(jìn)行對(duì)比。首先—,介紹了
8、目前說(shuō)話人確認(rèn)技術(shù)研巧領(lǐng)域最為經(jīng)典的概率統(tǒng)計(jì)模型高斯混合模型,并對(duì)其原理進(jìn)行了詳細(xì)闡述。針對(duì)其應(yīng)用于說(shuō)話人確認(rèn)系統(tǒng)--中使用的GMMUBM結(jié)構(gòu)進(jìn)行了深入的討論,并對(duì)GMMUBM說(shuō)話人模型訓(xùn)練過程中使用的MAP算法進(jìn)行介紹,然后通過實(shí)驗(yàn)分析了混合度的選取對(duì)