基于聽覺特征參數的說話人識別技術

基于聽覺特征參數的說話人識別技術

ID:35177849

大?。?.92 MB

頁數:73頁

時間:2019-03-20

基于聽覺特征參數的說話人識別技術_第1頁
基于聽覺特征參數的說話人識別技術_第2頁
基于聽覺特征參數的說話人識別技術_第3頁
基于聽覺特征參數的說話人識別技術_第4頁
基于聽覺特征參數的說話人識別技術_第5頁
資源描述:

《基于聽覺特征參數的說話人識別技術》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。

1、學校代碼10530學號201330101206分類號TN912密級碩士學位論文基于聽覺特征參數的說話人識別技術學位申請人熊冰峰指導教師曾以成教授學院名稱物理與光電工程學院學科專業(yè)電子科學與技術研究方向語音信號處理二○一六年五月十六日SpeakerRecognitionTechnologyBasedonAuditoryFeatureParametersCandidateBingfengXiongSupervisorProfessorYichengZengCollegeSchoolofPhysicsandOptoelec

2、tricEngineeringProgramElectronicScienceandTechnologySpecializationSpeechSignalProcessingDegreeMasterofEngineeringUniversityXiangtanUniversitythDataMay16,2016i湘運大學學位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導師的指導下獨立進行研究所取得的研究成果。除了文中特別加W標注引用的內容外,本論文不包含任何其他個人或集體已經發(fā)表或撰寫的成果

3、作品。對本文的研巧做出重要貢。獻的個人和集體,均已在文中W明確方式標明本人完全意識到本聲明的法律后果由本人承擔。I/作者簽名:日期從伸^月》日。學位論文版權使用授權書本學位論文作者完全了解學校有關保留、使用學位論文的規(guī)定,同意學校保留并向國家有關部口或機構送交論文的復印件和電子版,允許論文被查閱和借閱。本人授權湘潭大學可W將本學位論文的全部或部分內容編、入有關數據庫進行檢索,可W采用影印縮印或掃描等復制手段保存和匯編本學位論文。渉密論文按學校規(guī)定處理。/。:如作者簽名

4、:日期細A月/日口':^月導師簽名:日期知日I摘要語言是人類信息交流最常用的方式,它自然方便、準確高效。隨著科技的發(fā)展,用現代手段研究語音信號處理技術,對于促進人機交互技術的進步具有十分重要的意義。語音信號處理技術是語音學和數字信號處理想結合的交叉學科,它與信息科學中許多前沿學科保持著密切聯系。語音信號處理可分為三個方向,語音識別,語音情感識別,說話人識別。語音識別是讓機器識別和理解人類語音信號轉變?yōu)橄鄳谋净蛎?,語音情感識別是機器從語音信號中識別人的各種情感,說話人識別是通過對說話人語音信號的分析,自

5、動識別說話人身份的技術。本文主要研究方向是說話人識別技術。說話人識別又稱為聲紋識別,是語音信號處理的一個重要分支,說話人識別技術最關鍵的一個環(huán)節(jié)是提取特征參數,是一直以來研究者們研究的熱點問題。針對目前說話人識別研究情況,本文開展了以下的研究工作:(1)語音信號前端處理須加窗分幀,但容易造成頻譜泄露的問題,這不利于得到可靠的精確的特征參數,我們提出一種漢明卷積窗,分析與實驗表明這種窗函數性能指標優(yōu)于經典窗函數,在語音預處理中用其代替?zhèn)鹘y(tǒng)窗函數,能較好地抑制頻譜失真。(2)目前主流的說話人識別系統(tǒng)是采用線性預測倒譜系數

6、(LPCC)和梅爾倒譜系數(MFCC),雖然在高信噪比的環(huán)境下取得了較好的識別率,但是在低信噪比環(huán)境,系統(tǒng)識別率下降較快,說明特征參數的抗噪性能低,針對這一問題,根據人耳聽覺系統(tǒng)的特性,提出基于聽覺特性的全極點伽馬通濾波器模型(APGF),更加符合人耳非對稱濾波特性,實驗表明這種聽覺特征參數具有更好的魯棒性。(3)目前常用的特征參數都需通過傅里葉變換,得到語音信號的頻域信息,但傅里葉變換分辨率單一,對長時語音非平穩(wěn)信號,并不具有優(yōu)勢。本文結合小波變換的多分辨率分析的優(yōu)點,通過聽覺變換得到耳蝸倒譜系數,將耳蝸特征參數應

7、用于說話人識別系統(tǒng),魯棒性和抗噪性能優(yōu)于經典的特征參數。進一步研究了Mel域、Bark域和ERB域尺度等不同頻域尺度的耳蝸倒譜系數,分別進行仿真實驗,實驗結果表明ERB尺度耳蝸倒譜特征參數優(yōu)于Bark尺度的倒譜特征。以上研究對說話人識別工程應用有積極意義。關鍵詞:漢明卷積窗;全極點伽馬通模型;小波變換;耳蝸倒譜系數IAbstractLanguageisthemostcommonlyusedapproachofinformationcommunication.Itisnaturalandconvenient,accur

8、ateandefficient.Withthedevelopmentoftechnology,itisveryimportanttostudyspeechsignalprocessingtechnologybymodernmeanstopromotetheprogressofhumancomputerinteractiontechnology.

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯系客服。
3. 下載前請仔細閱讀文檔內容,確認文檔內容符合您的需求后進行下載,若出現內容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯系客服處理。