資源描述:
《語音端點檢測方法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、乂至譜是大葦DALIANUNIVERSITYOFTEOflOLOGY破±韋恆巧文MASTE民ALDISSERTATION^龜語音端點檢測方法研究學(xué)科專業(yè)'___璋?]駕雄與每?1豐駕___作者姓名J已塑指導(dǎo)教師答辯日期進(jìn)化生立月碩±學(xué)位論文語音端點檢測方法研究ResearchonSpeechEndpointDetectionMethod作者姓名:張超學(xué)科、專業(yè):控制理論與控制工程學(xué)號:21309116指導(dǎo)教師:董明副教授完成日期2016年5月:乂連巧義乂緣Dalian
2、UniversityofTechnology大連理工大學(xué)學(xué)位論文獨創(chuàng)性聲明作者鄭重聲明:所呈交的學(xué)位論文,是本人在導(dǎo)師的指導(dǎo)下進(jìn)行研究王作所取得的成果。盡我所知,除文中已經(jīng)注明引用內(nèi)容和致謝的地方外,本論文不包含其他個人或集體已經(jīng)發(fā)表的研究成果,也不包含其他己申請學(xué)位或其他用途使用過的成果一。與我同工作的同志對本研究所做的貢獻(xiàn)均己在論文中做了明確的說明并表示了謝意。若有不實之處。,本人愿意承擔(dān)相關(guān)法律責(zé)任學(xué)位論文題目:語音端點槍測方法巧究備旅聲:^么日:日期:/年月作者簽名_/大連理王大學(xué)碩±學(xué)位論文摘要一,找到個單詞或語音段
3、的起始點和結(jié)束點語音端點檢測是指在背景噪聲存在下。它在語音識別一、語音編碼和語音傳輸?shù)日Z音信號處理中起著重要作用。種有效的端點檢測方法,不僅能正確標(biāo)識語音端點,而且能減少數(shù)據(jù)處理時間、提高效率和節(jié)省數(shù)據(jù)存儲空間。本文介紹了語音信號的產(chǎn)生模型和人耳聽覺特性,分析了語音分頓和加窗這些預(yù)處理過程。簡要回顧了常用的端點檢測方法,如短時能量和過零率法、譜方差法、MFCC倒譜距離法和譜賄法等,。怠結(jié)了各種常用算法的思想、流程及特點并給出了各算法所用特征參數(shù)曲線圖:。提出了兩種新的端點檢測算法一(1)提出了種改進(jìn)的自適應(yīng)子帶譜方差端點檢測方法。因為不同類型噪聲的頻率能量集
4、中在不同的頻率帶上,所W可W通過準(zhǔn)確地去掉這些含有太多噪聲的頻率帶,并自適應(yīng)地選擇有用子帶能量,來得到更多準(zhǔn)確的語音頻率譜信息。使語音段方差和噪聲段方差之間的區(qū)分度變大,,端點檢測更容易準(zhǔn)確率更高。同時有效減少了需處理的語音數(shù)據(jù),,提高系統(tǒng)整體性能。并將該算法應(yīng)用到高斯連續(xù)HMM語音識別系統(tǒng)中實驗表明,該算法提高了識別系統(tǒng)準(zhǔn)確率及抗噪性。一(2)提出了種無前導(dǎo)靜音段語音的端點檢測算法。基于閥值的端點檢測方法假設(shè)語音起始段為無語音的靜音段,并根據(jù)該無語音的起始段的特征值設(shè)置閥值。如果檢測的語音頓的特征值大于闊值,就認(rèn)為該頓是語音晌,否則認(rèn)為該頓是噪聲頓。若該假設(shè)不
5、成立,預(yù)設(shè)的閥值將不可用,最終導(dǎo)致端點檢測錯誤。本文通過FCM聚類方法避,表現(xiàn)出了很好的性能開了闊值設(shè)置問題。該算法在檢測無前導(dǎo)靜音段語音時。HMMFCM關(guān)鍵詞:端點檢測;子帶譜方差;段;;前導(dǎo)靜音--I語音端點檢測方法研究ResearchonSpeechEndpointDetectionMethodAbstractSpeechendpointdetectio打meansfindingtheStartinga打dendingpoi打tsofa打Uteredwordorseechsegmenti打theresenc
6、eofbackgroundnoise.Itlasanimortantrolei打seechpppyppsignalprocessingwhichincludesspeechrecognition,coding,andtransmissionandsoon.Aneffectiveendointdet;ectio打me化odcan打otoncorrectidentieendontofseechplylyfy也pip,butalsoreducethedatarocessintimeimroveefficie打
7、candsavethedatastoraesace.pg,py,gpThispaperintroducesthespeechproductionmodelandthehumanauditory.Itanalyzestheseechsinalrerocessinroceduresincludin仔aminandwindowin.Itbrief