資源描述:
《提取耳蝸熵值的語音可懂度客觀評測算法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、萬方數(shù)據(jù)聲明本人鄭重聲明:所呈交的學位論文,是本人在指導教師的指導下,獨立進行研究所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本論文不包含其他個人或集體已經(jīng)發(fā)表或撰寫過的研究成果。對本文的研究做出重要貢獻的個人和集體,均已在文中以明確方式標明。本聲明的法律責任由本人承擔。論文作者簽氰獫幽日期:型z噬u關(guān)于學位論文使用權(quán)的說明本人完全了解太原理工大學有關(guān)保管、使用學位論文的規(guī)定,其中包括:①學校有權(quán)保管、并向有關(guān)部門送交學位論文的原件與復印件;②學校可以采用影印、、縮印或其它復制手段復制并保存學位論文;③學校可允許學位論文被查閱或借閱;④學校可以學術(shù)交流為目的,復制贈送和交換學位論文;⑤學??梢?/p>
2、公布學位論文的全部或部分內(nèi)容(保密學位論文在解密后遵守此規(guī)定)。簽名:導師簽名:萬方數(shù)據(jù)太原理工大學碩士研究生學位論文提取耳蝸熵值的語音可懂度客觀評測算法研究摘要一㈣螋語音質(zhì)量和語音可懂度是語音增強領(lǐng)域的一個分支,語音質(zhì)量評測算法的研究注重背景噪聲和其他干擾的抑制過程,采用聽覺方法或認識技術(shù)提高通信的可靠性和系統(tǒng)的魯棒性。而語音可懂度的研究對象是語音信號本身,區(qū)別于語音質(zhì)量,從另一個角度對語音信號進行增強。語音質(zhì)量和語音可懂度盡管都屬于語音增強的分支,但是對于聽者接收的語音來說,語音質(zhì)量是指語音的清晰程度,即其他干擾對語音的影響;而語音可懂度是指聽眾能夠?qū)φZ音的理解程度。語音質(zhì)量的高低與語音
3、可懂度的高低并不成正比。例如,即便在較高的背景噪聲條件下,聽者有時也能聽懂語音表達的意思,有時,在安靜的場合反而未必能聽懂。因此,本研究從語音可懂度的角度,采用提取語音耳蝸熵值的方法對語音進行分段并提取耳蝸熵值,再利用歸一化協(xié)方差算法和語音混響能量比算法計算語音的可懂度客觀評測分數(shù),通過四種相關(guān)度分析方法分別評測主觀分數(shù)和客觀分數(shù)的相關(guān)性,從而對語音可懂度進行客觀評測。本研究的主要內(nèi)容如下:1.對語音信號進行分段處理,提取耳蝸熵值。根據(jù)一定的閾值將耳蝸熵值分為高熵值和低熵值。\、2.采用歸一化協(xié)方差算法和提取語音混響調(diào)制能量比算法。輸入語音分別為高熵值段語音和低熵值段語音。兩種可懂度算法的區(qū)
4、別是后者擺脫T萬方數(shù)據(jù)太原理工大學碩士研究生學位論文了對純凈語音的依賴性,更適用于日常生活中,例如人工耳蝸的植入或者助的聽器佩戴。研究結(jié)果表明,采用提取耳蝸熵值之后高熵值段語音的可懂度更高些,說明高熵值段語音比低熵值段語音攜帶有更多的語音信息。并且采用歸一化協(xié)方差算法和語音混響調(diào)制能量比算法的高熵值段語音可懂度主客觀相關(guān)系數(shù)都達到O.85左右,二者相差不大。但歸一化協(xié)方差算法具有理想化的特點,現(xiàn)實生活中的語音不可能完全為純凈語音,而語音混響調(diào)制能量比算法具有無需純凈語音輸入的特點,因而更具有實用性。關(guān)鍵字:耳蝸熵值,語音可懂度,歸一化協(xié)方差,語音混響調(diào)制能量比II萬方數(shù)據(jù)太原理工大學碩士研究
5、生學位論文OBJECTIVEN位ASURESFORPREDICTINGSPEECHINTELLIGIBILITYBASED0NCOCHLEA.SCALEDENTROPYABSTRACTThespeechqualityandspeechintelligibilityisabranchofthefieldofspeechenhancement.Theresearchonspeechqualityevaluationalgorithmpaysattentiontotheinhibitoryprocessbackgroundofnoiseandotherinterferences,adoptingt
6、heauditorymethodorunderstandingtechniquetoimprovethereliabilityofcommunicationaswellastherobustnessofthesystem.Thesubjectinvestigatedbyspeechintelligibilityisspeechsignalitself,differencingfromspeechquality,toenhancingspeechsignalfromanotherperspective.Althoughthespeechqualityandspeechintelligibili
7、tyisabranchofspeechenhancement,whenitgoestothepronunciationlistenersreceived,‘speechquality’referstotheclarityofspeech,inanotherword,theeffectofotherdisturbancetospeech,while‘speechintelligibility’meansthep