基于先驗(yàn)知識(shí)的語(yǔ)音增強(qiáng)方法研究

基于先驗(yàn)知識(shí)的語(yǔ)音增強(qiáng)方法研究

ID:6825232

大小:5.26 MB

頁(yè)數(shù):147頁(yè)

時(shí)間:2018-01-27

基于先驗(yàn)知識(shí)的語(yǔ)音增強(qiáng)方法研究_第1頁(yè)
基于先驗(yàn)知識(shí)的語(yǔ)音增強(qiáng)方法研究_第2頁(yè)
基于先驗(yàn)知識(shí)的語(yǔ)音增強(qiáng)方法研究_第3頁(yè)
基于先驗(yàn)知識(shí)的語(yǔ)音增強(qiáng)方法研究_第4頁(yè)
基于先驗(yàn)知識(shí)的語(yǔ)音增強(qiáng)方法研究_第5頁(yè)
資源描述:

《基于先驗(yàn)知識(shí)的語(yǔ)音增強(qiáng)方法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。

1、博士學(xué)位論文基于先驗(yàn)知識(shí)的語(yǔ)音增強(qiáng)方法研究現(xiàn)實(shí)環(huán)境中語(yǔ)音信號(hào)往往被各種環(huán)境噪聲污染。語(yǔ)音增強(qiáng)作為消除噪聲和提高語(yǔ)音質(zhì)量的一種有效手段,盡管近年來(lái)取得了長(zhǎng)足的進(jìn)步,但仍不能完全滿足實(shí)用的要求。本文從先驗(yàn)知識(shí)的角度審視語(yǔ)音增強(qiáng)算法,對(duì)多種單通道/多通道方法進(jìn)行了分析總結(jié),并且針對(duì)算法應(yīng)用中存在的缺陷和問(wèn)題,充分利用語(yǔ)音、噪聲和麥克風(fēng)陣列的先驗(yàn)知識(shí)的進(jìn)行了研究和改進(jìn)。主要工作和創(chuàng)新點(diǎn)如下:l針對(duì)傳統(tǒng)的譜減法中交叉項(xiàng)被忽略的假設(shè)在低信噪比(Signal-to-NoiseRatio,SNR)環(huán)境中會(huì)造成嚴(yán)重誤差的問(wèn)題,我們提出了一種基于相位調(diào)整和幅值補(bǔ)償?shù)亩嘧訋?/p>

2、譜減法。首先,利用噪聲與語(yǔ)音信號(hào)相位短時(shí)變化差異性的先驗(yàn)知識(shí),我們提出了基于微距最大值搜索的相位調(diào)整算法。其次,考慮到噪聲對(duì)語(yǔ)音的干擾在各子頻帶上不一致的先驗(yàn)知識(shí),我們采用了多子帶獨(dú)立的譜減策略。最后,針對(duì)不同SNR條件下過(guò)減規(guī)則對(duì)語(yǔ)音譜幅值的差異性衰減的先驗(yàn)知識(shí),我們提出了幅值補(bǔ)償算法。l多通道信號(hào)子空間方法的關(guān)鍵在于運(yùn)用了語(yǔ)音信號(hào)的低秩模型,算法的核心是信號(hào)子空間維度的估計(jì)。針對(duì)傳統(tǒng)的維度估計(jì)方法過(guò)分依賴噪聲功率估計(jì)的問(wèn)題,我們提出了一種基于F范數(shù)的信號(hào)子空間維度估計(jì)方法。首先,通過(guò)訓(xùn)練獲得了語(yǔ)音幅值譜的超高斯先驗(yàn)分布模型。其次,利用麥克風(fēng)之間的相

3、關(guān)性和正交變換不改變矩陣F范數(shù)的性質(zhì),獲得了語(yǔ)音互相關(guān)矩陣F范數(shù)的高斯先驗(yàn)分布模型。最后,利用一種基于最大化原則的估計(jì)策略,在接受原假設(shè)的前提下最大化信號(hào)子空間維度。l針對(duì)現(xiàn)有的后驗(yàn)語(yǔ)音存在概率(SpeechPresenceProbability,SPP)估計(jì)方法在非平穩(wěn)噪聲環(huán)境下高漏報(bào)率和高誤警率的問(wèn)題,我們提出了一種基于倒譜平滑和時(shí)頻相關(guān)性的后驗(yàn)SPP估計(jì)算法。首先,根據(jù)語(yǔ)音的倒譜系數(shù)具有區(qū)域分布特性的先驗(yàn)知識(shí),我們提出了倒譜系數(shù)的選擇性平滑策略來(lái)估計(jì)先驗(yàn)SNR。然后,針對(duì)相鄰時(shí)頻點(diǎn)之間的緊密相關(guān)性,我們提出了頻域多層平均與時(shí)域迭代平滑相結(jié)合的先驗(yàn)

4、SPP的更新算法。l針對(duì)現(xiàn)有噪聲估計(jì)方法在面對(duì)變化劇烈(例如具有窄帶能量階躍)的非平穩(wěn)噪聲時(shí)跟蹤延遲和有偏估計(jì)的問(wèn)題,我們提出了一種基于SPP和頻譜稀疏性的時(shí)噪聲估計(jì)算法。首先,利用倒譜平滑策略和時(shí)頻相關(guān)性的先驗(yàn)知識(shí)來(lái)估計(jì)后驗(yàn)SPP。然后,對(duì)語(yǔ)音譜的稀疏性進(jìn)行了描述,通過(guò)訓(xùn)練獲得稀疏測(cè)度的高斯分布模型作為先驗(yàn)知識(shí),通過(guò)判斷語(yǔ)音SPP估計(jì)譜的稀疏性來(lái)調(diào)整后驗(yàn)SPP估計(jì),從而更快速的跟蹤噪聲變化。所提算法中先驗(yàn)知識(shí)的運(yùn)用是本文工作的重點(diǎn)和亮點(diǎn),先驗(yàn)知識(shí)主要通過(guò)機(jī)器學(xué)習(xí)、理論分析和實(shí)驗(yàn)調(diào)試獲取,以算法規(guī)則、分布模型和參數(shù)設(shè)置的形式表示。對(duì)比實(shí)驗(yàn)表明,與傳統(tǒng)的

5、算法相比所提各算法獲得了更優(yōu)異的性能,達(dá)到了預(yù)期的研究目的。關(guān)鍵詞:語(yǔ)音增強(qiáng),先驗(yàn)知識(shí),譜減法,信號(hào)子空間方法,語(yǔ)音存在概率,噪聲估計(jì)AbstractThespeechsignalsaregenerallyimmersedinacousticambientnoise.Althoughnumerousspeechenhancementtechniqueshavebeenproposedtoextractthedesiredspeechsignalfromitscorruptedobservations,theycannotcompletelymeetth

6、erequirementsinrealapplication.Inthisthesis,weinvestigateavarietyofsingle-multi-channelspeechenhancementalgorithmsintermsofaprioriknowledge.Moreover,inordertoovercometheproblemanddeficiencyoftheexistingalgorithms,weresearchonmoregeneralizedaprioriknowledgeofspeech,noiseandmicro

7、phonearray,basedonwhichweproposeavarietyofalgorithmstoimprovethespeechquality.Themaincontributionsandnoveltiesinclude:lThetraditionalspectralsubtractionmethodisbasedonaprioriknowledge:thecrosstermscanbeneglected,whichisnotnecessarilytruewhenSNRislow.Inordertoovercomethisshortcom

8、ing,weproposeanovelmulti-bandspectralsubtractio

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。