語音增強(qiáng)算法的實現(xiàn)ppt課件.pptx

語音增強(qiáng)算法的實現(xiàn)ppt課件.pptx

ID:60844550

大?。?08.27 KB

頁數(shù):22頁

時間:2020-12-21

語音增強(qiáng)算法的實現(xiàn)ppt課件.pptx_第1頁
語音增強(qiáng)算法的實現(xiàn)ppt課件.pptx_第2頁
語音增強(qiáng)算法的實現(xiàn)ppt課件.pptx_第3頁
語音增強(qiáng)算法的實現(xiàn)ppt課件.pptx_第4頁
語音增強(qiáng)算法的實現(xiàn)ppt課件.pptx_第5頁
資源描述:

《語音增強(qiáng)算法的實現(xiàn)ppt課件.pptx》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、語音增強(qiáng)算法的實現(xiàn)TheRealizationoftheSpeechEnhancementAlgorithm目錄CONTENTS基本概述BasicOverview01算法研究AlgorithmicResearch03相關(guān)特性Relevant?Features02PARTONE基本概述401語音增強(qiáng)語音增強(qiáng)與語音信號處理理論有關(guān),而且涉及到人的聽覺感知和語音學(xué)。采用語音增強(qiáng)技術(shù)進(jìn)行預(yù)處理,可有效地改善系統(tǒng)性能。02語音增強(qiáng)的目標(biāo)對收聽人而言主要是改善語音質(zhì)量,提高語音可懂度,減少疲勞感;對語音處理系統(tǒng)(識別器、聲碼器、手機(jī))而言是提高系

2、統(tǒng)的識別率和抗干擾能力。目前國內(nèi)外抗噪聲技術(shù)的的研究成果大體分為以下三類解決方法51.采用語音增強(qiáng)算法,提高語音識別系統(tǒng)前端預(yù)處理的抗噪聲能力,提高輸入信號的信噪比2.尋找穩(wěn)健的語音特征作為特征參數(shù),實驗證明,這類參數(shù)對寬帶語音具有較好的抗噪性3.基于模型參數(shù)自適應(yīng)的噪聲補(bǔ)償算法PARTTWO相關(guān)特性一、語音特性70301語音信號具有短時平穩(wěn)性02語音信號可以分為濁音和清音語音信號可以利用統(tǒng)計分析特征描述二、人耳感知特性8人耳對語音的感知主要是通過語音信號頻譜分量幅度獲取的,對各分量相位則不敏感,對頻率高低的感受近似與該頻率的對數(shù)值成

3、正比。人耳具有掩蔽效應(yīng),人耳除了可以感受聲音的強(qiáng)度、音調(diào)、音色和空間方位外,還可以在兩人以上的講話環(huán)境中分辨出所需要的聲音,這種分辨能力是人體內(nèi)部語音理解機(jī)制具有的一種感知能力。人類的這種分離語音的能力與人的雙耳輸入效應(yīng)有關(guān),稱為“雞尾酒會效應(yīng)”。語音增強(qiáng)的最終效果度量是人耳的主觀感覺,所以在語音增強(qiáng)中可以利用人耳感知特性來減少運(yùn)算代價。三、噪聲特性9根據(jù)與輸入語音信號的關(guān)系,噪聲可分為加性噪聲和非加性噪聲兩類。對某些非加性噪聲而言,可以通過一定的變換轉(zhuǎn)換成加性噪聲。語音處理中的加性噪聲大體上可以分為周期性噪聲、脈沖噪聲、寬帶噪聲和同

4、聲道其他語音的干擾等。PARTTHREE算法研究目前語音增強(qiáng)算法大致可以分為以下四種11一參數(shù)方法二非參數(shù)方法三統(tǒng)計方法四其他方法一、參數(shù)方法12此類方法主要依賴于使用的語音生成模型(例如AR模型),需要提取模型參數(shù)(如基音周期、LPC系數(shù)),常常使用迭代方法。二、非參數(shù)方法13非參數(shù)方法不需要從帶噪信號中估計模型參數(shù),因此這種方法的應(yīng)用范圍較廣。但由于沒有利用可能的語言統(tǒng)計信息,故結(jié)果一般不是最優(yōu)化的。這類方法包括自適應(yīng)噪聲抵消法、譜減法等。14自適應(yīng)噪聲抵消法15實際應(yīng)用第三方面由于該方向的應(yīng)用原理和上面兩個有所不同,所以改變了排

5、版形式以區(qū)分這一特點(diǎn)。這段話原文中是三行,所以我在這里也得盡力把它編成三行的形式,這樣排版才會好看些。實際應(yīng)用第四方面由于該方向的應(yīng)用原理和上面兩個有所不同,所以改變了排版形式以區(qū)分這一特點(diǎn)。這段話原文中是三行,所以我在這里也得盡力把它編成三行的形式,這樣排版才會好看些。設(shè)帶噪語音輸入為y(n)=s(n)+d(n),s(n)為語音信號,d(n)為未知噪聲信號,r(n)參考噪聲輸入,也即自適應(yīng)濾波器的輸入,v(n)是該濾波器的輸出。r(n)與s(n)無關(guān),而與d(n)相關(guān)。圖自適應(yīng)噪聲抵消原理圖自適應(yīng)噪聲抵消法16自適應(yīng)濾波器通常采用F

6、IR濾波器,系數(shù)采用最小均方誤差(MMSE)準(zhǔn)則來迭代估計。判斷標(biāo)準(zhǔn)是使誤差信號e(n)能量最?。浩渲校瑆k是濾波器系數(shù),N是濾波器抽頭數(shù)。MMSE準(zhǔn)則要求噪聲和語音相互獨(dú)立,這時,誤差信號e(n)能量最小,可保證v(n)與d(n)最接近。自適應(yīng)噪聲抵消法17譜減法原理:利用噪聲的統(tǒng)計平穩(wěn)性以及加性噪聲與語音不相關(guān)的特點(diǎn)而提出的一種語音增強(qiáng)方法。此類語音增強(qiáng)方法將估計的對象放在短時譜幅度上。譜減法18優(yōu)缺比較簡單,只需要進(jìn)行正反傅立葉變換,而且實時實現(xiàn)較容易。適用的信噪比范圍較窄,在信噪比較低時對語音的可懂度損傷較大。所以實際應(yīng)用時除

7、了要降低噪聲外,還要兼顧語音的可懂度和自然度。三、統(tǒng)計方法19統(tǒng)計方法較充分地利用語音和噪音的統(tǒng)計特性,一般要建立模型庫,需要訓(xùn)練過程獲得初始統(tǒng)計參數(shù),它與語音識別系統(tǒng)的聯(lián)系很密切。如最小均方誤差估計(MMSE)、利用聽覺掩蔽效應(yīng)等。對于特定的失真準(zhǔn)則和后驗概率不敏感的估計方法是很有用處的。MMSE算法20優(yōu)缺達(dá)到了語音可懂度和清晰度的折衷,適用信噪比的范圍較廣由于需要統(tǒng)計各種參數(shù),算法運(yùn)算量大,實時性不好。四、其他方法21其他方法包括小波變換、卡亨南-洛維變換(KLT)、離散余弦變換(DCT)、人工神經(jīng)網(wǎng)絡(luò)等。這些方法不像前三類方法

8、那樣成熟,可以概括地稱為非主流方法。THANKS

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。