資源描述:
《語(yǔ)音增強(qiáng)算法的實(shí)現(xiàn)ppt課件.pptx》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、語(yǔ)音增強(qiáng)算法的實(shí)現(xiàn)TheRealizationoftheSpeechEnhancementAlgorithm目錄CONTENTS基本概述BasicOverview01算法研究AlgorithmicResearch03相關(guān)特性Relevant?Features02PARTONE基本概述401語(yǔ)音增強(qiáng)語(yǔ)音增強(qiáng)與語(yǔ)音信號(hào)處理理論有關(guān),而且涉及到人的聽覺感知和語(yǔ)音學(xué)。采用語(yǔ)音增強(qiáng)技術(shù)進(jìn)行預(yù)處理,可有效地改善系統(tǒng)性能。02語(yǔ)音增強(qiáng)的目標(biāo)對(duì)收聽人而言主要是改善語(yǔ)音質(zhì)量,提高語(yǔ)音可懂度,減少疲勞感;對(duì)語(yǔ)音處理系統(tǒng)(識(shí)別器、聲碼器、手機(jī))而言是提高系
2、統(tǒng)的識(shí)別率和抗干擾能力。目前國(guó)內(nèi)外抗噪聲技術(shù)的的研究成果大體分為以下三類解決方法51.采用語(yǔ)音增強(qiáng)算法,提高語(yǔ)音識(shí)別系統(tǒng)前端預(yù)處理的抗噪聲能力,提高輸入信號(hào)的信噪比2.尋找穩(wěn)健的語(yǔ)音特征作為特征參數(shù),實(shí)驗(yàn)證明,這類參數(shù)對(duì)寬帶語(yǔ)音具有較好的抗噪性3.基于模型參數(shù)自適應(yīng)的噪聲補(bǔ)償算法PARTTWO相關(guān)特性一、語(yǔ)音特性70301語(yǔ)音信號(hào)具有短時(shí)平穩(wěn)性02語(yǔ)音信號(hào)可以分為濁音和清音語(yǔ)音信號(hào)可以利用統(tǒng)計(jì)分析特征描述二、人耳感知特性8人耳對(duì)語(yǔ)音的感知主要是通過語(yǔ)音信號(hào)頻譜分量幅度獲取的,對(duì)各分量相位則不敏感,對(duì)頻率高低的感受近似與該頻率的對(duì)數(shù)值成
3、正比。人耳具有掩蔽效應(yīng),人耳除了可以感受聲音的強(qiáng)度、音調(diào)、音色和空間方位外,還可以在兩人以上的講話環(huán)境中分辨出所需要的聲音,這種分辨能力是人體內(nèi)部語(yǔ)音理解機(jī)制具有的一種感知能力。人類的這種分離語(yǔ)音的能力與人的雙耳輸入效應(yīng)有關(guān),稱為“雞尾酒會(huì)效應(yīng)”。語(yǔ)音增強(qiáng)的最終效果度量是人耳的主觀感覺,所以在語(yǔ)音增強(qiáng)中可以利用人耳感知特性來減少運(yùn)算代價(jià)。三、噪聲特性9根據(jù)與輸入語(yǔ)音信號(hào)的關(guān)系,噪聲可分為加性噪聲和非加性噪聲兩類。對(duì)某些非加性噪聲而言,可以通過一定的變換轉(zhuǎn)換成加性噪聲。語(yǔ)音處理中的加性噪聲大體上可以分為周期性噪聲、脈沖噪聲、寬帶噪聲和同
4、聲道其他語(yǔ)音的干擾等。PARTTHREE算法研究目前語(yǔ)音增強(qiáng)算法大致可以分為以下四種11一參數(shù)方法二非參數(shù)方法三統(tǒng)計(jì)方法四其他方法一、參數(shù)方法12此類方法主要依賴于使用的語(yǔ)音生成模型(例如AR模型),需要提取模型參數(shù)(如基音周期、LPC系數(shù)),常常使用迭代方法。二、非參數(shù)方法13非參數(shù)方法不需要從帶噪信號(hào)中估計(jì)模型參數(shù),因此這種方法的應(yīng)用范圍較廣。但由于沒有利用可能的語(yǔ)言統(tǒng)計(jì)信息,故結(jié)果一般不是最優(yōu)化的。這類方法包括自適應(yīng)噪聲抵消法、譜減法等。14自適應(yīng)噪聲抵消法15實(shí)際應(yīng)用第三方面由于該方向的應(yīng)用原理和上面兩個(gè)有所不同,所以改變了排
5、版形式以區(qū)分這一特點(diǎn)。這段話原文中是三行,所以我在這里也得盡力把它編成三行的形式,這樣排版才會(huì)好看些。實(shí)際應(yīng)用第四方面由于該方向的應(yīng)用原理和上面兩個(gè)有所不同,所以改變了排版形式以區(qū)分這一特點(diǎn)。這段話原文中是三行,所以我在這里也得盡力把它編成三行的形式,這樣排版才會(huì)好看些。設(shè)帶噪語(yǔ)音輸入為y(n)=s(n)+d(n),s(n)為語(yǔ)音信號(hào),d(n)為未知噪聲信號(hào),r(n)參考噪聲輸入,也即自適應(yīng)濾波器的輸入,v(n)是該濾波器的輸出。r(n)與s(n)無關(guān),而與d(n)相關(guān)。圖自適應(yīng)噪聲抵消原理圖自適應(yīng)噪聲抵消法16自適應(yīng)濾波器通常采用F
6、IR濾波器,系數(shù)采用最小均方誤差(MMSE)準(zhǔn)則來迭代估計(jì)。判斷標(biāo)準(zhǔn)是使誤差信號(hào)e(n)能量最小:其中,wk是濾波器系數(shù),N是濾波器抽頭數(shù)。MMSE準(zhǔn)則要求噪聲和語(yǔ)音相互獨(dú)立,這時(shí),誤差信號(hào)e(n)能量最小,可保證v(n)與d(n)最接近。自適應(yīng)噪聲抵消法17譜減法原理:利用噪聲的統(tǒng)計(jì)平穩(wěn)性以及加性噪聲與語(yǔ)音不相關(guān)的特點(diǎn)而提出的一種語(yǔ)音增強(qiáng)方法。此類語(yǔ)音增強(qiáng)方法將估計(jì)的對(duì)象放在短時(shí)譜幅度上。譜減法18優(yōu)缺比較簡(jiǎn)單,只需要進(jìn)行正反傅立葉變換,而且實(shí)時(shí)實(shí)現(xiàn)較容易。適用的信噪比范圍較窄,在信噪比較低時(shí)對(duì)語(yǔ)音的可懂度損傷較大。所以實(shí)際應(yīng)用時(shí)除
7、了要降低噪聲外,還要兼顧語(yǔ)音的可懂度和自然度。三、統(tǒng)計(jì)方法19統(tǒng)計(jì)方法較充分地利用語(yǔ)音和噪音的統(tǒng)計(jì)特性,一般要建立模型庫(kù),需要訓(xùn)練過程獲得初始統(tǒng)計(jì)參數(shù),它與語(yǔ)音識(shí)別系統(tǒng)的聯(lián)系很密切。如最小均方誤差估計(jì)(MMSE)、利用聽覺掩蔽效應(yīng)等。對(duì)于特定的失真準(zhǔn)則和后驗(yàn)概率不敏感的估計(jì)方法是很有用處的。MMSE算法20優(yōu)缺達(dá)到了語(yǔ)音可懂度和清晰度的折衷,適用信噪比的范圍較廣由于需要統(tǒng)計(jì)各種參數(shù),算法運(yùn)算量大,實(shí)時(shí)性不好。四、其他方法21其他方法包括小波變換、卡亨南-洛維變換(KLT)、離散余弦變換(DCT)、人工神經(jīng)網(wǎng)絡(luò)等。這些方法不像前三類方法
8、那樣成熟,可以概括地稱為非主流方法。THANKS