語音增強方法課件.pptx

語音增強方法課件.pptx

ID:57257132

大?。?5.48 KB

頁數(shù):25頁

時間:2020-08-04

語音增強方法課件.pptx_第1頁
語音增強方法課件.pptx_第2頁
語音增強方法課件.pptx_第3頁
語音增強方法課件.pptx_第4頁
語音增強方法課件.pptx_第5頁
資源描述:

《語音增強方法課件.pptx》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫

1、語音增強方法背景及意義語音增強是解決噪聲污染的一種有效方法,對受背景噪聲污染的語音進行增強處理是一個具有重要實際意義的課題,是目前迫切需要解決的問題,語音增強因而成為當前語音信號處理中的一個重要研究方向。語音增強技術(shù)在許多方面有著很廣泛的應用,例如:1、在國家和社會安全方面,偵聽信號常常含有較大的噪聲,語音增強有助于提高偵聽系統(tǒng)的效果,可以幫助偵察破案或獲取情報。2、飛機駕駛?cè)藛T與地面指揮的語音通訊常常因飛機螺旋槳、發(fā)動機等強噪聲而受到千擾,需要進行語音增強以保證語音信息的可靠傳達。3、深水潛水員在充氦氣的面罩內(nèi)說話產(chǎn)生的語音信號會因

2、特殊的氣體環(huán)境而產(chǎn)生畸變,語音共振峰移動,通過語音增強能夠進行校正。4、在街道、機場等嘈雜環(huán)境中使用的公共電話會因嚴重的干擾而影響通話質(zhì)量;在高速行使的汽車中使用移動電話也有類似的問題。有效的語音增強系統(tǒng)能夠大大提高語音通訊的抗干擾能力,能有效地擴展移動通訊的適應能力和應用范圍。5、室內(nèi)回聲在比較嚴重的情況下會和原語音信號一起通過廣播等語音系統(tǒng)進行傳播,影響收聽效果。語音信號增強在這方面也能有所貢獻。6、錄音中的頻率響應不平坦造成的失真,或有歷史價值的舊唱片和舊錄音帶中的噪聲,可以通過語音增強加以改善。7、有語言障礙的殘疾人發(fā)出的失真

3、語音在經(jīng)過合理的語音增強補償后能夠被正常人聽懂,提高了殘疾人的社會交往能力。語音增強在通信、語音識別、語音編碼等領(lǐng)域有著重要的應用,是語音信號處理領(lǐng)域的研究熱點之一。特別是應用于單聲道含噪語音信號的增強技術(shù),尤其受到重視。語音增強技術(shù)研究現(xiàn)狀目前國內(nèi)外的研究成果大體分為三類解決方法:第一類方法是采用語音增強算法等,提高語音識別系統(tǒng)前端預測處理的抗噪聲能力,提高輸入信號的信噪比。第二類方法是尋找穩(wěn)健的耐噪聲的語音特征參數(shù)。第三類方法是基于模型參數(shù)適應化的噪聲補償算法。例如,針對加法性噪聲的合成法,法和針對乘法性噪聲的法以及兩方面都考慮的

4、方法等。第2章語音增強的相關(guān)問題語音增強不僅涉及到信號檢測、波形估計等傳統(tǒng)的信號處理理論,而且它與語音特性、噪聲特性和人耳的感知特性都有密切地關(guān)系。因此本章首先將介紹語音、噪聲和人耳感知的主要特性,然后概述了幾種常用的語音增強算法以及語音增強算法的各種評價方法。2.1語音及噪聲的特性1)語音特性語音信號的特點主要是指它的聲學特性、語音信號的時域波形和頻譜特性以及語音信號的統(tǒng)計特性等。下面將歸納語音信號三個主要的特點:a、語音信號具有短時平穩(wěn)的特性。語音信號的短時平穩(wěn)特性是語音信號分析和處理的基礎,利用這一特性就可以應用平穩(wěn)隨機過程的分

5、析來處理語音信號,并可以在語音增強中利用短時頻譜時的平穩(wěn)特性。b、任何語音都由元音與輔音(清輔音、池輔音)兩種音素組成。在語音增強中可以利用池音具有明顯的周期性這一特點來區(qū)別和抑制非語音地噪聲,而清輔音的特性則難與寬帶噪聲區(qū)分。c、語音信號可以用統(tǒng)計分析特性來描述。2)噪聲特性噪聲可以是加性的,也可以是非加性的。這里僅討論加性噪聲。加性噪聲通常分為:沖激噪聲(或脈沖噪聲)、周期性噪聲、寬帶噪聲、語音干擾噪聲等。a沖激噪聲:例如放電、打火、爆炸等都會引起沖激噪聲。沖激噪聲表現(xiàn)為它的時域波形中突然出現(xiàn)的窄脈沖。b周期性噪聲:如“交流聲”(

6、交流電源的哼哼聲),發(fā)動機、風扇之類的周期性運轉(zhuǎn)的機械所發(fā)出的周期噪聲等。周期性噪聲的主要特點是在頻譜圖上它們具有許多離散的窄帶譜,而且通常這些窄帶譜都是時變的,位置也不固定。c寬帶噪聲:寬帶噪聲的來源很多,如熱噪聲、氣流如風、說話時同時隨伴的呼吸等。噪聲及各種隨機噪聲源產(chǎn)生的噪聲,以及量化噪聲等都可以視為寬帶噪聲。d同聲道語音干擾:干擾語音信號和待傳語音信號同時在一個信道中傳輸所造成語音干擾成為同聲道語音干擾,簡稱語音干擾;或者在多人同時說話的情況下,混疊語音信號中不需要的語音也形成了語音干擾。e傳輸噪聲:這是傳輸系統(tǒng)的電路噪聲。與

7、背景噪聲不同,它在時間域里是語音和噪聲的卷積。3)人耳的感知特性目前語音感知已經(jīng)有一些重要的結(jié)論,可應用于語音增強技術(shù):a)人耳對于聲波頻率高低的感覺與實際頻率的高低不呈線性關(guān)系,面近似為對數(shù)關(guān)系;對頻率人耳的分辨能力受聲強的影響,而人耳對聲強的感覺很靈敏并且有很大的動態(tài)范圍,過強或者太弱的聲音都會導致對頻率的分辨力降低;人耳對語音信號的幅度譜較為敏感,對相位不敏感。這一點對語音信號的恢復很有幫助。共振峰對語音感知很重要,特別是前三個共振峰更為重要。b)人耳具有掩蔽效應,即會產(chǎn)生一個聲音由于另外一個聲音的出現(xiàn)而導致該聲音能被感知的閾值

8、提高的現(xiàn)象。c)人耳除了可以感受聲音的強度、音調(diào)、音色和空間方位外,還可以在兩人以上的講話環(huán)境中分辨出所需要的聲音,這種分辨能力是人體內(nèi)部語音理解機制具有的一種感知能力。人類的這種分離語音的能力與人的雙耳輸入效應有關(guān),稱

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。