資源描述:
《《語(yǔ)音增強(qiáng)方法》PPT課件》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、語(yǔ)音增強(qiáng)方法背景及意義語(yǔ)音增強(qiáng)是解決噪聲污染的一種有效方法,對(duì)受背景噪聲污染的語(yǔ)音進(jìn)行增強(qiáng)處理是一個(gè)具有重要實(shí)際意義的課題,是目前迫切需要解決的問(wèn)題,語(yǔ)音增強(qiáng)因而成為當(dāng)前語(yǔ)音信號(hào)處理中的一個(gè)重要研究方向。語(yǔ)音增強(qiáng)技術(shù)在許多方面有著很廣泛的應(yīng)用,例如:1、在國(guó)家和社會(huì)安全方面,偵聽(tīng)信號(hào)常常含有較大的噪聲,語(yǔ)音增強(qiáng)有助于提高偵聽(tīng)系統(tǒng)的效果,可以幫助偵察破案或獲取情報(bào)。2、飛機(jī)駕駛?cè)藛T與地面指揮的語(yǔ)音通訊常常因飛機(jī)螺旋槳、發(fā)動(dòng)機(jī)等強(qiáng)噪聲而受到千擾,需要進(jìn)行語(yǔ)音增強(qiáng)以保證語(yǔ)音信息的可靠傳達(dá)。3、深水潛水員在充氦氣的面罩內(nèi)說(shuō)話產(chǎn)生的語(yǔ)音信號(hào)會(huì)因特殊的氣體環(huán)境而產(chǎn)生畸變,語(yǔ)音共振峰移動(dòng),通過(guò)語(yǔ)
2、音增強(qiáng)能夠進(jìn)行校正。4、在街道、機(jī)場(chǎng)等嘈雜環(huán)境中使用的公共電話會(huì)因嚴(yán)重的干擾而影響通話質(zhì)量;在高速行使的汽車(chē)中使用移動(dòng)電話也有類似的問(wèn)題。有效的語(yǔ)音增強(qiáng)系統(tǒng)能夠大大提高語(yǔ)音通訊的抗干擾能力,能有效地?cái)U(kuò)展移動(dòng)通訊的適應(yīng)能力和應(yīng)用范圍。5、室內(nèi)回聲在比較嚴(yán)重的情況下會(huì)和原語(yǔ)音信號(hào)一起通過(guò)廣播等語(yǔ)音系統(tǒng)進(jìn)行傳播,影響收聽(tīng)效果。語(yǔ)音信號(hào)增強(qiáng)在這方面也能有所貢獻(xiàn)。6、錄音中的頻率響應(yīng)不平坦造成的失真,或有歷史價(jià)值的舊唱片和舊錄音帶中的噪聲,可以通過(guò)語(yǔ)音增強(qiáng)加以改善。7、有語(yǔ)言障礙的殘疾人發(fā)出的失真語(yǔ)音在經(jīng)過(guò)合理的語(yǔ)音增強(qiáng)補(bǔ)償后能夠被正常人聽(tīng)懂,提高了殘疾人的社會(huì)交往能力。語(yǔ)音增強(qiáng)在通信、語(yǔ)音
3、識(shí)別、語(yǔ)音編碼等領(lǐng)域有著重要的應(yīng)用,是語(yǔ)音信號(hào)處理領(lǐng)域的研究熱點(diǎn)之一。特別是應(yīng)用于單聲道含噪語(yǔ)音信號(hào)的增強(qiáng)技術(shù),尤其受到重視。語(yǔ)音增強(qiáng)技術(shù)研究現(xiàn)狀目前國(guó)內(nèi)外的研究成果大體分為三類解決方法:第一類方法是采用語(yǔ)音增強(qiáng)算法等,提高語(yǔ)音識(shí)別系統(tǒng)前端預(yù)測(cè)處理的抗噪聲能力,提高輸入信號(hào)的信噪比。第二類方法是尋找穩(wěn)健的耐噪聲的語(yǔ)音特征參數(shù)。第三類方法是基于模型參數(shù)適應(yīng)化的噪聲補(bǔ)償算法。例如,針對(duì)加法性噪聲的合成法,法和針對(duì)乘法性噪聲的法以及兩方面都考慮的方法等。第2章語(yǔ)音增強(qiáng)的相關(guān)問(wèn)題語(yǔ)音增強(qiáng)不僅涉及到信號(hào)檢測(cè)、波形估計(jì)等傳統(tǒng)的信號(hào)處理理論,而且它與語(yǔ)音特性、噪聲特性和人耳的感知特性都有密切地關(guān)
4、系。因此本章首先將介紹語(yǔ)音、噪聲和人耳感知的主要特性,然后概述了幾種常用的語(yǔ)音增強(qiáng)算法以及語(yǔ)音增強(qiáng)算法的各種評(píng)價(jià)方法。2.1語(yǔ)音及噪聲的特性1)語(yǔ)音特性語(yǔ)音信號(hào)的特點(diǎn)主要是指它的聲學(xué)特性、語(yǔ)音信號(hào)的時(shí)域波形和頻譜特性以及語(yǔ)音信號(hào)的統(tǒng)計(jì)特性等。下面將歸納語(yǔ)音信號(hào)三個(gè)主要的特點(diǎn):a、語(yǔ)音信號(hào)具有短時(shí)平穩(wěn)的特性。語(yǔ)音信號(hào)的短時(shí)平穩(wěn)特性是語(yǔ)音信號(hào)分析和處理的基礎(chǔ),利用這一特性就可以應(yīng)用平穩(wěn)隨機(jī)過(guò)程的分析來(lái)處理語(yǔ)音信號(hào),并可以在語(yǔ)音增強(qiáng)中利用短時(shí)頻譜時(shí)的平穩(wěn)特性。b、任何語(yǔ)音都由元音與輔音(清輔音、池輔音)兩種音素組成。在語(yǔ)音增強(qiáng)中可以利用池音具有明顯的周期性這一特點(diǎn)來(lái)區(qū)別和抑制非語(yǔ)音地噪聲
5、,而清輔音的特性則難與寬帶噪聲區(qū)分。c、語(yǔ)音信號(hào)可以用統(tǒng)計(jì)分析特性來(lái)描述。2)噪聲特性噪聲可以是加性的,也可以是非加性的。這里僅討論加性噪聲。加性噪聲通常分為:沖激噪聲(或脈沖噪聲)、周期性噪聲、寬帶噪聲、語(yǔ)音干擾噪聲等。a沖激噪聲:例如放電、打火、爆炸等都會(huì)引起沖激噪聲。沖激噪聲表現(xiàn)為它的時(shí)域波形中突然出現(xiàn)的窄脈沖。b周期性噪聲:如“交流聲”(交流電源的哼哼聲),發(fā)動(dòng)機(jī)、風(fēng)扇之類的周期性運(yùn)轉(zhuǎn)的機(jī)械所發(fā)出的周期噪聲等。周期性噪聲的主要特點(diǎn)是在頻譜圖上它們具有許多離散的窄帶譜,而且通常這些窄帶譜都是時(shí)變的,位置也不固定。c寬帶噪聲:寬帶噪聲的來(lái)源很多,如熱噪聲、氣流如風(fēng)、說(shuō)話時(shí)同時(shí)隨
6、伴的呼吸等。噪聲及各種隨機(jī)噪聲源產(chǎn)生的噪聲,以及量化噪聲等都可以視為寬帶噪聲。d同聲道語(yǔ)音干擾:干擾語(yǔ)音信號(hào)和待傳語(yǔ)音信號(hào)同時(shí)在一個(gè)信道中傳輸所造成語(yǔ)音干擾成為同聲道語(yǔ)音干擾,簡(jiǎn)稱語(yǔ)音干擾;或者在多人同時(shí)說(shuō)話的情況下,混疊語(yǔ)音信號(hào)中不需要的語(yǔ)音也形成了語(yǔ)音干擾。e傳輸噪聲:這是傳輸系統(tǒng)的電路噪聲。與背景噪聲不同,它在時(shí)間域里是語(yǔ)音和噪聲的卷積。3)人耳的感知特性目前語(yǔ)音感知已經(jīng)有一些重要的結(jié)論,可應(yīng)用于語(yǔ)音增強(qiáng)技術(shù):a)人耳對(duì)于聲波頻率高低的感覺(jué)與實(shí)際頻率的高低不呈線性關(guān)系,面近似為對(duì)數(shù)關(guān)系;對(duì)頻率人耳的分辨能力受聲強(qiáng)的影響,而人耳對(duì)聲強(qiáng)的感覺(jué)很靈敏并且有很大的動(dòng)態(tài)范圍,過(guò)強(qiáng)或者太
7、弱的聲音都會(huì)導(dǎo)致對(duì)頻率的分辨力降低;人耳對(duì)語(yǔ)音信號(hào)的幅度譜較為敏感,對(duì)相位不敏感。這一點(diǎn)對(duì)語(yǔ)音信號(hào)的恢復(fù)很有幫助。共振峰對(duì)語(yǔ)音感知很重要,特別是前三個(gè)共振峰更為重要。b)人耳具有掩蔽效應(yīng),即會(huì)產(chǎn)生一個(gè)聲音由于另外一個(gè)聲音的出現(xiàn)而導(dǎo)致該聲音能被感知的閾值提高的現(xiàn)象。c)人耳除了可以感受聲音的強(qiáng)度、音調(diào)、音色和空間方位外,還可以在兩人以上的講話環(huán)境中分辨出所需要的聲音,這種分辨能力是人體內(nèi)部語(yǔ)音理解機(jī)制具有的一種感知能力。人類的這種分離語(yǔ)音的能力與人的雙耳輸入效應(yīng)有關(guān),稱