資源描述:
《一種基于聽覺掩蔽效應的語音增強方法》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、ISSN100020054清華大學學報(自然科學版)2001年第41卷第7期1?34CN1122223?NJTsinghuaUniv(Sci&Tech),2001,Vol.41,No.7124一種基于聽覺掩蔽效應的語音增強方法張金杰, 曹志剛, 馬正新(清華大學電子工程系,微波與數(shù)字通信國家重點實驗室,北京100084)摘 要:為提高增強語音的聽覺效果,研究了一種基于聽覺聲道語音增強方法。單聲道語音增強方法中目前常掩蔽效應的語音增強方法。推出了一個功率譜域的基于聽覺用的是一類基于短時譜幅度(STSA)估計的語音增掩蔽效應的不等式準則,并用這個準則動態(tài)地選擇一個作為強方法,該類方法認為語音信號的
2、STSA對語音的語音短時譜幅度估計器的非線性函數(shù)的參數(shù)值,通過這個參感知起主導作用,從而在語音增強中需要精確估計,數(shù)自適應變化的非線性函數(shù)對語音譜幅度進行估計實現(xiàn)語而相位對語音的感知并不重要,沒有必要精確估計。音增強。在此基礎上,設計實現(xiàn)了一個單聲道語音增強算法。文[1]通過實驗為此提供了一定的依據(jù),文[2]則證對增強語音的客觀測試和非正式聽音測試表明:相對于傳明在一定條件下語音相位的最小均方誤差統(tǒng)的減譜法和對數(shù)短時譜幅度最小均方誤差估計增強法,基(MMSE)估計值就是帶噪語音相位本身,因此,基于聽覺掩蔽效應的語音增強方法能更好地抑制背景噪聲。于STSA估計的語音增強方法一般都直接采用帶關(guān)鍵詞
3、:語音增強;噪聲抑制;聽覺模型;掩蔽效應噪語音的相位作為增強語音的相位?;赟TSA估中圖分類號:TN912.3[3]計的語音增強法包括減譜法及其各種變形、文章編號:100020054(2001)0720001204文獻標識碼:A[2,4,5]MMSE估計法等。減譜法通過從帶噪語音的STSA中直接減去噪聲的平均譜幅度來得到增強語Speechenhancementmethodbased音的STSA,實現(xiàn)起來簡單,但是剩余噪聲大,并且onauditorymasking[2,4,5]產(chǎn)生不舒服的“音樂噪聲”。后來,Ephraim等人ZHANGJinjie,CAOZhigang,MAZhengxin提
4、出了STSA的MMSE估計法,部分解決了“音樂(StateKeyLabonMicrowave&Digital噪聲”問題,但在帶噪語音信噪比(SNR)較低時其Communications,DepartmentofElectronicEngineering,剩余噪聲還是很大,尤其是當信噪比小于5dB時。TsinghuaUniversity,Beijing100084,China)近年來,人們針對聽覺外周提出了一些計算模Abstract:Thispaperpresentsaspeechenhancementmethodbasedonthemaskingpropertiesofthehumanaudi
5、torysystemanda型,并在語音編碼、音頻壓縮和音質(zhì)的客觀度量等方non2linearfilter.Thespeechphaseisignoredtoidentifyenhanced面獲得了應用,同時,基于人類聽覺特性的語音增強criterioninthepowerspectraldomainbasedonmasking.The[6]研究也取得了一定的進展。目前,在語音增強中用criterionisthenappliedtodeterminetheparametervaluesforanon2linearfilteremployedtoestimatetheshort2timespec
6、tral得比較成功的是聽覺掩蔽效應,它指出語音信號能amplitudeofspeech.Themethodisthenusedtodevelopa夠掩蔽與其同時進入聽覺系統(tǒng)的一部分能量較小的single2channelspeechenhancementalgorithm.Objective噪聲信號,而使得這部分噪聲不為人所感知到。因此measurementscombinedwithinformalsubjectivelisteningtestsshowthattheproposedalgorithmcansuppressaudiblenoisemore從掩蔽效應的角度看,語音增強應該通過改變帶
7、噪effectivelythanthepopularpowerspectralsubtractionmethodand語音的STSA使得所有噪聲成分都能被語音信號theminimummean2squareerrorlog2spectralamplitudeestimation掩蓋掉。據(jù)此,本文提出了一種基于掩蔽效應和method.Keywords:speechenhancement;noisesu