資源描述:
《基于語音存在概率和聽覺掩蔽特性的語音增強(qiáng)算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、第28卷第11期計(jì)算機(jī)應(yīng)用Vo.l28No.112008年11月ComputerApplicationsNov.2008文章編號(hào):1001-9081(2008)11-2981-03基于語音存在概率和聽覺掩蔽特性的語音增強(qiáng)算法宮云梅,趙曉群,史仍輝(同濟(jì)大學(xué)電子與信息工程學(xué)院,上海200092)(gong_0830@mai.ltongj.iedu.cn)摘要:低信噪比下,譜減語音增強(qiáng)法中一直存在的去噪度、殘留的音樂噪聲和語音畸變度三者間均衡這一關(guān)鍵問題顯得尤為突出。為降低噪聲對(duì)語音通信的干擾,提出了一種適于低信噪比下的語音增強(qiáng)算法。在傳統(tǒng)的譜減法基礎(chǔ)上,根據(jù)噪聲的聽覺掩蔽閾值自適應(yīng)調(diào)整減參
2、數(shù),利用語音存在概率,對(duì)語音、噪聲信號(hào)估計(jì),避免低信噪比下端點(diǎn)檢測(cè)(VAD)的不準(zhǔn)確,有更強(qiáng)的魯棒性。對(duì)算法進(jìn)行了客觀和主觀測(cè)試,結(jié)果表明:相對(duì)于傳統(tǒng)的譜減法,在幾乎不損傷語音清晰度的前提下該算法能更好地抑制殘留噪聲和背景噪聲,特別是對(duì)低信噪比和非平穩(wěn)噪聲干擾的語音信號(hào),效果更加明顯。關(guān)鍵詞:語音增強(qiáng);譜減法;語音存在概率;聽覺掩蔽特性中圖分類號(hào):TN912.3;TP391文獻(xiàn)標(biāo)志碼:ASpeechenhancementbasedonspeechpresenceprobabilityandauditorymaskingpropertyGONGYunme,iZHAOXiaoqun,SH
3、IRenghui(CollegeofElectronicsandInformationEngineering,TongjiUniversity,Shanghai201804,China)Abstract:InlowSignaltoNoiseRatio(SNR)environment,thetradeoffamongtheamountofnoisereduction,thelevelofmusicalresidualnoiseandthespeechdistortionwasthekeyproblemofspectralsubtractionspeechenhancement.Animpro
4、vedspeechenhancementalgorithmforlowSNRwasdevelopedinordertodecreasetheinterferenceofnoiseonpurespeech.Thisalgorithmwasbasedonthetraditionalspectralsubtraction,andthesubtractionparameterwasselfadaptivelyadjustedinthelightofthemaskingpropertiesofhumanauditory.Thespeechpresenceprobabilitywasintegrate
5、dtoestimatethesignalandnoise,whichwouldavoidtheinaccuracyofutilizingVoiceActivityDetection(VAD),andincreasetherobustness.Theexperimentalresultsdemonstratethatthisalgorithmiseffectivetoreducetheresidualnoiseandthebackgroundnoise,butnottodistortthespeecharticulationcomparedtoothermodifiedspectralsubtr
6、actionalgorithms,especiallyforthelowSNRnoisyspeechsignalandthatbeingdegradedbynonstationarynoise.Keywords:speechenhancement;spectralsubtraction;speechpresenceprobability;auditorymaskingproperty噪聲的干擾不僅會(huì)降低語音通信的質(zhì)量,而且也會(huì)使基于通過比較文獻(xiàn)[3]改進(jìn)的對(duì)數(shù)譜最小均方誤差估計(jì)(Minimum特征參數(shù)提取的語音處理系統(tǒng)(如低速率語音編碼、語音識(shí)別MeanSquareErrorLogS
7、pectralAmplitude,MMSELSA)算法,本等)性能下降,語音增強(qiáng)方法眾多,譜減法由于其簡單有效性已文提出的算法從主觀和客觀評(píng)價(jià)性能要更好。為許多實(shí)際數(shù)字語音處理系統(tǒng)所采用。但是由于噪聲與語音1語音增強(qiáng)算法信號(hào)在頻域中的重疊特性,在消除噪聲,提高語音信號(hào)的信噪比的同時(shí)必然會(huì)引起原始語音信號(hào)的失真。常規(guī)譜減法還會(huì)一幀語音信號(hào)時(shí)域和改為快速傅立葉變換(FastFourier產(chǎn)生較強(qiáng)的