資源描述:
《一種改進(jìn)的基音周期提取算法.pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。
1、第29卷第2期數(shù)據(jù)采集與處理Vol_29NO.22O14年3月JournalofDataAcquisitionandProcessingMar.2O14文章編號(hào):1004—9037(2014)02—0304—05一種改進(jìn)的基音周期提取算法趙神張盛林孝康(清華大學(xué)深圳研究生院深圳市信息科學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)室,深圳,518055)摘要:基音周期的提取在語(yǔ)音信號(hào)處理領(lǐng)域有著廣泛的應(yīng)用。受基于歸一化自相關(guān)函數(shù)基音周期提取算法和多帶激勵(lì)(Multi—bandexcitation,MBE)聲碼器中基音檢測(cè)算法的啟發(fā),本文提出了一種改進(jìn)的基音周期提取算法。該算法主要由預(yù)處理、時(shí)域基音粗
2、估、基音平滑、時(shí)變?yōu)V波搜索、小數(shù)基音周期估計(jì)等5個(gè)部分組成。實(shí)驗(yàn)表明:該算法能達(dá)到更高的搜索準(zhǔn)確度,得到更加平滑的基音周期曲線;與傳統(tǒng)自相關(guān)檢測(cè)算法相比,該算法有很好的抗噪性。關(guān)鍵詞:基音周期;歸一化自相關(guān);基音平滑;時(shí)變?yōu)V波中圖分類號(hào):TN912.3文獻(xiàn)標(biāo)志碼:AImprovedAlgorithmforPitchPeriodDetectionZhaoYi,ZhangSheng,LinXiaokang(ShenzhenKeyLaboratoryofInformationScienceandTechnology,GraduateSchoolatShenzhen,Tsing
3、huaUniversity,Shenzhen,518055,China)Abstract:Theextractionofpitchperiodhasawiderangeofapplicationsinthefieldofspeechsignalprocessing.Inspiredbytraditionalautocorrelationalgorithmandthepitchdetectionmethodthatusedinmulti—bandexcitation(MBE)vocoder,animprovedalgorithmisputfor—wardforpitchp
4、eriodextraction.Thisalgorithmhasfiveparts:pre—process,pitchroughesti—mationintimedomain,pitchsmoothing,searchwithtimevariablefilter,anddecimalpitches—timation.Experimentalresultsshowthatthisnewalgorithmcanachievehigheraccuracyandcomparedwithtraditionalautocorrelationalgorithm,thisapproac
5、hhasabetternoiseimmuni—ty.Keywords:pitchperiod;normalizedautocorre1ation;pitchsmoothing;timevariablefilter類l_2]:波形估計(jì)法、相關(guān)處理法以及變換法。波形引口估計(jì)法[3直接通過語(yǔ)音時(shí)域上的波形分析周期峰值,算法簡(jiǎn)單,硬件實(shí)現(xiàn)容易,但語(yǔ)音信號(hào)幅度或頻語(yǔ)音信號(hào)的大部分能量集中在濁音信號(hào)中,濁率快速變化時(shí),精度下降很明顯。相關(guān)處理法[4通音信號(hào)呈現(xiàn)準(zhǔn)周期性。稱濁音的周期為基音周期,過比較原始語(yǔ)音和原始語(yǔ)音移位后信號(hào)間的相似在時(shí)域波形里反映為峰值點(diǎn)和峰值點(diǎn)之間的距離。性來(lái)
6、確定基音周期。由于它硬件實(shí)現(xiàn)較為簡(jiǎn)單且基音周期的提取在語(yǔ)音合成、語(yǔ)音識(shí)別、語(yǔ)音編碼具有很強(qiáng)的抗波形相位失真能力,在語(yǔ)音信號(hào)處理等領(lǐng)域有著廣泛的應(yīng)用。由于語(yǔ)音信號(hào)變化的復(fù)中廣泛使用。變換法_5通常是將語(yǔ)音信號(hào)變換到雜性,迄今為止,并未找到一個(gè)完善的適用于不同頻域和倒譜域來(lái)估計(jì),倒譜參數(shù)是一種重要的說話環(huán)境和要求,不同講話者的可靠準(zhǔn)確的檢測(cè)基音周人個(gè)性特征參數(shù),主要反映聲道響應(yīng)的特性_6],效期的辦法_1]。果較好但是算法復(fù)雜。現(xiàn)有的基音周期的檢測(cè)算法大致可以分為三受基于歸一化自相關(guān)函數(shù)基音檢測(cè)算法和收稿日期:2013-02—26;修訂日期:2o13—05—21第2期趙神,
7、等:一種改進(jìn)的基音周期提取算法305多帶激勵(lì)(Multi—bandexcitation,MBE)聲碼器中為4個(gè)步驟:高、低通濾波,基音粗估,基音平滑以基音檢測(cè)算法的啟發(fā),本文提出了一種改進(jìn)的基及基音細(xì)搜索。該算法是在頻域進(jìn)行基音檢測(cè),算音周期檢測(cè)算法,通過計(jì)算歸一化自相關(guān)函數(shù)搜索法準(zhǔn)確度高但是計(jì)算復(fù)雜度也很高。每一語(yǔ)音幀的備選基音周期,利用維特比算法搜索1.3語(yǔ)音信號(hào)頻譜最佳基音轉(zhuǎn)移路徑,平滑基音曲線,在時(shí)域得到的圖1為語(yǔ)音信號(hào)經(jīng)過短時(shí)傅里葉變換后得到粗略基音周期的基礎(chǔ)上,利用時(shí)變?yōu)V波器進(jìn)一步從的三維頻譜圖。圖2將三維轉(zhuǎn)化成了二維,圖中黑