資源描述:
《基于倒譜修正模型的語(yǔ)音基音檢測(cè)算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、第31卷第4期南京理工大學(xué)學(xué)報(bào)Vol.31No.42007年8月JournalofNanjingUniversityofScienceandTechnologyAug.2007基于倒譜修正模型的語(yǔ)音基音檢測(cè)算法1,21曾毓敏,吳鎮(zhèn)揚(yáng)(1.東南大學(xué)信息科學(xué)與工程學(xué)院,江蘇南京210096;2.南京師范大學(xué)物理科學(xué)與技術(shù)學(xué)院,江蘇南京210097)摘要:該文提出了一種基于修正倒譜模型的改進(jìn)的倒譜基音檢測(cè)算法。該算法首先對(duì)分幀語(yǔ)音進(jìn)行10階線性預(yù)測(cè)編碼(LPC)分析和逆濾波,獲得LPC預(yù)測(cè)殘差;然后對(duì)殘
2、差信號(hào)進(jìn)行倒譜分析,倒譜分析中采用了離散傅里葉變換頻譜的高頻分量置零的計(jì)算措施;最后根據(jù)倒譜的特征求得濁音語(yǔ)音的基音周期。仿真檢測(cè)結(jié)果表明:該算法無(wú)論對(duì)純凈語(yǔ)音,還是對(duì)不同加噪情況下的含噪語(yǔ)音,其基音檢測(cè)結(jié)果都明顯優(yōu)于傳統(tǒng)倒譜基音檢測(cè)算法,并且也明顯優(yōu)于基于平均幅度差函數(shù)的基音檢測(cè)算法,而略優(yōu)于基于自相關(guān)函數(shù)的基音檢測(cè)算法。關(guān)鍵詞:基音;倒譜;線性預(yù)測(cè)編碼;預(yù)測(cè)殘差中圖分類號(hào):TN912.3文章編號(hào):1005-9830(2007)04-0503-06SpeechPitchDetectionAlgo
3、rithmBasedonModifiedCepstrumModel1,21ZENGYu2min,WUZhen2yang(1.SchoolofInformationScienceandEngineering,SoutheastUniversity,Nanjing210096,China;2.SchoolofPhysicsandTechnology,NanjingNormalUniversity,Nanjing210097,China)Abstract:Animprovedspeechpitchdet
4、ectionalgorithmbasedonmodifiedcepstrummodelispro2posed.Intheproposedalgorithm,aten2orderLPC(linearpredictivecoding)analysisisperformedonasegmentedspeech,andthesegmentedspeechisfilteredbytheinversefiltertogivetheLPCpredic2tiveresidual.Thecepstrumofthep
5、redictiveresidualiscalculatedwiththesimplemethodofthehighfrequencyspectralcomponentsofDFTbeingsettozero.Thepitchperiodofthevoicedspeechisex2tractedfromthecepstrumofpredictiveresidual.Thesimulatedpitchdetectionresultsshowthatthepitchextractionerrorofth
6、eproposedalgorithmissignificantlylowerthanthatoftheconventionalcep2strumbasedalgorithmbothforcleanspeechanddifferentnoisyspeech.Theperformanceofthepro2posedalgorithmisalsomuchbetterthanthatoftheaveragemagnitudedifferencefunctionbasedpitchdetectionalgo
7、rithmandslightlybetterthanthatofthebasicautocorrelationfunctionbasedalgorithm.Keywords:pitch;cepstrum;linearpredictivecoding;predictivepesidual[1-5]基音周期是語(yǔ)音信號(hào)最重要的參數(shù)之一。到detectionalgorithm,簡(jiǎn)稱PDA)被提出,但至今目前為止已經(jīng)有各種各樣的基音檢測(cè)算法(Pitch沒(méi)有一種算法,可以對(duì)各類人群和各種環(huán)境條件情收稿日期:2
8、006-05-28修回日期:2007-04-27基金項(xiàng)目:國(guó)家973計(jì)劃項(xiàng)目(2002CB312102);江蘇省高校自然科學(xué)基礎(chǔ)研究項(xiàng)目(07KJD510110)作者簡(jiǎn)介:曾毓敏(1962-),男,副教授,博士生,主要研究方向:語(yǔ)音與音頻信號(hào)處理,E2mail:zengyumin@njnu.edu.cn;通訊作者:吳鎮(zhèn)揚(yáng)(1949-),男,教授,博士生導(dǎo)師,主要研究方向:視覺(jué)與聽(tīng)覺(jué)信號(hào)處理,通信信號(hào)處理,E2mail:zhenyang@seu.edu.cn。504南京理工大學(xué)學(xué)報(bào)第