資源描述:
《低信噪比下基于譜熵的語(yǔ)音端點(diǎn)檢測(cè)算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、!""#$%%%&%%’(清華大學(xué)學(xué)報(bào)-自然科學(xué)版.*%%’年第(’卷第$%期*B,+B)#$$&***+,#/012345678329-":2;0<:5.=*%%’=>?@A(’=#?A$%$+CD&$(%%低信噪比下基于譜熵的語(yǔ)音端點(diǎn)檢測(cè)算法李曄=張仁智=崔慧娟=唐昆-清華大學(xué)電子工程系=微波與數(shù)字通信技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室=北京$%%%E(.摘要F為提高語(yǔ)音端點(diǎn)檢測(cè)系統(tǒng)在低信噪!"#$以下%下端點(diǎn)檢測(cè)算法的研究在語(yǔ)音信號(hào)處理領(lǐng)域中一檢測(cè)的準(zhǔn)確率&提出了一種基于譜熵的端點(diǎn)檢測(cè)算法’將每直有著重要的
2、意義G作為語(yǔ)音識(shí)別的前端=準(zhǔn)確的端幀信號(hào)分為()個(gè)子帶&選取頻譜分布在*+",-.+/01并且點(diǎn)檢測(cè)可以提高識(shí)別的準(zhǔn)確率@用于語(yǔ)音增強(qiáng)系統(tǒng)能量不超過(guò)該幀總能量2"3的子帶&計(jì)算經(jīng)過(guò)語(yǔ)音增強(qiáng)后中=可以進(jìn)行準(zhǔn)確的噪聲模型估計(jì)@在語(yǔ)音編碼領(lǐng)的子帶能量以及各子帶信噪比&根據(jù)各子帶信噪比的不同調(diào)域中可以降低編碼的平均比特率并降低功耗G目前整其在整個(gè)譜熵計(jì)算過(guò)程中的權(quán)重&然后平滑譜熵&以最終的端點(diǎn)檢測(cè)算法在較高的信噪比下均能給出較高的的譜熵作為端點(diǎn)檢測(cè)的依據(jù)’實(shí)驗(yàn)結(jié)果表明&此方法在較低檢測(cè)率=但是在低信噪比下
3、卻不夠理想G傳統(tǒng)的能量的信噪比下能夠顯著地提高端點(diǎn)檢測(cè)的準(zhǔn)確率’對(duì)坦克噪和過(guò)零率特征在低信噪比下已不再穩(wěn)健G許多新的聲&檢測(cè)效果明顯優(yōu)于4.5*2中的端點(diǎn)檢測(cè)算法&即使在特征被提出=比如F基于多特征聯(lián)合的方法A$B=基于6+#$的信噪比下&仍然可以達(dá)到2+3以上的檢測(cè)率’頻域能量的特征A*B=基于差分能量和差分過(guò)零率的關(guān)鍵詞F語(yǔ)音信號(hào)處理7端點(diǎn)檢測(cè)7譜熵7語(yǔ)音增強(qiáng)7信特征A+BA(B=基于排序幅度譜的特征=基于高階統(tǒng)計(jì)量噪比的特征A’BABB等等G=基于高頻能量和低頻能量的特征中圖分類號(hào)F0#C$
4、*A+文獻(xiàn)標(biāo)識(shí)碼FN以上的多種特征在低信噪比噪下檢測(cè)準(zhǔn)確度仍然不文章編號(hào)F$%%%&%%’(-*%%’.$%&$+CD&%(夠理想G考慮到=即使在很低的信噪比下=語(yǔ)音幀中仍然存在信噪比較高的子帶=而噪聲幀則不具備這個(gè)特點(diǎn)=本文提出了一種新的基于子帶選取=帶有加OPQRSTRUQVQUWXSUSRUQPYTZ[PQU]^_QU]權(quán)因子的子帶能量計(jì)算=模糊子帶加權(quán)和譜熵自適ZP_‘Q[YTZaUPaYPQ‘STUQP‘bT‘SX應(yīng)平滑的算法=大量的試驗(yàn)結(jié)果表明=在不同的噪聲PYU]S‘cSRUd
5、^SYUPcW環(huán)境和信噪比下=算法具有很好的的性能Gefgh=ijklmnhopqr=stfjurvuwo=xklmyuo(算法描述-zUTUS{SW
6、TbPTUPWP}~QRP_TVSTYX!Q[QUTZ"P^^dYQRTUQPY‘=!ScTU^SYUP}#ZSRUPYQR#Y[QYSSQY[=$‘QY[]dT%YQVS‘QUW=(A(子帶選取準(zhǔn)則&SQ’QY[()))*+="]QYT.語(yǔ)音抽樣頻率為E867=幀長(zhǎng)為*%I1=進(jìn)行,b‘UTRUF>?2:<7:L292L-M7、<:L2?3->N..23@?/12437@&L?&3?21<*’B點(diǎn)的;;0變換G首先將%C(867的全頻段化成07L2?-"#1.<3920?3I<3L1212I20?98、頻帶的能量<3<042<13<@?/C%9?4L59、<1L0<16@L1度值G15?/L57LL53?215215213