基于改進算法的基音檢測及其應用

基于改進算法的基音檢測及其應用

ID:38113257

大?。?26.61 KB

頁數(shù):6頁

時間:2019-05-25

基于改進算法的基音檢測及其應用_第1頁
基于改進算法的基音檢測及其應用_第2頁
基于改進算法的基音檢測及其應用_第3頁
基于改進算法的基音檢測及其應用_第4頁
基于改進算法的基音檢測及其應用_第5頁
資源描述:

《基于改進算法的基音檢測及其應用》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、26高職論叢2008年3月基于改進算法的基音檢測及其應用張慶芳,劉正,黃英(蘇州經(jīng)貿(mào)職業(yè)技術(shù)學院江蘇蘇州215009)摘要:語音信號的基音周期在語音壓縮編碼、語音分析與合成、語音識別和說話者確認等方面是很重要的參數(shù)。到目前為止,還沒有一種方法能在不同的話者、不同的環(huán)境下都達到最佳的效果。根據(jù)漢語語音信號的特點,本文首先對語音進行濾波處理、中心削波處理來濾除語音中高次諧波成分及高頻噪聲,接著利用修正自相關(guān)函數(shù)提取語音基音周期,最后對所得的結(jié)果進行平滑處理。實驗結(jié)果顯示改進算法提高了基音提取的可靠性,最后本文在改進算法的基礎上進行了聲調(diào)識別。關(guān)鍵詞:語音;基音;自相

2、關(guān);聲調(diào)ApplicationofImprovedAlgorithmbasedonPitchDetectionAbstract:BSTRACTPitchperiodisacrucialspeechparameterinmanyapplicationssuchasspeechcompresscod2ing,analysisandsynthesis,speechsegmentationandautomaticisolatedwordrecognitionetc.Untilnow,thereisnomethodthatcandetectthepitchperiodpe

3、rfectinanyconditions.InthelightofthepropertiesofChinesespeech,thispaperpresentsamethodwithshort-timeauto-correlationtodetectthepitch,thenthepapergetsthetonebasedonthepitch.Keywords:Speech;Pitch;Auto-correlation;tone1引言漢語是一種“聲調(diào)語言”。在用漢語相互交談中,人們不但憑不同的聲母、韻母(或元音,輔音)來辨別字和詞的意義,還需要從不同的聲調(diào)來區(qū)別它

4、們,這就是“聲調(diào)語言”的特點。例如,星(xīng),行(xíng),醒(xǐng),姓(xìng)這四個字的音中,聲母和韻母都是相同的,但意義不同,這正是聲調(diào)不同所致。再如:樹木,書目等的區(qū)別,也是靠聲調(diào)來實現(xiàn)的。因此漢語的聲調(diào)具有辨義的功能,它和輔音、元音在語音的區(qū)別特征上同樣重要。目前聲調(diào)識別有很多方法,但一般都基于基音的輪廓信息?;羰侵嘎晭д饎拥幕l,它是隨著時間和發(fā)音高低而不斷變化的?;糇兓牟煌壽E也就是我們所說的聲調(diào)。因此聲調(diào)識別是以提取基音為基礎的。本文首先利用一種改進的自相關(guān)算法來提取基音,然后在此基礎上進行聲調(diào)的識別。2基音周期檢測211短

5、時自相關(guān)函數(shù)一個時間離散確定信號的自相關(guān)函數(shù)定義為:∞?(k)=6x(m)x(m+k)(1)-∞如果信號是隨機的或周期性的,這時的定義是∞1?(k)=lim6x(m)x(m+k)(2)N→∞2N+1-∞在任一種情況下,信號的自關(guān)函數(shù)表示法都是描述信號一定特征的一種方便的方法。例如,如果信第1期總第11期張慶芳,劉正,黃英:基于改進算法的基音檢測及其應用27號是以P個抽樣為周期的,那么很容易給出?(k)=?(k+P)(3)也就是說,周期信號的自相關(guān)函數(shù)也以同樣的周期為周期。自相關(guān)函數(shù)的其它重要特性為:1)它是一個偶函數(shù),即?(k)=?(-k)。2)在k=0達到它的

6、最大值,即所有的k來說

7、?(k)

8、≤?(0)。3)對確定信號,數(shù)量?(0)等于能量(式(1)),對隨機或周期信號,它等于平均功率。因此,自相關(guān)函數(shù)相當于一個特殊情況的能量。而更為重要的是它是表示周期性的一個方便方法。如果我們將特性1和特性2結(jié)合起來一起來考慮式(3),我們將會看到,樣0,±P,±2P,??周期信號的自相關(guān)函數(shù)達到最大值。也就是,可以不用考慮信號的起始時間,而借確定自相關(guān)函數(shù)中的第一個最大值的位置來估計其周期。212修正的短時自相關(guān)函數(shù)周期性的峰峰值幅度隨滯后時間k的增加而逐漸下降。這是因為用式(2)計算短時自相關(guān)時,隨著k的增加,滯后積的數(shù)目(它

9、等于N-k)將減少,而短時自相關(guān)等于滯后積之和。不同長度的幀的短時自相關(guān)圖:隨著窗口(N)的減小,將不能檢測出周期。(如圖1所示)圖1取不同幀長所得到的短時自相關(guān)圖另外,在語音信號處理中,計算自相關(guān)函數(shù)所用的窗口長度與平均能量等情況略有不同。這里N至少要大于基音周期的二倍,否則將找不到第二個最大值點(除R(0)以外的最近的一個最大值點)。另一方面,N值也要盡可能地小;因為語音信號的特性是變化的,如N過大將影響短時性。理論上,語音的頻率的范圍大約在70-500Hz,即2-14129ms。而在檢測語音基音周期時,一幀語音中應包含有2個以上的周期才可檢測出基音周期。即

10、采樣頻率為111025K

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。