資源描述:
《修后-基于短時自相關法的周期估值(1)》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在工程資料-天天文庫。
1、r<【摘要】MATLAB是一種科學計算的軟件,其具有處理數(shù)據(jù)的重要作用。且MATLAB運用的形式是矩陣形式。另外,MATLAB把性能的數(shù)值計算與可視化集合為一個整體,還提供了大量的A置函數(shù)。也正是因為如此,它在當代科學計算工作、系統(tǒng)控制以及處理信息等領域得到廣泛的應用和研究?!娟P鍵同】清音:濁音:基音周期:自相關函數(shù):研究隨著現(xiàn)代語音處理技術的快速發(fā)展以及檢測方法的進一步提高,其在實施過程屮,想要去除聲音的刺激是否是完整的周期脈沖,與聲道的影響是十分W難的。照此一來,基音周期就進行定位的定位間距是不可能的,或者具冇相當大的困難。除此之外,加上基咅周期的變化范闈比較廣,因此,其個
2、人發(fā)咅的習慣、性別、年齡、發(fā)音力度以及發(fā)音時情感等多重因素都對基音周期定景具冇嚴重的影響,并且不能夠準確確定。照此一來,在這樣的前提下,其健壯和準確的特性就起不到應有的作用。直至今H,還未發(fā)現(xiàn)任何一種萬能方法,能夠確保其在任何情況下都能準確地、可靠地估計出基音的周期。根據(jù)調(diào)查發(fā)現(xiàn),當前運用的主耍方法主耍宥基于傳統(tǒng)的語咅模型,最其代表性的就是G相關法、平均幅度差函數(shù)法、線性預測分析方法、小波變換法及在四種算法上的基礎上的衍生算法等。此外,由于語言的本身的語音聲學性能,加上語言的自然性,其成為當前人類傳播的最有效,最方便的一種方式。在當前信息化盛行的現(xiàn)代,其針對語音處理技術內(nèi)容所做
3、的研究不僅具冇現(xiàn)代意義,吋還冇助于其更冇效的生產(chǎn),運輸,存儲,訪問應用程序以及儲存語咅信息,更重要的一點是還推動了社會發(fā)展,其宥不可替代的重耍作用。因此,有必耍對基音周期估計量進行研究?!闱闆r下,信號與系統(tǒng)中MATLAB應用的方式是通過用符號運算和數(shù)值計算進行仿真分析的。加上信號與系統(tǒng)課程屮的許多內(nèi)容大都是基于公式而進行演算,此外,MATLAB又是借助數(shù)學符號工具箱來為工作提供的運算功能的,這在一定程度上基本滿足設計的實際需求。舉個簡單的例子,解微分方程、傅里葉、拉普拉斯正反及Z的正反變換等均冇所體現(xiàn)。一、關于語音信號時域的簡單分析(一)、語音信號的吋域分析語音信號是一種非平
4、穩(wěn)的吋變信號,攜帶著各種各樣的信息。例如,在語音編碼和語咅合成時,增強了語咅識別和語咅處理,從而提取各種信息中包含的語音。一般來說,語音處理的目的主耍有兩個:第一個是特征提取和分析,基于語音信號進行后續(xù)處理。第二個是語音信號的處理。例如,在竹景噪聲抑制噪聲時,其語音逐漸增強,語音獲得相對比較“干凈”。且在語音合成和拼接平滑分段語音,進行語音合成,以便于獲得更高的主觀質(zhì)量,這個應用程序也是基于語音信號的信息提取和分析的。簡而言之,語咅信號分析的目的是方便高效的提取和進行語音信號的信息。"'根^參數(shù)g型分析,語音信號的分析可以分為:時域分析和頻域(頻域分析,倒譜域)。吋域分析法是最
5、簡單,最直觀的~種方法,其主要是直接對語音信號的吋域波形,平均幅度和短吋能量特征參數(shù)的提取,短時平均過零率,短時間的0相關函數(shù)和短時平均幅度差函數(shù)。(二)、語音信號的預處理實際意義上講,語音信號是模擬信號,從而在對語音信號的數(shù)字處理之前,首先模擬語音信號S(t)t采樣的采樣周期,離散的(N),為Y避免信號頻譜混疊,其根據(jù)帶寬和采樣模擬語音信號定理來確定選擇采樣周期。另外,在語音信號的離散量化過程中還帶來了一定的量化噪聲和失真。數(shù)字語音的方式主要有兩種:正式和非正式。正式是指大型公司釋放語音或者是語音研究機構中對語音數(shù)據(jù)庫的確認等。非正式主要是指個別研究人員記錄在記錄軟件或硬件電
6、路和麥克風隨吋隨地的一些發(fā)音和聲明。通常情況下,作為一個初學者,我們可以先使用多媒體計算機,通過安裝相關的咅頻處理軟件來獲取相應的語咅數(shù)據(jù)文件。由于語音倍號的頻率范圍通常保持在300?3400Hz的范圍之
7、Al,從而一般采樣為頻率為8kHz。其中語音數(shù)據(jù)文件鈕拈:預處理的語音預加重和窗框。且語音信號的預處理數(shù)字語音信號預加重的輸入,其口的是語音的高頻部分明顯加重,去除唇部的輻射,提高語音的頻率分辨率。一階FIR高通數(shù)字濾波器的傳遞函數(shù)來實現(xiàn)預加重的聲咅設置時間Nx(n)的樣品,經(jīng)過預加重的輸出。(三)、語音信號的窗口語音預加重的數(shù)字經(jīng)過濾波處理,然后進行窗框。語音信號本身是一種
8、時間變化的信號,分為濁音和清音兩大類。周期性的基音,表示該信號的幅度和信道參數(shù)是隨吋間進行緩慢變化的。由于發(fā)音器官的慣性運動,可以在短吋間6(通常是10?30ms)確認語咅信號是大致相同的,也就是說語咅信號的短時間其宥穩(wěn)特性。在這種方式屮,可以把語音信號分成若干段(稱為分析框架)分別進行處理。語音信號幀的電纜長度窗口移動加權法。根據(jù)實阪情況,其一般每秒的幀的數(shù)量大約是33?100幀。除此之外,其框架可以用連續(xù)分段處理,主要采用的方法是重疊分割方法,能夠使其平滑。二、關于基音周期估值的基本分析