基于dsp的語音信號處理系統(tǒng)設計

基于dsp的語音信號處理系統(tǒng)設計

ID:14970270

大小:493.00 KB

頁數(shù):65頁

時間:2018-07-31

基于dsp的語音信號處理系統(tǒng)設計_第1頁
基于dsp的語音信號處理系統(tǒng)設計_第2頁
基于dsp的語音信號處理系統(tǒng)設計_第3頁
基于dsp的語音信號處理系統(tǒng)設計_第4頁
基于dsp的語音信號處理系統(tǒng)設計_第5頁
資源描述:

《基于dsp的語音信號處理系統(tǒng)設計》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫

1、摘要語音信號處理是研究用數(shù)字信號處理技術和語音學知識對語音信號進行處理的新興的學科,是目前發(fā)展最為迅速的信息科學研究領域的核心技術之一。通過語音傳遞信息是人類最重要、最有效、最常用和最方便的交換信息形式。數(shù)字信號處理(DigitalSignalProcessing,簡稱DSP)是利用計算機或?qū)S锰幚碓O備,以數(shù)字形式對信號進行采集、變換、濾波、估值、增強、壓縮、識別等處理,以得到符合人們需要的信號形式。Matlab語言是一種數(shù)據(jù)分析和處理功能十分強大的計算機應用軟件,它可以將聲音文件變換為離散的數(shù)據(jù)文件,然后利用其強大的矩陣運算能力處理數(shù)據(jù),如數(shù)字濾波、傅里葉變換、時域和頻域分析、聲音回放以及各

2、種圖的呈現(xiàn)等,它的信號處理與分析工具箱為語音信號分析提供了十分豐富的功能函數(shù),利用這些功能函數(shù)可以快捷而又方便地完成語音信號的處理和分析以及信號的可視化,使人機交互更加便捷。信號處理是Matlab重要應用的領域之一。本設計針對現(xiàn)在大部分語音處理軟件內(nèi)容繁多、操作不便等問題,采用MATLAB7.0綜合運用GUI界面設計、各種函數(shù)調(diào)用等來實現(xiàn)語音信號的變頻、傅里葉變換及濾波,程序界面簡練,操作簡便,具有一定的實際應用意義。關鍵字:Matlab,語音信號,傅里葉變換,信號處理I1緒論1.1課題的背景與意義通過語音傳遞信息是人類最重要、最有效、最常用和最方便的交換信息的形式。語言是人類持有的功能。聲音

3、是人類常用的工具,是相互傳遞信息的最主要的手段。因此,語音信號是人們構成思想疏通和感情交流的最主要的途徑。并且,由于語言和語音與人的智力活動密切相關,與社會文化和進步緊密相連,所以它具有最大的信息容量和最高的智能水平?,F(xiàn)在,人類已開始進入了信息化時代,用現(xiàn)代手段研究語音信號,使人們能更加有效地產(chǎn)生、傳輸、存儲、獲取和應用語音信息,這對于促進社會的發(fā)展具有十分重要的意義。讓計算機能聽懂人類的語言,是人類自計算機誕生以來夢寐以求的想法。隨著計算機越來越向便攜化方向發(fā)展,隨著計算環(huán)境的日趨復雜化,人們越來越迫切要求擺脫鍵盤的束縛而代之以語音輸人這樣便于使用的、自然的、人性化的輸人方式。作為高科技應用

4、領域的研究熱點,語音信號采集與分析從理論的研究到產(chǎn)品的開發(fā)已經(jīng)走過了幾十個春秋并且取得了長遠的進步。它正在直接與辦公、交通、金融、公安、商業(yè)、旅游等行業(yè)的語音咨詢與管理。工業(yè)生產(chǎn)部門的語聲控制,電話、電信系統(tǒng)的自動撥號、輔助控制與查詢以及醫(yī)療衛(wèi)生和福利事業(yè)的生活支援系統(tǒng)等各種實際應用領域相接軌,并且有望成為下一代操作系統(tǒng)和應用程序的用戶界面??梢姡Z音信號采集與分析的研究將是一項極具市場價值和挑戰(zhàn)性的工作。我們今天進行這一領域的研究與開拓就是要讓語音信號處理技術走入人們的日常生活當中,并不斷朝更高目標而努力。語音信號采集與分析之所以能夠那樣長期地、深深地吸引廣大科學工作者去不斷地對其進行研究和

5、探討,除了它的實用性之外,另一個重要原因是,它始終與當時信息科學中最活躍的前沿學科保持密切的聯(lián)系,并且一起發(fā)展。語音信號采集與分析是以語音語言學和數(shù)字信號處理為基礎而形成的一門涉及面很廣的綜合性學科,與心理、生理學、計算機科學、通信與信息科學以及模式識別和人工智能等學科都有著非常密切的關系。對語音信號采集與分析的研究一直是數(shù)字信號處理技術發(fā)展的重要推動力量。因為許多處理的新方法的提出,首先是在語音信號處理中獲得成功,然后再推廣到其他領域。1.2國內(nèi)外研究現(xiàn)狀語音信號的采集與分析63作為一個重要的研究領域,已經(jīng)有很長的研究歷史。但是它的快速發(fā)展可以說是從1940年前后Dudley的聲碼器(voc

6、oder)和potter等人的可見語音(VisibleSpeech)開始的。1952年貝爾(Bell)實驗室的Davis等人首次研制成功能識別十個英語數(shù)字的實驗裝置。1956年Olson和Belar等人采用8個帶通濾波器組提取頻譜參數(shù)作為語音的特征,研制成功一臺簡單的語音打字機。20世紀60年代初由于Faut和Steven的努力,奠定了語音生成理論的基礎,在此基礎上語音合成的研究得到了扎實的進展。20世紀60年代中期形成的一系列數(shù)字信號處理方法和技術,如數(shù)字濾波器、快速博里葉變換(FFT)等成為語音信號數(shù)字處理的理論和技術基礎。在方法上,隨著電子計算機的發(fā)展,以往的以硬件為中心的研究逐漸轉(zhuǎn)化為

7、以軟件為主的處理研究。然而,在語音識別領域內(nèi),初期有幾種語音打字機的研究也很活躍,但后來已全部停了下來,這說明了當時人們對話音識別難度的認識得到了加深。所以1969年美國貝爾研究所的Pierce感嘆地說“語音識別向何處去?”。到了1970年,好似反駁Pierce的批評,單詞識別裝置開始了實用化階段,其后實用化的進程進一步高漲,實用機的生產(chǎn)銷售也上了軌道。此外社會上所宣傳的聲紋(VoicePrint

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。