資源描述:
《基于dsp的語(yǔ)音信號(hào)處理系統(tǒng)設(shè)計(jì)設(shè)計(jì)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、摘要語(yǔ)音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)和語(yǔ)音學(xué)知識(shí)對(duì)語(yǔ)音信號(hào)進(jìn)行處理的新興的學(xué)科,是目前發(fā)展最為迅速的信息科學(xué)研究領(lǐng)域的核心技術(shù)之一。通過(guò)語(yǔ)音傳遞信息是人類最重要、最有效、最常用和最方便的交換信息形式。數(shù)字信號(hào)處理(DigitalSignalProcessing,簡(jiǎn)稱DSP)是利用計(jì)算機(jī)或?qū)S锰幚碓O(shè)備,以數(shù)字形式對(duì)信號(hào)進(jìn)行采集、變換、濾波、估值、增強(qiáng)、壓縮、識(shí)別等處理,以得到符合人們需要的信號(hào)形式。Matlab語(yǔ)言是一種數(shù)據(jù)分析和處理功能十分強(qiáng)大的計(jì)算機(jī)應(yīng)用軟件,它可以將聲音文件變換為離散的數(shù)據(jù)文件,然后利用其強(qiáng)大的矩陣運(yùn)算
2、能力處理數(shù)據(jù),如數(shù)字濾波、傅里葉變換、時(shí)域和頻域分析、聲音回放以及各種圖的呈現(xiàn)等,它的信號(hào)處理與分析工具箱為語(yǔ)音信號(hào)分析提供了十分豐富的功能函數(shù),利用這些功能函數(shù)可以快捷而又方便地完成語(yǔ)音信號(hào)的處理和分析以及信號(hào)的可視化,使人機(jī)交互更加便捷。信號(hào)處理是Matlab重要應(yīng)用的領(lǐng)域之一。本設(shè)計(jì)針對(duì)現(xiàn)在大部分語(yǔ)音處理軟件內(nèi)容繁多、操作不便等問(wèn)題,采用MATLAB7.0綜合運(yùn)用GUI界面設(shè)計(jì)、各種函數(shù)調(diào)用等來(lái)實(shí)現(xiàn)語(yǔ)音信號(hào)的變頻、傅里葉變換及濾波,程序界面簡(jiǎn)練,操作簡(jiǎn)便,具有一定的實(shí)際應(yīng)用意義。關(guān)鍵字:Matlab,語(yǔ)音信號(hào),傅里葉變換
3、,信號(hào)處理I1緒論1.1課題的背景與意義通過(guò)語(yǔ)音傳遞信息是人類最重要、最有效、最常用和最方便的交換信息的形式。語(yǔ)言是人類持有的功能。聲音是人類常用的工具,是相互傳遞信息的最主要的手段。因此,語(yǔ)音信號(hào)是人們構(gòu)成思想疏通和感情交流的最主要的途徑。并且,由于語(yǔ)言和語(yǔ)音與人的智力活動(dòng)密切相關(guān),與社會(huì)文化和進(jìn)步緊密相連,所以它具有最大的信息容量和最高的智能水平?,F(xiàn)在,人類已開(kāi)始進(jìn)入了信息化時(shí)代,用現(xiàn)代手段研究語(yǔ)音信號(hào),使人們能更加有效地產(chǎn)生、傳輸、存儲(chǔ)、獲取和應(yīng)用語(yǔ)音信息,這對(duì)于促進(jìn)社會(huì)的發(fā)展具有十分重要的意義。讓計(jì)算機(jī)能聽(tīng)懂人類的語(yǔ)言
4、,是人類自計(jì)算機(jī)誕生以來(lái)夢(mèng)寐以求的想法。隨著計(jì)算機(jī)越來(lái)越向便攜化方向發(fā)展,隨著計(jì)算環(huán)境的日趨復(fù)雜化,人們?cè)絹?lái)越迫切要求擺脫鍵盤的束縛而代之以語(yǔ)音輸人這樣便于使用的、自然的、人性化的輸人方式。作為高科技應(yīng)用領(lǐng)域的研究熱點(diǎn),語(yǔ)音信號(hào)采集與分析從理論的研究到產(chǎn)品的開(kāi)發(fā)已經(jīng)走過(guò)了幾十個(gè)春秋并且取得了長(zhǎng)遠(yuǎn)的進(jìn)步。它正在直接與辦公、交通、金融、公安、商業(yè)、旅游等行業(yè)的語(yǔ)音咨詢與管理。工業(yè)生產(chǎn)部門的語(yǔ)聲控制,電話、電信系統(tǒng)的自動(dòng)撥號(hào)、輔助控制與查詢以及醫(yī)療衛(wèi)生和福利事業(yè)的生活支援系統(tǒng)等各種實(shí)際應(yīng)用領(lǐng)域相接軌,并且有望成為下一代操作系統(tǒng)和應(yīng)用
5、程序的用戶界面??梢?jiàn),語(yǔ)音信號(hào)采集與分析的研究將是一項(xiàng)極具市場(chǎng)價(jià)值和挑戰(zhàn)性的工作。我們今天進(jìn)行這一領(lǐng)域的研究與開(kāi)拓就是要讓語(yǔ)音信號(hào)處理技術(shù)走入人們的日常生活當(dāng)中,并不斷朝更高目標(biāo)而努力。語(yǔ)音信號(hào)采集與分析之所以能夠那樣長(zhǎng)期地、深深地吸引廣大科學(xué)工作者去不斷地對(duì)其進(jìn)行研究和探討,除了它的實(shí)用性之外,另一個(gè)重要原因是,它始終與當(dāng)時(shí)信息科學(xué)中最活躍的前沿學(xué)科保持密切的聯(lián)系,并且一起發(fā)展。語(yǔ)音信號(hào)采集與分析是以語(yǔ)音語(yǔ)言學(xué)和數(shù)字信號(hào)處理為基礎(chǔ)而形成的一門涉及面很廣的綜合性學(xué)科,與心理、生理學(xué)、計(jì)算機(jī)科學(xué)、通信與信息科學(xué)以及模式識(shí)別和人工
6、智能等學(xué)科都有著非常密切的關(guān)系。對(duì)語(yǔ)音信號(hào)采集與分析的研究一直是數(shù)字信號(hào)處理技術(shù)發(fā)展的重要推動(dòng)力量。因?yàn)樵S多處理的新方法的提出,首先是在語(yǔ)音信號(hào)處理中獲得成功,然后再推廣到其他領(lǐng)域。1.2國(guó)內(nèi)外研究現(xiàn)狀語(yǔ)音信號(hào)的采集與分析35作為一個(gè)重要的研究領(lǐng)域,已經(jīng)有很長(zhǎng)的研究歷史。但是它的快速發(fā)展可以說(shuō)是從1940年前后Dudley的聲碼器(vocoder)和potter等人的可見(jiàn)語(yǔ)音(VisibleSpeech)開(kāi)始的。1952年貝爾(Bell)實(shí)驗(yàn)室的Davis等人首次研制成功能識(shí)別十個(gè)英語(yǔ)數(shù)字的實(shí)驗(yàn)裝置。1956年Olson和Be
7、lar等人采用8個(gè)帶通濾波器組提取頻譜參數(shù)作為語(yǔ)音的特征,研制成功一臺(tái)簡(jiǎn)單的語(yǔ)音打字機(jī)。20世紀(jì)60年代初由于Faut和Steven的努力,奠定了語(yǔ)音生成理論的基礎(chǔ),在此基礎(chǔ)上語(yǔ)音合成的研究得到了扎實(shí)的進(jìn)展。20世紀(jì)60年代中期形成的一系列數(shù)字信號(hào)處理方法和技術(shù),如數(shù)字濾波器、快速博里葉變換(FFT)等成為語(yǔ)音信號(hào)數(shù)字處理的理論和技術(shù)基礎(chǔ)。在方法上,隨著電子計(jì)算機(jī)的發(fā)展,以往的以硬件為中心的研究逐漸轉(zhuǎn)化為以軟件為主的處理研究。然而,在語(yǔ)音識(shí)別領(lǐng)域內(nèi),初期有幾種語(yǔ)音打字機(jī)的研究也很活躍,但后來(lái)已全部停了下來(lái),這說(shuō)明了當(dāng)時(shí)人們對(duì)話
8、音識(shí)別難度的認(rèn)識(shí)得到了加深。所以1969年美國(guó)貝爾研究所的Pierce感嘆地說(shuō)“語(yǔ)音識(shí)別向何處去?”。到了1970年,好似反駁Pierce的批評(píng),單詞識(shí)別裝置開(kāi)始了實(shí)用化階段,其后實(shí)用化的進(jìn)程進(jìn)一步高漲,實(shí)用機(jī)的生產(chǎn)銷售也上了軌道。此外社會(huì)上所宣傳的聲紋(VoicePrint