語音識別設(shè)計

語音識別設(shè)計

ID:861154

大小:127.54 KB

頁數(shù):25頁

時間:2017-09-21

語音識別設(shè)計_第1頁
語音識別設(shè)計_第2頁
語音識別設(shè)計_第3頁
語音識別設(shè)計_第4頁
語音識別設(shè)計_第5頁
資源描述:

《語音識別設(shè)計》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、語音識別設(shè)計特定人語音識別設(shè)計的研究……………………………………………1摘要………………………………………………………………………2Abstract…………………………………………………………………...3目錄……………………………………………………………………...4第一章緒論……………………………………………………………..51.1語音識別技術(shù)的歷史………………………………………61.2語音識別技術(shù)的現(xiàn)狀……………………………………...71.3語音識別技術(shù)的發(fā)展趨向…………………………………8第二章特定語音識別芯片

2、介紹……………………………..92.1凌陽SPCE061A芯片……………………………………102.2RSC系列芯片……………..……………………………..112.3芯片WS—100系列………………………………………12第三章特定人語音識別產(chǎn)品開發(fā)……………………………………133.1特定人語音識別技術(shù)的開發(fā)流程………………………..143.2特定人語音識別技術(shù)中的難點…………………………..15第四章結(jié)論及展望……………………………………………………16參考文獻………………………………………………………………..17致謝

3、…………………………………………………………………….18摘要摘?要:回顧語音識別技術(shù)的發(fā)展歷史,調(diào)查數(shù)家語音識別芯片的產(chǎn)品,了解語音識別的開發(fā)流程,并對語音識別技術(shù)面臨的問題和發(fā)展前景進行了討論。關(guān)鍵詞:語音識別;語音芯片;開發(fā)流程;技術(shù)難點;AbstractAbstract:Reviewthehistoryofvoicerecognitiontechnology,theinvestigationofseveralspeechrecognitionchipproducts,tounderstandthedevelopm

4、entprocessforspeechrecognition,andvoicerecognitiontechnologyproblemsanddevelopmentprospectswerediscussed.Keywords:speechrecognition;voicechip;developmentprocess;technicaldifficulties第一章緒論1.1語音識別技術(shù)的歷史(1)國內(nèi)研究歷史  我國語音識別研究工作起步于五十年代,但近年來發(fā)展很快。研究水平也從實驗室逐步走向?qū)嵱谩?987年開始執(zhí)行

5、國家863計劃后,國家863智能計算機專家組為語音識別技術(shù)研究專門立項,每兩年滾動一次。我國語音識別技術(shù)的研究水平已經(jīng)基本上與國外同步,在漢語語音識別技術(shù)上還有自己的特點與優(yōu)勢,并達到國際先進水平。中科院自動化所、聲學所、清華大學、北京大學、哈爾濱工業(yè)大學、上海交通大學、中國科技大學、北京郵電大學、華中科技大學等科研機構(gòu)都有實驗室進行過語音識別方面的研究,其中具有代表性的研究單位為清華大學電子工程系與中科院自動化研究所模式識別國家重點實驗室?! ∏迦A大學電子工程系語音技術(shù)與專用芯片設(shè)計課題組,研發(fā)的非特定人漢語數(shù)碼串連續(xù)

6、語音識別系統(tǒng)的識別精度,達到94.8%(不定長數(shù)字串)和96.8%(定長數(shù)字串)。在有5%的拒識率情況下,系統(tǒng)識別率可以達到96.9%(不定長數(shù)字串)和98.7%(定長數(shù)字串),這是目前國際最好的識別結(jié)果之一,其性能已經(jīng)接近實用水平。研發(fā)的5000詞郵包校核非特定人連續(xù)語音識別系統(tǒng)的識別率達到98.73%,前三選識別率達99.96%;并且可以識別普通話與四川話兩種語言,達到實用要求。中科院自動化所及其所屬模式科技(Pattek)公司2002年發(fā)布了他們共同推出的面向不同計算平臺和應(yīng)用的“天語”中文語音系列產(chǎn)品——Patt

7、ekASR,結(jié)束了中文語音識別產(chǎn)品自1998年以來一直由國外公司壟斷的歷史。(1)國外研究歷史  語音識別的研究工作可以追溯到20世紀50年代AT&T貝爾實驗室的Audry系統(tǒng),它是第一個可以識別十個英文數(shù)字的語音識別系統(tǒng)?! 〉嬲〉脤嵸|(zhì)性進展,并將其作為一個重要的課題開展研究則是在60年代末70年代初。這首先是因為計算機技術(shù)的發(fā)展為語音識別的實現(xiàn)提供了硬件和軟件的可能,更重要的是語音信號線性預測編碼(LPC)技術(shù)和動態(tài)時間規(guī)整(DTW)技術(shù)的提出,有效的解決了語音信號的特征提取和不等長匹配問題。這一時期的語音識別主

8、要基于模板匹配原理,研究的領(lǐng)域局限在特定人,小詞匯表的孤立詞識別,實現(xiàn)了基于線性預測倒譜和DTW技術(shù)的特定人孤立詞語音識別系統(tǒng);同時提出了矢量量化(VQ)和隱馬爾可夫模型(HMM)理論。  隨著應(yīng)用領(lǐng)域的擴大,小詞匯表、特定人、孤立詞等這些對語音識別的約束條件需要放寬,與此同時也帶來了許多新的問題:第一,詞匯表的擴大

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。