資源描述:
《語音識別設(shè)計》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、語音識別設(shè)計特定人語音識別設(shè)計的研究……………………………………………1摘要………………………………………………………………………2Abstract…………………………………………………………………...3目錄……………………………………………………………………...4第一章緒論……………………………………………………………..51.1語音識別技術(shù)的歷史………………………………………61.2語音識別技術(shù)的現(xiàn)狀……………………………………...71.3語音識別技術(shù)的發(fā)展趨向…………………………………8第二章特定語音識別芯片
2、介紹……………………………..92.1凌陽SPCE061A芯片……………………………………102.2RSC系列芯片……………..……………………………..112.3芯片WS—100系列………………………………………12第三章特定人語音識別產(chǎn)品開發(fā)……………………………………133.1特定人語音識別技術(shù)的開發(fā)流程………………………..143.2特定人語音識別技術(shù)中的難點…………………………..15第四章結(jié)論及展望……………………………………………………16參考文獻………………………………………………………………..17致謝
3、…………………………………………………………………….18摘要摘?要:回顧語音識別技術(shù)的發(fā)展歷史,調(diào)查數(shù)家語音識別芯片的產(chǎn)品,了解語音識別的開發(fā)流程,并對語音識別技術(shù)面臨的問題和發(fā)展前景進行了討論。關(guān)鍵詞:語音識別;語音芯片;開發(fā)流程;技術(shù)難點;AbstractAbstract:Reviewthehistoryofvoicerecognitiontechnology,theinvestigationofseveralspeechrecognitionchipproducts,tounderstandthedevelopm
4、entprocessforspeechrecognition,andvoicerecognitiontechnologyproblemsanddevelopmentprospectswerediscussed.Keywords:speechrecognition;voicechip;developmentprocess;technicaldifficulties第一章緒論1.1語音識別技術(shù)的歷史(1)國內(nèi)研究歷史 我國語音識別研究工作起步于五十年代,但近年來發(fā)展很快。研究水平也從實驗室逐步走向?qū)嵱谩?987年開始執(zhí)行
5、國家863計劃后,國家863智能計算機專家組為語音識別技術(shù)研究專門立項,每兩年滾動一次。我國語音識別技術(shù)的研究水平已經(jīng)基本上與國外同步,在漢語語音識別技術(shù)上還有自己的特點與優(yōu)勢,并達到國際先進水平。中科院自動化所、聲學所、清華大學、北京大學、哈爾濱工業(yè)大學、上海交通大學、中國科技大學、北京郵電大學、華中科技大學等科研機構(gòu)都有實驗室進行過語音識別方面的研究,其中具有代表性的研究單位為清華大學電子工程系與中科院自動化研究所模式識別國家重點實驗室?! ∏迦A大學電子工程系語音技術(shù)與專用芯片設(shè)計課題組,研發(fā)的非特定人漢語數(shù)碼串連續(xù)
6、語音識別系統(tǒng)的識別精度,達到94.8%(不定長數(shù)字串)和96.8%(定長數(shù)字串)。在有5%的拒識率情況下,系統(tǒng)識別率可以達到96.9%(不定長數(shù)字串)和98.7%(定長數(shù)字串),這是目前國際最好的識別結(jié)果之一,其性能已經(jīng)接近實用水平。研發(fā)的5000詞郵包校核非特定人連續(xù)語音識別系統(tǒng)的識別率達到98.73%,前三選識別率達99.96%;并且可以識別普通話與四川話兩種語言,達到實用要求。中科院自動化所及其所屬模式科技(Pattek)公司2002年發(fā)布了他們共同推出的面向不同計算平臺和應(yīng)用的“天語”中文語音系列產(chǎn)品——Patt
7、ekASR,結(jié)束了中文語音識別產(chǎn)品自1998年以來一直由國外公司壟斷的歷史。(1)國外研究歷史 語音識別的研究工作可以追溯到20世紀50年代AT&T貝爾實驗室的Audry系統(tǒng),它是第一個可以識別十個英文數(shù)字的語音識別系統(tǒng)?! 〉嬲〉脤嵸|(zhì)性進展,并將其作為一個重要的課題開展研究則是在60年代末70年代初。這首先是因為計算機技術(shù)的發(fā)展為語音識別的實現(xiàn)提供了硬件和軟件的可能,更重要的是語音信號線性預測編碼(LPC)技術(shù)和動態(tài)時間規(guī)整(DTW)技術(shù)的提出,有效的解決了語音信號的特征提取和不等長匹配問題。這一時期的語音識別主
8、要基于模板匹配原理,研究的領(lǐng)域局限在特定人,小詞匯表的孤立詞識別,實現(xiàn)了基于線性預測倒譜和DTW技術(shù)的特定人孤立詞語音識別系統(tǒng);同時提出了矢量量化(VQ)和隱馬爾可夫模型(HMM)理論。 隨著應(yīng)用領(lǐng)域的擴大,小詞匯表、特定人、孤立詞等這些對語音識別的約束條件需要放寬,與此同時也帶來了許多新的問題:第一,詞匯表的擴大