資源描述:
《語音控制 語音技術(shù)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、語音控制語音控制摘要:本文主要簡要介紹了語音控制的發(fā)展與用途,特別講訴了語音識別的理論分析,包括語音信號的預處理,特征矢量的選擇與提取等等。再由短時能量分析,線性預測等理論知識,進行了語音控制理論分析的相關(guān)改進。將此刻前面的信號進行短時能量分析,得到一個值,來判斷其幅度的大概發(fā)展趨勢。最后再用線性預測的原理,得到另一個值。由此得到的兩個值,我們可以進行簡單的對未來幅度的預測,進行另外一個信號的幅度控制。關(guān)鍵字:語音控制;語音識別;短時能量;線性預測;21語音控制Abstract:Thispaperbrieflyintroducest
2、hedevelopmentofvoicecontrolwithUSES,especiallytellingaboutthespeechrecognitiontheoryanalysis.Theanalysisincludsthespeechsignalpretreatment,thecharacteristicvectorselectionandextraction,andsoon.Thenbytheshort-termenergyanalysisandlinearpredictiontheoryknowledge,thetheor
3、eticalanalysisofvoicecontrolingimproves.thesignalsnowfrontshort-timeenergyanalysis,getsavalue,tojudgeitsamplitudeisprobablydevelopmenttrend.Finallybylinearforecastofprinciple,getsanothervalue.Thusgainingtwovalue,wecanconductsimpletopredictfutureamplitude,controlinganot
4、hersignalamplitude.Keyword:Voicecontrol;Speechrecognition;Short-termenergy;Linearforecas21語音控制目錄第一章.緒論4第二章.語音控制理論知識52.1語音控制技術(shù)的發(fā)展52.2語音識別原理62.1.1語音信號的預處理62.1.2特征矢量的選擇與提取62.1.3動態(tài)時間歸整算法72.3語音合成技術(shù)8第三章.語音控制的改進93.1短時能量及短時平均幅度分析93.1.1幅度分析的依據(jù):93.1.2短時能量函數(shù)和短時平均幅度函數(shù)93.1.3短時平均幅度函
5、數(shù)和能量函數(shù)的作用93.2線性預測分析的基本原理103.2.1線性預測分析的基本思想:103.2.2求解線性預測系數(shù)ak113.2.3用e(n)和ak求x(n)(合成)153.3綜合處理16第四章.具體語音信號實現(xiàn)17結(jié)論20參考文獻:21致謝語2221語音控制第一章.緒論語音技術(shù)相對其它計算機技術(shù)而言,是一門還很年輕的計算機技術(shù)。語音技術(shù)研究在很早就有了,在1995年后個人計算機的計算和處理功能更加強大后逐步開始有一些應(yīng)用。而今天語音技術(shù)在不知不覺中開始逐步走入了我們的生活,比如我們今天使用的中國移動電話客戶服務(wù)系統(tǒng)實際上就是一個
6、語音系統(tǒng)在我們生活中的應(yīng)用。本文主要分析了語音技術(shù)中語音控制的相關(guān)內(nèi)容,即進行的相關(guān)改進。而在分析語音控制之前,說明了語音識別的理論原理。然后簡要介紹了相關(guān)語音控制軟件的應(yīng)用。得出一般語音控制的應(yīng)用都是發(fā)出語音命令,計算機等隨著命令做出相應(yīng)的操作。那么得出一個問題:是否可以進行語音對語音的控制?由此下文進行相關(guān)語音理論的分析,解決了這個問題。其中用到了語音的短時能量分析,線性預測等理論知識。21語音控制第二章.語音控制理論知識2.1語音控制技術(shù)的發(fā)展人類作為唯一可以進行如此復雜語音交流的動物,得到了比別的動物更多的文化知識交流。可是
7、人類的語言交流都是在人類間進行的,如何可以實現(xiàn)和別的動物,或者器械之間交流。比如控制計算機,控制機械,達到“君子動口不動手”的目的。這就是語音控制。而一般我們把這些相關(guān)的技術(shù)就叫語音技術(shù)。語音技術(shù)在計算機領(lǐng)域中的關(guān)鍵技術(shù)有自動語音識別技術(shù)和語音合成技術(shù)。讓計算機能聽、能看、能說、能感覺,是未來人機交互的發(fā)展方向,其中語音成為未來最被看好的人機交互方式,語音比其他的交互方式有更多的優(yōu)勢。最早的語音技術(shù)因“自動翻譯電話”計劃而起,包含了語音識別、自然語言理解和語音合成三項非常主要的技術(shù)。語音識別的研究工作可以追溯到20世紀50年代AT&
8、T貝爾實驗室的Audry系統(tǒng),此后研究者們逐步突破了大詞匯量、連續(xù)語音和非特定人這三大障礙。讓計算機說話需要用到語音合成技術(shù),其核心是文語轉(zhuǎn)換技術(shù)(TexttoSpeech),語音合成甚至已經(jīng)應(yīng)用到汽車的信息系統(tǒng)上,車主可以將下載到系