資源描述:
《語音控制語音技術》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在行業(yè)資料-天天文庫。
1、語音控制語音控制摘要:本文主要簡要介紹了語音控制的發(fā)展與用途,特別講訴了語音識別的理論分析,包括語音信號的預處理,特征矢量的選擇與提取等等。再由短時能量分析,線性預測等理論知識,進行了語音控制理論分析的相關改進。將此刻前面的信號進行短時能量分析,得到一個值,來判斷其幅度的大概發(fā)展趨勢。最后再用線性預測的原理,得到另一個值。由此得到的兩個值,我們可以進行簡單的對未來幅度的預測,進行另外一個信號的幅度控制。關鍵字:語音控制;語音識別;短時能量;線性預測;21語音控制Abstract:Thispaperbrieflyintroducesthedevelopmentofvoicec
2、ontrolwithUSES,especiallytellingaboutthespeechrecognitiontheoryanalysis.Theanalysisincludsthespeechsignalpretreatment,thecharacteristicvectorselectionandextraction,andsoon.Thenbytheshort-termenergyanalysisandlinearpredictiontheoryknowledge,thetheoreticalanalysisofvoicecontrolingimproves.th
3、esignalsnowfrontshort-timeenergyanalysis,getsavalue,tojudgeitsamplitudeisprobablydevelopmenttrend.Finallybylinearforecastofprinciple,getsanothervalue.Thusgainingtwovalue,wecanconductsimpletopredictfutureamplitude,controlinganothersignalamplitude.Keyword:Voicecontrol;Speechrecognition;Short
4、-termenergy;Linearforecas21語音控制目錄第一章.緒論4第二章.語音控制理論知識52.1語音控制技術的發(fā)展52.2語音識別原理62.1.1語音信號的預處理62.1.2特征矢量的選擇與提取62.1.3動態(tài)時間歸整算法72.3語音合成技術8第三章.語音控制的改進93.1短時能量及短時平均幅度分析93.1.1幅度分析的依據(jù):93.1.2短時能量函數(shù)和短時平均幅度函數(shù)93.1.3短時平均幅度函數(shù)和能量函數(shù)的作用93.2線性預測分析的基本原理103.2.1線性預測分析的基本思想:103.2.2求解線性預測系數(shù)ak113.2.3用e(n)和ak求x(n)(合成)
5、153.3綜合處理16第四章.具體語音信號實現(xiàn)17結論20參考文獻:21致謝語2221語音控制第一章.緒論語音技術相對其它計算機技術而言,是一門還很年輕的計算機技術。語音技術研究在很早就有了,在1995年后個人計算機的計算和處理功能更加強大后逐步開始有一些應用。而今天語音技術在不知不覺中開始逐步走入了我們的生活,比如我們今天使用的中國移動電話客戶服務系統(tǒng)實際上就是一個語音系統(tǒng)在我們生活中的應用。本文主要分析了語音技術中語音控制的相關內(nèi)容,即進行的相關改進。而在分析語音控制之前,說明了語音識別的理論原理。然后簡要介紹了相關語音控制軟件的應用。得出一般語音控制的應用都是發(fā)出語音
6、命令,計算機等隨著命令做出相應的操作。那么得出一個問題:是否可以進行語音對語音的控制?由此下文進行相關語音理論的分析,解決了這個問題。其中用到了語音的短時能量分析,線性預測等理論知識。21語音控制第二章.語音控制理論知識2.1語音控制技術的發(fā)展人類作為唯一可以進行如此復雜語音交流的動物,得到了比別的動物更多的文化知識交流??墒侨祟惖恼Z言交流都是在人類間進行的,如何可以實現(xiàn)和別的動物,或者器械之間交流。比如控制計算機,控制機械,達到“君子動口不動手”的目的。這就是語音控制。而一般我們把這些相關的技術就叫語音技術。語音技術在計算機領域中的關鍵技術有自動語音識別技術和語音合成技術
7、。讓計算機能聽、能看、能說、能感覺,是未來人機交互的發(fā)展方向,其中語音成為未來最被看好的人機交互方式,語音比其他的交互方式有更多的優(yōu)勢。最早的語音技術因“自動翻譯電話”計劃而起,包含了語音識別、自然語言理解和語音合成三項非常主要的技術。語音識別的研究工作可以追溯到20世紀50年代AT&T貝爾實驗室的Audry系統(tǒng),此后研究者們逐步突破了大詞匯量、連續(xù)語音和非特定人這三大障礙。讓計算機說話需要用到語音合成技術,其核心是文語轉換技術(TexttoSpeech),語音合成甚至已經(jīng)應用到汽車的信息系統(tǒng)上,車主可以將下載到系