基于ROS的智能語音交互系統(tǒng)設(shè)計與實現(xiàn)

基于ROS的智能語音交互系統(tǒng)設(shè)計與實現(xiàn)

ID:34917494

大?。?.56 MB

頁數(shù):81頁

時間:2019-03-14

基于ROS的智能語音交互系統(tǒng)設(shè)計與實現(xiàn)_第1頁
基于ROS的智能語音交互系統(tǒng)設(shè)計與實現(xiàn)_第2頁
基于ROS的智能語音交互系統(tǒng)設(shè)計與實現(xiàn)_第3頁
基于ROS的智能語音交互系統(tǒng)設(shè)計與實現(xiàn)_第4頁
基于ROS的智能語音交互系統(tǒng)設(shè)計與實現(xiàn)_第5頁
資源描述:

《基于ROS的智能語音交互系統(tǒng)設(shè)計與實現(xiàn)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、廣東工業(yè)大學(xué)碩士學(xué)位論文(工學(xué)碩士)基于ROS的智能語音交互系統(tǒng)設(shè)計與實現(xiàn)洪奕鑫二〇一八年五月廣東工業(yè)大學(xué)碩士學(xué)位論文分類號:學(xué)校代號:11845UDC:密級:學(xué)號:2111504061廣東工業(yè)大學(xué)碩士學(xué)位論文(工學(xué)碩士)基于ROS的智能語音交互系統(tǒng)設(shè)計與實現(xiàn)洪奕鑫指導(dǎo)教師姓名、職稱:張浩川副教授學(xué)科(專業(yè))或領(lǐng)域名稱:控制科學(xué)與工程學(xué)生所屬學(xué)院:自動化學(xué)院論文答辯日期:2018年5月29日ADissertationSubmittedtoGuangdongUniversityofTechnologyfortheDegreeofMaster(MasterofEng

2、ineeringScience)DesignandImplementationofIntelligentVoiceInteractionSystembasedonROSCandidate:HongYixinSupervisor:Prof.ZhangHaochuanMay2018SchoolofAutomationGuangdongUniversityofTechnologyGuangzhou,Guangdong,P.R.China,510006摘要摘要語音作為最自然的人機交互方式之一,近年來在人工智能技術(shù)的驅(qū)動下取得快速發(fā)展,時下語音交互技術(shù)正在各個領(lǐng)域潛移默化

3、的改變著人們的生活習(xí)慣。智能手機的普及是語音相關(guān)產(chǎn)品進入千家萬戶的契機。語音私人助理如蘋果的Siri將語音交互技術(shù)帶入新的發(fā)展高峰;如今智能音箱在家庭娛樂方面猶如新起之秀;與此同時,語音教育機器人層出不窮;某種意義上,語音交互正在悄然崛起。在云端技術(shù)架構(gòu)下利用語音云平臺構(gòu)建具備語音交互功能的產(chǎn)品是當(dāng)前主流的解決方案,終端設(shè)備只需負(fù)責(zé)語音信號的捕獲與最終的音頻輸出,對于語音識別與語義理解等過程全部由語音云平臺完成。該方案的特點是:將主要研發(fā)精力轉(zhuǎn)移到終端語音信號處理方面,而在智能決策方面高度依賴于云端語音服務(wù)平臺。雖然當(dāng)前以語音交互為賣點的產(chǎn)品形式各異,但產(chǎn)品技術(shù)

4、實現(xiàn)方案殊途同歸,因此在系統(tǒng)構(gòu)建方面或多或少存在重復(fù)的設(shè)計工作,在產(chǎn)品研發(fā)階段將增加開發(fā)周期與成本,不利于長遠發(fā)展。ROS的出現(xiàn)為軟件可重用性最大化提供解決方案,它是一種分布式軟件設(shè)計框架,能夠?qū)⒉煌墓δ苣K劃分成節(jié)點,然后通過調(diào)節(jié)節(jié)點之間的通信鏈路以組合出功能差異的系統(tǒng)軟件。針對上述在云端架構(gòu)下構(gòu)建的語音交互系統(tǒng)存在的一些問題,本文將利用ROS的軟件特性對當(dāng)前云端架構(gòu)下的語音交互系統(tǒng)框架進行調(diào)整。主要工作內(nèi)容包括以下幾個方面:(1)調(diào)研傳統(tǒng)語音交互系統(tǒng)的實現(xiàn)方案,梳理系統(tǒng)實現(xiàn)關(guān)鍵技術(shù)要點。深入研究ROS框架,并通過ROS軟件設(shè)計思想對傳統(tǒng)語音交互系統(tǒng)框架進行

5、調(diào)整,以增加系統(tǒng)的可擴展性與可維護性。(2)利用多特征融合與掃描的思想對傳統(tǒng)語音端點檢測算法進行改進,以提升系統(tǒng)在端點檢測環(huán)節(jié)的準(zhǔn)確率。同時為彌補該環(huán)節(jié)出現(xiàn)誤判導(dǎo)致語音幀丟失影響語音識別過程,特別設(shè)計前后向語音幀緩存器。(3)為降低終端對云端語義理解服務(wù)的依賴,特別設(shè)計離線意圖識別模型。主要目的在于為線上線下資源協(xié)同調(diào)度提供前提條件,以便提高系統(tǒng)的響應(yīng)速度與交互過程的流暢性。關(guān)鍵詞:語音交互;ROS;云端模式I廣東工業(yè)大學(xué)碩士學(xué)位論文AbstractVoice,asoneofthemostnaturalman-machineinteractionmodes,ha

6、sachievedrapiddevelopmentdrivenbyartificialintelligencetechnologyinrecentyears.Nowadays,voiceinteractiontechnologyischangingpeople'slivinghabitsinvariousfields.Thepopularityofsmartphonesisanopportunityforvoice-relatedproductstoentermillionsofhouseholds.VoicepersonalassistantssuchasAp

7、ple'sSirihavebroughtvoiceinteractiontechnologytonewheightsofdevelopment;nowsmartspeakersarelikenewcomersinhomeentertainment;atthesametime,thereareendlessvoiceeducationrobots;inasense,voiceinteractionisquietlyemerging.Theuseofavoicecloudplatformtobuildaproductwithvoiceinteractioncapab

8、ilitiesunder

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。