資源描述:
《基于廣義回歸神經(jīng)網(wǎng)絡(luò)的情感語音韻律特征預(yù)測(cè)-論文.pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、《自動(dòng)化與儀器儀表)2o15年2期(總第184期)基于廣義回歸神經(jīng)網(wǎng)絡(luò)的情感語音韻律特征預(yù)測(cè)魯小勇,潘濤,高蘭德(西北師范大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院蘭州,730070)(蘭州資源環(huán)境職業(yè)技術(shù)學(xué)院蘭州,730021)摘要:韻律特征是語音信號(hào)中情感信息的主要表征之一。為了更好地進(jìn)行情感語音合成的研究,本文通過提取普通話情感語音的韻律特征進(jìn)行分析,采用廣義回歸神經(jīng)網(wǎng)絡(luò)構(gòu)建了一個(gè)情感語音韻律特征預(yù)測(cè)模型,并根據(jù)所提取的測(cè)試集數(shù)據(jù)文本語境信息進(jìn)行韻律特征預(yù)測(cè),實(shí)驗(yàn)獲得了相應(yīng)的結(jié)果。實(shí)驗(yàn)結(jié)果表明,情感語音韻律特征預(yù)測(cè)效果較好。關(guān)鍵詞:情感語音;韻律特征;廣義回歸神經(jīng)網(wǎng)絡(luò);
2、預(yù)測(cè)DOI編碼:10.14016~.cnki.1001-9227.2015.02.145Abstract:Prosodicfeaturesisoneofthemaincharacterizationofemotionalinformationinspeechsigna1.Inordertore-searchemotionalspeechsynthesis,webuildageneralizedregressionneuralnetwork(GRNN)basedprosodypredictionmodeltore—alizethetransformationo
3、fpitchcontour,durationandpausedurationofemotionalspeechaccordingtothecontextinformationoftext.Experimentalresultsdemonstratethattheresultsofthepredictionexperimentreachthedesiredrequirements.Keywords:Emotionalspeech;prosodyfeatures;GeneralizedRegressionNeuralNetwork(GRNN);Predictio
4、n中圖分類號(hào):TP183文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1001-9227(2015)02-0145-030引言語音韻律特征進(jìn)行分析與建模。其中,韻律特征包括節(jié)奏、重語言是人類社會(huì)交流中使用最頻繁最重要的工具之一。音一級(jí)語調(diào)等特性。韻律特征在聲學(xué)特征參數(shù)上,主要體現(xiàn)為人類的話語中不僅包含了文本內(nèi)容,而且還蘊(yùn)含了人們的感情基音頻率、時(shí)長(zhǎng)以及平均能量隨時(shí)間的變化;反映在心理感知和情緒的變化。。其中感情和情緒這些非語言信息也是準(zhǔn)確傳上,主要體現(xiàn)為語音的音高、語速以及音量的不斷變化。筆者達(dá)說話人意圖的重要載體,相當(dāng)于文本中的另外一句話,往往主要從聲學(xué)特征參數(shù)出發(fā),研究基音頻
5、率、時(shí)長(zhǎng)和停頓時(shí)長(zhǎng)這會(huì)因?yàn)檎f話人其他兩層意思含義的不同,聽者所領(lǐng)悟到的信息三個(gè)基本的韻律特征參數(shù),采用MATLAB軟件提取這三個(gè)韻律也就有所差異。特征參數(shù)并建立數(shù)據(jù)集合,數(shù)據(jù)集合包括預(yù)測(cè)模型訓(xùn)練集和測(cè)目前的普通話語音合成系統(tǒng),主要是解決以某種朗讀風(fēng)格試集。將書面語言轉(zhuǎn)換成口語輸出為目的,多著眼于語音詞匯傳達(dá)的筆者采用MATLAB編程,設(shè)計(jì)提取情感語音韻律特征。其準(zhǔn)確性。雖然,語音合成的清晰度、可懂度都已經(jīng)基本解部分程序設(shè)計(jì)代碼如下:決,自然度也獲得了較大地改善,例如:微軟(Microsoft)、清%%計(jì)算得到基音頻率值華大學(xué)[91等機(jī)構(gòu)研制的語音合成系統(tǒng)。但
6、卻忽略了包含在語音fori=1:syl_number信號(hào)中的情感因素,合成的語音由于缺乏豐富的語氣、語速變wav_beg=tag(i).wav_begin;化,不能夠模擬自然人語音的豐富語氣和情感,所以聽起來仍way_end=tag(i).wav_end;然單調(diào)乏味,不能夠根據(jù)所處環(huán)境和對(duì)象改變說話的氣氛,很Xwav(wav_beg:wav_end);大程度上阻礙了語音產(chǎn)業(yè)的發(fā)展,成為了當(dāng)前語音合成技術(shù)應(yīng)fs=16000;用的瓶頸之一u。對(duì)于情感語音合成而言,它屬于語音的規(guī)則fO{i}=MuhicueFOvl4(x,fs);合成,所以要使合成語音能夠表情達(dá)意
7、,就需要使得韻律模型jj=find(f0{i)>600);得到進(jìn)一步地改善。為此,筆者嘗試采用人工神經(jīng)網(wǎng)絡(luò)技術(shù)構(gòu)(i】(j)=[];建情感語音韻律預(yù)測(cè)模型。kk=find(fO{i)<60);m{i}(kk)=[];1韻律特征提取end語音中情感的變化主要體現(xiàn)在音色上,而韻律特征則是反%%計(jì)算得到時(shí)長(zhǎng)應(yīng)音色的一個(gè)重要因素。為此,要合成情感語音就必須對(duì)情感fori=1:length(syl_labe1)syl_label(i).dur=syl_label(i).way_end—syl收稿日期:2014—12—31_label(i).wav_begin+1:基金
8、項(xiàng)目:西北師范大學(xué)2013年度青年教師科研能力提升計(jì)