資源描述:
《數(shù)字變聲器方案對(duì)策》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、基于FFT算法的數(shù)字變聲器201242216河北北方學(xué)院宣化教學(xué)部河北宣化075100【摘要】本數(shù)字變聲器是實(shí)現(xiàn)男聲變女聲和女聲變男聲以及變成童聲的系統(tǒng)。設(shè)計(jì)本數(shù)字變聲器的目的是鍛煉自己的學(xué)習(xí)實(shí)踐能力。通過matlab編寫程序修改語音參數(shù)來實(shí)現(xiàn)男聲女聲之間的變換。【關(guān)鍵詞】變音算法數(shù)字濾波器語音信號(hào)數(shù)字濾波器頻譜分析MATLAB1引言變聲器在現(xiàn)實(shí)生活中應(yīng)用廣泛,變聲器是通過改變輸入音頻的音色、音調(diào),并將變聲后的音頻輸出的工具。根據(jù)變聲器材質(zhì)不同,變聲器分為變聲器硬件和變聲器軟件。變聲器硬件,即通過硬件實(shí)現(xiàn)變聲的工具;變聲器
2、軟件,即通過軟件實(shí)現(xiàn)變聲的工具,軟件類變聲器,運(yùn)行平臺(tái)皆為電腦系統(tǒng)。無論是硬件變聲器,還是軟件變聲器,其原理都是,通過改變輸入聲音頻率,進(jìn)而改變聲音的音色、音調(diào),使輸出聲音在感官上與原聲音不同。我們每個(gè)人的聲音不同,源于我們的每個(gè)人的音色和音調(diào)不同,我們所說的男中音、男高音,就是音調(diào)的不同,而即便音調(diào)一致,我們依然能區(qū)分出兩個(gè)不同人的聲音,或不同樂器的聲音,這就是音色的不同。變聲器,正是借助對(duì)聲音音色和音調(diào)的雙重復(fù)合改變,實(shí)現(xiàn)輸出聲音的改變。我們這里的變聲器就是matlab來實(shí)現(xiàn)變聲。2數(shù)字變聲器的原理和算法發(fā)音方法,發(fā)音
3、時(shí),喉頭、口腔、鼻腔節(jié)制氣流的方式和狀態(tài),包括發(fā)音時(shí)構(gòu)成阻礙和克服阻礙的方式,氣流強(qiáng)弱的情況及聲帶是否振動(dòng)等幾個(gè)方面。人類語音可分為有380聲語音和無聲語音,前者是由聲帶振動(dòng)激勵(lì)的脈沖信號(hào)經(jīng)聲腔調(diào)制變成不同的音,它是人類語言中元音的基礎(chǔ),聲帶振動(dòng)的頻率稱為基頻。無聲語音則是聲帶保持開啟狀態(tài),禁止振動(dòng)引發(fā)的。一般來說,由聲門振動(dòng)決定的基頻跟說話人的性別特征有關(guān),如下表,而無聲語音則沒有體現(xiàn)這個(gè)特征。說話人的個(gè)性化音色和語音的另外一個(gè)聲學(xué)參數(shù)——共振峰頻率的分布有關(guān)。兒童由于聲道短,其共振峰頻率高于成年人,成年女性的聲道一般短
4、于成年男性,所以女性的共振峰頻率一般高于男性。本實(shí)驗(yàn)是基于男生錄制的聲音進(jìn)行相關(guān)參數(shù)提取,修改接近于女聲、童聲、老人聲,并實(shí)現(xiàn)了音調(diào)的高低與速度的快慢1.變聲原理 在進(jìn)行性別變聲時(shí),主要考慮基音周期、基頻和共振峰頻率的變化?;糁芷诟淖儠r(shí),基頻、共振峰同時(shí)變化,若伸展既有男變女、女變童,反之亦可。本實(shí)驗(yàn)是基于男生錄制的聲音進(jìn)行相關(guān)參數(shù)提取,修改接近于女聲,實(shí)現(xiàn)男聲到女聲的變換?!褚舳翁卣鳎好枋龅氖钦Z音的音色特征。特征參數(shù)主要包括基音頻率、共振峰位置、共振峰帶寬、基音頻率、能量等?!癯舳翁卣鳎好枋龅氖钦Z音的韻律特征。特征
5、參數(shù)主要包括因素的時(shí)長、基音頻率的變化(音調(diào))、能量等●語言特征:包括習(xí)慣用語、方言、口音等?;羰侵赴l(fā)濁音時(shí)聲帶振動(dòng)所引起的周期性,而基音周期是指聲帶振動(dòng)頻率的倒數(shù)?;糁芷谑钦Z音信號(hào)最重要的參數(shù)之一,它描述了語音激勵(lì)源的一個(gè)重要特征。不同的人以及同一個(gè)人在不同的年齡時(shí)期有不同的基音周期。人唱歌時(shí),其基音頻率范圍大約是:童聲高音頻率范圍為260-880Hz,低音頻率范圍為196-700Hz,女聲高音頻率范圍為220-1.1KHz,低音頻率范圍為200-700Hz,男聲高音頻率范圍為160-523Hz低音頻率范圍為80-3
6、58Hz。此外,基音的變化模式稱為聲調(diào),它攜帶著非常重要的具有辨意作用的信息。先就如何實(shí)時(shí)地通過基音頻率的變化來實(shí)現(xiàn)語聲變聲,進(jìn)行討論,Matlab實(shí)現(xiàn)算法。...男聲基頻分布(hz):50~180共振峰頻率分布:偏低人群女聲基頻分布(hz):160~380共振峰頻率分布:中提取參數(shù) ?。?)語音時(shí)變傅里葉變換為:在低通濾波時(shí),采用巴特沃斯濾波器。(2)構(gòu)建巴特沃斯低通濾波器 根據(jù)人的說話特征設(shè)定相應(yīng)指標(biāo)參數(shù),對(duì)本段語音設(shè)計(jì)算出巴特沃斯模擬濾波器的階數(shù),截止頻率,歸一化低通原型系統(tǒng)函數(shù)?!”径握Z音設(shè)計(jì)算出巴特沃斯模擬濾波
7、器的階數(shù)N為5,3dB截止頻率,,算出為0.175,歸一化低通原型系統(tǒng)函數(shù)為:其中將帶人中,得到低通濾波器,...各種理想數(shù)字濾波器的幅度頻率響應(yīng)流程圖3數(shù)字變聲器的軟件實(shí)現(xiàn)與仿真結(jié)果代碼部分選擇音頻文件...[filename,pathname]=uigetfile({'*.wav','ALLFILES'},'selectvoicefile');ifisequal([filenamepathname],[0,0])return;endstr=[pathnamefilename];[temp,Fs]=audioread(s
8、tr);temp1=resample(temp,80,441);handles.y1=temp;handles.y=temp1;handles.Fs=Fs;guidata(hObject,handles);原音播放c=handles.Fs;sound(handles.y1,c);plot(handles