matlab變聲器

ID：25500670

大?。?39.50 KB

頁數(shù)：12頁

時(shí)間：2018-11-20

資源描述：

《matlab變聲器》由會(huì)員上傳分享，免費(fèi)在線閱讀，更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、MATLAB變聲器電子工程學(xué)院摘要語音信號(hào)處理中的變聲處理已經(jīng)有了比較成熟的算法，本文闡述了變聲算法的基礎(chǔ)原理，利用數(shù)字濾波器，自相關(guān)法，LPC，LPC系數(shù)求根法等方法在MATLAB上改變語音信號(hào)的基頻和共振峰以實(shí)現(xiàn)變聲，并總結(jié)了現(xiàn)有變聲算法的缺陷，對(duì)用不同的變換域能否改進(jìn)變聲算法做了粗略分析。關(guān)鍵詞：變聲算法，LPC，變換域12目錄研究背景3變聲原理3語音基本概念3變聲原理4變聲過程5分幀處理5計(jì)算LPC系數(shù)5計(jì)算原始激勵(lì)6計(jì)算基音周期6計(jì)算激勵(lì)能量7合成脈沖序列7更改聲道參數(shù)7合成變聲語音8程序設(shè)計(jì)8傳統(tǒng)變聲算法缺陷9合成

2、激勵(lì)與原始激勵(lì)差別較大9不能實(shí)現(xiàn)定向變聲10實(shí)現(xiàn)定向變聲的猜想11小波域是否存在恒定音色參數(shù)粗略分析11統(tǒng)計(jì)上的變換是否利于尋找恒定音色參數(shù)猜想11下一步研究計(jì)劃1212研究背景語音信號(hào)是人們?nèi)粘Ｉ钪惺殖Ｒ姷男盘?hào)，語音也是人與人之間傳遞信息的一種十分重要的方式。隨著智能終端以及互聯(lián)網(wǎng)的普及，語音信號(hào)大量地以數(shù)字形式出現(xiàn)，語音信號(hào)處理變得越來越重要，變聲處理是語音信號(hào)處理的基礎(chǔ)之一，所以在這樣的大背景下，研究變聲算法并改進(jìn)變聲算法是很有意義而且有必要的。另一方面，傳統(tǒng)的變聲算法是對(duì)發(fā)聲過程的簡單模擬進(jìn)行語音合成，在模擬過程中

3、改變參數(shù)以實(shí)現(xiàn)變聲，而傳統(tǒng)的變聲算法存在一些缺陷，若要改進(jìn)變聲算法使其更靈活有效，那么細(xì)致的研究傳統(tǒng)的變聲算法是很有必要的。變聲原理l語音基本概念1.聲道：聲道是很多動(dòng)物及人類都有的一個(gè)腔室，從聲源產(chǎn)生的聲音經(jīng)由此處濾出。人的聲道包括聲道則包括喉腔、咽頭、口腔和鼻腔。2.基音：一般的聲音都是由發(fā)音體發(fā)出的一系列頻率、振幅各不相同的振動(dòng)復(fù)合而成的。這些振動(dòng)中有一個(gè)頻率最低的振動(dòng)，由它發(fā)出的音就是基音，其余為泛音。發(fā)音體整體振動(dòng)產(chǎn)生的音，叫做基音，決定音高；發(fā)音體部分振動(dòng)產(chǎn)生的音，叫做泛音，決定音色；基音和泛音結(jié)合一起而形成的音，

4、叫做復(fù)合音，日常我們所聽到的聲音多為復(fù)合音。3.共振峰：共振峰是指在聲音的頻譜中能量相對(duì)集中的一些區(qū)域，共振峰是語音音質(zhì)的決定因素，反映了聲道（共振腔）的物理特征。聲音在經(jīng)過共振腔時(shí)，受到腔體的濾波作用，使得頻域中不同頻率的能量重新分配，一部分因?yàn)楣舱袂坏墓舱褡饔玫玫綇?qiáng)化，另一部分則受到衰減，得到強(qiáng)化的那些頻率在時(shí)頻分析的語圖上表現(xiàn)為濃重的黑色條紋。由于能量分布不均勻，強(qiáng)的部分猶如山峰一般，故而稱之為共振峰。在語音聲學(xué)中，共振峰決定著元音的音質(zhì)，在計(jì)算機(jī)音樂中，共振峰是決定音色和音質(zhì)的重要參數(shù)。4，短時(shí)平穩(wěn)特性：12語音信號(hào)是

5、一種隨時(shí)間而變化的信號(hào)，主要分為濁音和清音兩大類。濁音的基音周期、清濁音信號(hào)幅度和聲道參數(shù)等都隨時(shí)間而緩緩變化。由于發(fā)生器官的慣性運(yùn)動(dòng)，可以認(rèn)為在一小段時(shí)間里（一般為10~30ms）語音信號(hào)的頻域特性近似不變，即語音信號(hào)具有短時(shí)平穩(wěn)性。因而處理語音信號(hào)之前要把語音信號(hào)分為一些短段（稱為分析幀），然后再來進(jìn)行處理?！　∪寺暫蜆菲髀暤漠a(chǎn)生需要兩個(gè)階段，一個(gè)是發(fā)聲系統(tǒng)，如人的聲帶或樂器的振動(dòng)簧片，另一個(gè)是共鳴系統(tǒng)。樂器不同的共鳴系統(tǒng)使其在一定頻域中的語音信號(hào)的振幅得以突出，這樣，這些區(qū)域就產(chǎn)生了這個(gè)樂器所特有的共振峰值，這些共振峰值

6、同共鳴體的大小、形狀的材料密切相關(guān)。由于樂器的結(jié)構(gòu)是穩(wěn)定的，因此在樂器發(fā)出的所有音調(diào)中，不論基頻如何，都會(huì)表現(xiàn)出相同的共振峰值，只不過其顯著性有強(qiáng)有弱罷了。這就可以解釋為什么同一樂器所發(fā)出的不同音調(diào)具有相同的音質(zhì)。在語音聲學(xué)中，人聲也同樣受自身生理如鼻孔、咽腔、口腔大小的影響有自身的共振峰區(qū)。人在說話的過程中，正是通過利用這些共鳴空間的形狀和大小不同的變化（例如改變嘴形），以能改變聲音的共振峰說出不同的元音。我們之所以能夠區(qū)分不同的人聲、元音，主要也是依靠它們的共振峰分布的位置。簡單來講不同的人說同一句話的共振峰不同，同一個(gè)人

7、說不通的話共振峰也不同。l變聲原理變聲是通過改變?nèi)寺暤幕纛l率和共振分分布以達(dá)到變聲的目的，其具體過程是是模擬人聲的發(fā)聲過程，以脈沖信號(hào)代替聲帶振動(dòng)，以FIR濾波器代替聲道，用脈沖信號(hào)通過FIR濾波器進(jìn)行語音合成。首先對(duì)原始語音信號(hào)進(jìn)行分解，然后得出原始激勵(lì)參數(shù)（基音周期和激勵(lì)能量）和聲道參數(shù)（共振峰分布），用得出的參數(shù)構(gòu)建激勵(lì)和濾波器，再根據(jù)變聲需要更改參數(shù)，就可以達(dá)到變聲的目的。過程如下脈沖序列FIR濾波器原始激勵(lì)參數(shù)聲道參數(shù)原始語音合成變聲語音12變聲過程l分幀處理語音信號(hào)具有短時(shí)平穩(wěn)特性，所以在處理之前要進(jìn)行分幀處理，

8、將一段長的語音信號(hào)分解為10～30ms的語音信號(hào)逐段進(jìn)行處理。語音信號(hào)的分幀是采用可移動(dòng)的有限長度窗口進(jìn)行加權(quán)的方法來實(shí)現(xiàn)的。一般每秒幀數(shù)約為33~100幀，視實(shí)際情況而定。分幀一般要采用交疊分段的方法。如圖所示，這是為了使幀與幀之間平滑過渡，保持其連續(xù)性。前一幀和后一幀的交

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 12



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件，查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常，文件下載后無此問題，請(qǐng)放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤，付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。

matlab變聲器

matlab變聲器

相關(guān)文章

相關(guān)標(biāo)簽