資源描述:
《基于labview的變聲器設(shè)計(jì)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、基于LabVIEW的變聲器設(shè)計(jì)摘要:數(shù)字信號(hào)處理技術(shù)在語(yǔ)音信號(hào)的處理中具有十分重要的意義,是語(yǔ)音變換的處理方法之一?;谠谡Z(yǔ)音變換時(shí)的技術(shù)要求,本文介紹了一種在基音同步疊加(PSOLA)算法的前提下,結(jié)合重采樣技術(shù)實(shí)現(xiàn)語(yǔ)音變調(diào)不變速的方法,在分析變換理論及具體算法的基礎(chǔ)上,利用LabVIEW編程實(shí)現(xiàn)語(yǔ)音的多種頻率變換以及男∕女聲變換。關(guān)鍵詞:基音同步疊加(PSOLA)算法;重采樣;頻譜搬移;語(yǔ)音轉(zhuǎn)換LabVIEW-basedvariablesounddesignAbstract:Digitalsignalprocessingtechnology
2、isofgreatsignificanceinspeechsignalprocessing,isoneoftheprocessingmethodofvoicetransformation.Basedonthetechnicalrequirementsinthevoicechange,thispaperdescribesasynchronousoverlapinpitch(PSOLA)algorithmpremiseresamplingtechniquecombiningvoicetonedoesnotshiftmethod,basedonthe
3、analysisofspecificalgorithmstransformtheoryandontheuseofLabVIEWprogrammingavarietyofvoicefrequencyconversionandmale/femaletransformation.Keyword:PSOLA;resampling;spectrumshifting;Voiceconversion0引言在音頻信號(hào)處理中,將源說(shuō)話人語(yǔ)音中的個(gè)性特征轉(zhuǎn)換成目標(biāo)說(shuō)話人語(yǔ)音的個(gè)性特征的語(yǔ)音信號(hào)處理技術(shù),稱為語(yǔ)音變換技術(shù)。人的語(yǔ)音說(shuō)話特征分為音段特性與超音段特性以及
4、語(yǔ)言特性,音段特征包括譜包絡(luò),譜激勵(lì);超音段特性包括基頻,時(shí)長(zhǎng),幅度[1]。近幾年來(lái),語(yǔ)音信號(hào)處理技術(shù)在實(shí)用化方面取得了很多突破性進(jìn)展,例如,隨著在對(duì)聲學(xué)語(yǔ)音學(xué)統(tǒng)計(jì)模型的深入研究,像語(yǔ)音識(shí)別,基于語(yǔ)音段的建模方法等逐漸成為研究熱點(diǎn)。在語(yǔ)音合成方面,基于基音同步疊加(PSOLA)算法的波形編輯和拼接技術(shù)得到廣泛應(yīng)用[2],PSOLA算法的優(yōu)勢(shì)在于能在不改變語(yǔ)音音段的音質(zhì)的基礎(chǔ)上,能改變體現(xiàn)語(yǔ)音自然度的韻律特征的變化,進(jìn)而獲得更高的清晰度。語(yǔ)音技術(shù)的研究難在語(yǔ)音合成,基音同步疊加(PSOLA)就是最具有代表性的一種方法,它既能保持語(yǔ)音的音段特性,又
5、能在拼接時(shí)調(diào)整它的基頻,強(qiáng)度和時(shí)長(zhǎng)等超音段特性。本設(shè)計(jì)通過(guò)LabVIEW設(shè)計(jì)一個(gè)變聲儀器,利用PSOLA算法與重采樣技術(shù)結(jié)合,實(shí)現(xiàn)音頻的變調(diào)不變速,以及多種頻段變調(diào)。1變聲原理變聲即實(shí)現(xiàn)音頻的變調(diào),進(jìn)行頻譜搬移,改變音頻的頻率[3]。為了實(shí)現(xiàn)變調(diào)不變速,可以先對(duì)信號(hào)進(jìn)行變速不變調(diào)處理,再進(jìn)行重采樣,由于重采樣能夠同時(shí)改變語(yǔ)音的語(yǔ)速和音調(diào),只要變調(diào)因子取值合適,就能使語(yǔ)速恢復(fù)正常,只有音調(diào)改變,即達(dá)到變調(diào)不變速的目的。為此,變聲的首要過(guò)程就是對(duì)信號(hào)的變速不變調(diào)的處理。要實(shí)現(xiàn)語(yǔ)音的變速不變調(diào)有兩種方法:一個(gè)是,用窗口函數(shù)截取語(yǔ)音信號(hào)樣本,用傅里葉變
6、換將時(shí)域信號(hào)轉(zhuǎn)換到頻域,然后將信號(hào)的頻率往低頻段壓縮,再用傅里葉反變換從頻域轉(zhuǎn)換到時(shí)域,最后進(jìn)行重采樣(主要是抽點(diǎn)),就可達(dá)到語(yǔ)音的變速不變調(diào)目的;另一個(gè)是,用傅里葉變換實(shí)現(xiàn)語(yǔ)音的壓擴(kuò),即用傅里葉變換處理語(yǔ)音信號(hào)得到對(duì)應(yīng)的頻譜分布,然后利用頻譜變換函數(shù)處理這個(gè)頻譜分布,得到變換頻譜,最后利用傅立葉反變換將信號(hào)從頻域轉(zhuǎn)換到時(shí)域,就能得到變速不變調(diào)的語(yǔ)音。本設(shè)計(jì)就是利用第二個(gè)方法最終實(shí)現(xiàn)變聲目的。實(shí)現(xiàn)變聲的流程框圖如圖1所示:語(yǔ)音信號(hào)X(n)傅里葉變換頻譜分布頻譜變換函數(shù)處理處理后的頻譜傅立葉逆變換變速后的信號(hào)重采樣變聲語(yǔ)音信號(hào)圖1變聲流程圖2基音
7、同步疊加(PSOLA)算法PSOLA算法是利用短時(shí)傅里葉變換重構(gòu)信號(hào)的疊接相加法,分為三個(gè)部分:基音同步分析,基音同步修改和基音同步合成[4]。2.1基音同步分析設(shè)采集的音頻信號(hào)為,選擇合適的時(shí)窗分析窗口對(duì)原始合成單元做加窗處理,得到一組短時(shí)信號(hào)(1)式(1)中,為基音標(biāo)注點(diǎn),一般采用Hamming窗,窗長(zhǎng)大于原始信號(hào)的一個(gè)基音周期,因此窗間有重疊,窗長(zhǎng)一般取原始信號(hào)基音周期的2~4倍,于是有,(2)式(2)中,為歸一化窗長(zhǎng),為窗覆蓋基音周期數(shù)的比例系數(shù),為基音周期。通常情況下,取,能夠使合成簡(jiǎn)化。若要提高基頻,令取為原始分析基音周期;若要降低
8、基頻,令取為合成基音周期,這樣能夠使得合成簡(jiǎn)化。2.2基音同步修改基音同步修改分為兩個(gè)方向,一個(gè)是在頻域內(nèi)對(duì)信號(hào)進(jìn)行音高的修改,另一個(gè)是在時(shí)域內(nèi)對(duì)原始