資源描述:
《論g.729語音編碼及在dsp上的實(shí)時(shí)實(shí)現(xiàn)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、論G.729語音編碼及在DSP上的實(shí)時(shí)實(shí)現(xiàn)[摘要]文章通過對(duì)G.729語音編碼算法和定點(diǎn)數(shù)字信號(hào)處理芯片TMS320VC5416的研究,重點(diǎn)介紹了一個(gè)應(yīng)用DSP對(duì)G.729語音編碼進(jìn)行實(shí)時(shí)處理的實(shí)驗(yàn),并對(duì)程序進(jìn)行優(yōu)化,結(jié)果表明,得到了預(yù)期的8Kb/s的低碼速率、較低的算法時(shí)延。[關(guān)鍵詞]G.729語音編碼器;數(shù)字信號(hào)處理器;實(shí)時(shí)實(shí)現(xiàn);算法優(yōu)化[中圖分類號(hào)][文獻(xiàn)標(biāo)識(shí)碼]A[][簡介]賈迎新(1980—),女,河北石家莊人,石家莊鐵道學(xué)院電氣工程分院研究生,主要研究方向:計(jì)算機(jī)檢測與控制。語音信號(hào)是人類使用最多,最基本,也是最重要的信息載體。語音信號(hào)處理是信息科學(xué)的
2、一個(gè)分支,是以數(shù)字信號(hào)處理和語言學(xué)為基礎(chǔ)發(fā)展起來的一門交叉學(xué)科。語音編碼技術(shù)就是其中的一個(gè)分支,其目的是在保證語音一定質(zhì)量的前提下,將模擬的語音信號(hào)用盡可能少的比特實(shí)現(xiàn)數(shù)字化,以便在有限的傳輸帶寬內(nèi)讓出更多的信道來傳送圖像、傳真、文檔、計(jì)算機(jī)文件和其他數(shù)據(jù)流,從而達(dá)到傳輸資源的有效利用和網(wǎng)絡(luò)容量的提高。而高度快速發(fā)展的DSP技術(shù)為語音信號(hào)處理領(lǐng)域提供強(qiáng)有力的工具,使得實(shí)時(shí)實(shí)現(xiàn)各種各樣的復(fù)雜算法成為可能。1G.729語音編碼算法G.729是國際電信聯(lián)盟ITU制定的一種高質(zhì)量的語音壓縮標(biāo)準(zhǔn),該標(biāo)準(zhǔn)是采用“共軛結(jié)構(gòu)-代數(shù)碼激勵(lì)線性預(yù)測(CS-ACELP)”算法,主要應(yīng)用
3、于IP、移動(dòng)通信、多媒體網(wǎng)絡(luò)通信和數(shù)字衛(wèi)星通信等領(lǐng)域。G.729使用混合編碼算法,對(duì)帶寬的語音信號(hào)編碼的標(biāo)準(zhǔn),對(duì)輸入的模擬語音信號(hào)用8kHz采樣,16bit線性PCM量化。CS-ACELP是基于碼激勵(lì)線性預(yù)測(CELP)的編碼模式,每80個(gè)樣點(diǎn)為1個(gè)語音幀,對(duì)語音信號(hào)進(jìn)行分析并提取各種參數(shù)(線性預(yù)測濾波器系數(shù)、自適應(yīng)碼本和固定碼本中碼本序號(hào)、自適應(yīng)碼矢量增益和固定碼矢量增益),對(duì)其進(jìn)行編碼并發(fā)送。在解碼端,將接收到的比特流進(jìn)行解碼生成對(duì)應(yīng)的參數(shù):用自適應(yīng)碼矢量序號(hào)從自適應(yīng)碼本中得到自適應(yīng)碼矢,用固定碼矢序號(hào)從固定碼本中得到固定碼矢,分別乘以它們的增益按點(diǎn)相加后構(gòu)成
4、激勵(lì)序列;用線性預(yù)測濾波器系數(shù)構(gòu)成合成濾波器;用自適應(yīng)碼本方法實(shí)現(xiàn)長時(shí)或基音合成濾波,計(jì)算出合成語音后,用后置濾波器進(jìn)一步增強(qiáng)音質(zhì)。1.1編碼算法在編碼端需要進(jìn)行線譜對(duì)(LSP)參數(shù)量化、基音分析、固定碼本和增益量化4個(gè)主要處理步驟。具體流程如圖1所示。輸入信號(hào)先經(jīng)過高通濾波預(yù)處理,每10ms幀作一次LP分析,計(jì)算LP濾波器系數(shù),這些參數(shù)轉(zhuǎn)換為線譜對(duì)(LSP)并用兩段16bit矢量量化。激勵(lì)信號(hào)用AbS(合成分析)方法搜索,以原始語音與合成語音的誤差感知加權(quán)最小為測度進(jìn)行搜索,而感知加權(quán)濾波器用未量化的LP系數(shù)構(gòu)造而成。感知加權(quán)的量是以保證輸入信號(hào)的頻響是平的而進(jìn)
5、行的自適應(yīng)調(diào)整。激勵(lì)參數(shù)(固定的和自適應(yīng)的碼書參數(shù))每個(gè)子幀(5ms,40個(gè)樣點(diǎn))確定一次。量化的和未量化的LP濾波器系數(shù)用于第二子幀,而在第一子幀使用內(nèi)插的LP系數(shù),根據(jù)感知加權(quán)語音信號(hào)每l0ms幀估計(jì)一次開環(huán)基音延時(shí)。下面的操作每個(gè)子幀都重復(fù)進(jìn)行。1.2解碼算法首先從接收到的碼流中提取參數(shù)序號(hào),解碼這些序號(hào)得到lOms語音幀對(duì)應(yīng)的編碼參數(shù)。這些參數(shù)是LSP參數(shù),兩個(gè)分?jǐn)?shù)基音延時(shí),兩個(gè)固定碼本矢量與兩組自適應(yīng)和固定碼本增益,每子幀LSP參數(shù)被內(nèi)插并轉(zhuǎn)換為LP濾波器系數(shù),然后以每5ms子幀為單位合成語音。合成步驟如下:(1)自適應(yīng)和固定碼本分別乘以各自的增益加起來
6、構(gòu)成激勵(lì)。(2)激勵(lì)LP合成濾波器重構(gòu)語音。(3)重構(gòu)語音信號(hào)經(jīng)過后置處理,包括長時(shí)后置濾波、短時(shí)合成濾波和高通濾波。具體流程如圖2所示。2TMS320VC5416數(shù)字信號(hào)處理芯片簡介TMS320VC5416是TI公司為實(shí)現(xiàn)低功耗、高速實(shí)時(shí)信號(hào)處理而專門設(shè)計(jì)的16位定點(diǎn)數(shù)字信號(hào)處理器,采用改進(jìn)的哈佛結(jié)構(gòu),具有高度的操作靈活性和運(yùn)行速度,適應(yīng)于遠(yuǎn)程通信等實(shí)時(shí)嵌入式應(yīng)用的需要,先已廣泛應(yīng)用于無線電通信系統(tǒng)中。具有的主要優(yōu)點(diǎn)如下:(1)圍繞一組程序總線、三組數(shù)據(jù)總線和四組地址總線而建立的改進(jìn)哈佛結(jié)構(gòu),提高了系統(tǒng)的多功能性和操作的靈活性。(2)具有高度并行性和專用硬件邏輯
7、的CPU設(shè)計(jì),提高了芯片的性能。(3)具有完善的尋址方式和高度專業(yè)化指令系統(tǒng),更適應(yīng)于快速算法的實(shí)現(xiàn)和高級(jí)語音編程的優(yōu)化。(4)模塊化結(jié)構(gòu)設(shè)計(jì),使派生器件得到了更快的發(fā)展。(5)采用先進(jìn)的IC制造工藝,降低了芯片的功耗,提高了芯片的性能。(6)采用先進(jìn)的靜態(tài)設(shè)計(jì)技術(shù),進(jìn)一步降低了功耗,使芯片具有更強(qiáng)的應(yīng)用能力。3實(shí)時(shí)系統(tǒng)的設(shè)計(jì)3.1系統(tǒng)的組成該系統(tǒng)由5416芯片、模數(shù)轉(zhuǎn)換電路、FLASH存儲(chǔ)器和雙口RAM組成。5416作為整個(gè)系統(tǒng)的核心,主要用來完成語音壓縮和解壓縮在內(nèi)的所有軟件功能。A/D和D/A轉(zhuǎn)換完成語音信號(hào)的模數(shù)和數(shù)模轉(zhuǎn)換。FLASH存儲(chǔ)器用來存放系統(tǒng)程序
8、和已初始化