資源描述:
《基于稀疏表示的音頻修復(fù)算法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、t*‘占游i草:匈山醒矣擊種iiAfMIIENTECHNOLOFINAUNIVERSFELECTRONCSCCEANDGYOCHITYO碩±學(xué)位論文MASTERTHESIS!f馨MHHi論文題目基于稀疏表示的音頻修復(fù)算法研究?學(xué)科專業(yè)信號(hào)與信息處理學(xué)號(hào)201321020426作者姓名王君地__—指導(dǎo)教師漆進(jìn)副教授、—'''I.’,......、,?t..,.分類
2、號(hào)密級(jí)注1UDC學(xué)位論文基于稀疏表示的音頻修復(fù)算法研究(題名和副題名)王君地(作者姓名)指導(dǎo)教師漆進(jìn)副教授電子科技大學(xué)成都(姓名、職稱、單位名稱)申請(qǐng)學(xué)位級(jí)別碩士學(xué)科專業(yè)信號(hào)與信息處理提交論文日期2016.4論文答辯日期2016.5.19學(xué)位授予單位和日期電子科技大學(xué)2016年6月答辯委員會(huì)主席評(píng)閱人注1:注明《國(guó)際十進(jìn)分類法UDC》的類號(hào)。ResearchaboutAudioInpaintingbasedonSparseRepresentationAMasterThesisSubmittedtoUniversityo
3、fElectronicScienceandTechnologyofChinaMajor:SignalandInformationProcessingAuthor:WangJundiSupervisor:AssociateProf.QiJinSchool:SchoolofElectronicEngineering獨(dú)劍性聲明本人聲明所呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。據(jù)我所知,除了文中特別加標(biāo)注和致謝的地方夕h,論文中不包含其他人己經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得電子科
4、技大學(xué)或其它教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對(duì)本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說明并表示謝意。作者簽名:!君他曰期:對(duì)/占年3月曰_論文使用授權(quán)本學(xué)位論文作者完全了解電子科技大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定,有權(quán)保留并向國(guó)家有關(guān)部口或機(jī)構(gòu)送交論文的復(fù)印件和磁盤,允許論文被查閱和借閱。本人授權(quán)電子科技大學(xué)可1^將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢索,可W采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。(保密的學(xué)位論文在解密后應(yīng)遵守此規(guī)
5、定)、:玉君誠(chéng)導(dǎo)師簽名作者簽名:各曰期:如/年3月3曰/摘要摘要在現(xiàn)實(shí)生活中,音頻常常會(huì)因?yàn)榄h(huán)境噪聲、網(wǎng)絡(luò)擁塞和設(shè)備限幅等影響,而產(chǎn)生諸如脈沖干擾、片段丟失和削頂失真等情況的受損,降低音頻的可聽度和可懂度。如果音頻應(yīng)用于語(yǔ)音識(shí)別、說話人辨識(shí)等情況,還會(huì)導(dǎo)致相應(yīng)識(shí)別率下降,所以需要對(duì)受損音頻進(jìn)行數(shù)字化修復(fù),還原出受損部分,改善音頻質(zhì)量。針對(duì)目前音頻修復(fù)的研究現(xiàn)狀,本文采用基于稀疏表示的音頻修復(fù)算法。基于稀疏表示的音頻修復(fù)是指在音頻為稀疏信號(hào)的前提下,利用受損音頻中可靠部分的數(shù)據(jù),在過完備字典中進(jìn)行稀疏
6、表示,然后用稀疏重建的方法來恢復(fù)出受損部分。因?yàn)橐纛l中相鄰幀之間信息存在著冗余,丟失的部分信息可以利用周圍冗余信息來補(bǔ)全。算法分為過完備字典構(gòu)造和稀疏表示兩個(gè)環(huán)節(jié)。本文在前人工作的基礎(chǔ)上,針對(duì)這兩個(gè)環(huán)節(jié)進(jìn)行了研究改進(jìn):1.過完備字典訓(xùn)練算法對(duì)于過完備字典構(gòu)造,在之前的文獻(xiàn)中采用固定字典,但是音頻種類繁多,不同的音頻具有不同的基頻和共振峰等特征信息,因此固定字典不能很好的反映出特定音頻的結(jié)構(gòu)化特征,針對(duì)這一問題,本文采用訓(xùn)練的方法得到自適應(yīng)字典,在選擇字典訓(xùn)練算法時(shí),為了兼顧算法的高效性和字典中原子的相關(guān)性,本文選用解耦
7、合的K-SVD字典訓(xùn)練算法,即INK-SVD算法,來對(duì)音頻進(jìn)行訓(xùn)練。2.稀疏表示算法對(duì)于稀疏表示,在之前的文獻(xiàn)中多使用OMP算法,這種算法不會(huì)選擇重復(fù)的原子,稀疏表示誤差小,但是,該算法并沒有充分利用音頻幀之間的相關(guān)性信息,即幀之間是存在很大程度上冗余的,本文通過實(shí)驗(yàn)的方法,證明相關(guān)性的存在,為了利用相關(guān)性信息,本文對(duì)傳統(tǒng)的OMP算法進(jìn)行改進(jìn),在選取原子的時(shí)候,考慮到該原子是否在前一幀用過,如果該原子被前一幀選中,則在下一幀中適當(dāng)增加一個(gè)權(quán)重,權(quán)重的大小根據(jù)幀之間相關(guān)性動(dòng)態(tài)調(diào)整,從而提高原子選取的精確性,降低計(jì)算誤差的
8、影響。本文實(shí)驗(yàn)部分是在AudioInpaintingToolbox提供的音頻數(shù)據(jù)集上,使用改進(jìn)型基于OMP的音頻修復(fù)算法對(duì)片段缺失、脈沖干擾、削頂失真等三類不同的受損情況,與傳統(tǒng)的固定Gabor字典相比,改進(jìn)算法在信噪比SNR有4-6dB提升,在主觀評(píng)價(jià)指標(biāo)PESQ上有0.2-0.3提升。關(guān)鍵詞:音頻修復(fù),稀疏表示,字典訓(xùn)練,IN