資源描述:
《基于數字指紋的音頻檢索系統(tǒng)的設計與實現》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、電子科技大學UNIVERSITYOFELECTRONICSCIENCEANDTECHNOLOGYOFCHINA專業(yè)學位碩士學位論文MASTERTHESISFORPROFESSIONALDEGREE(電子科技大學圖標)論文題目基于數字指紋的音頻檢索系統(tǒng)的設計與實現專業(yè)學位類別工程碩士學號201122250427作者姓名高昕晟指導教師李輝教授分類號密級注1UDC學位論文基于數字指紋的音頻檢索系統(tǒng)的設計與實現(題名和副題名)高昕晟(作者姓名)指導教師李輝教授電子科技大學成都(姓名、職稱、單位名稱)申請學位級別碩士專業(yè)學位類別工程碩士工程領域名稱電子與通信工程提交論文日期2014-4-
2、29論文答辯日期2014-5-27學位授予單位和日期電子科技大學2014年6月日答辯委員會主席評閱人注1:注明《國際十進分類法UDC》的類號。DIGITALFINGERPRINT-BASEDAUDIORETRIEVALSYSTEMDESIGNANDIMPLEMENTATIONAMasterThesisSubmittedtoUniversityofElectronicScienceandTechnologyofChinaMajor:ElectronicsandCommunicationEngineeringAuthor:XinchengGaoAdvisor:ProfessorHu
3、iLiSchool:SchoolofAstronautics&Aeronautics獨創(chuàng)性聲明本人聲明所呈交的學位論文是本人在導師指導下進行的研究工作及取得的研究成果。據我所知,除了文中特別加以標注和致謝的地方外,論文中不包含其他人已經發(fā)表或撰寫過的研究成果,也不包含為獲得電子科技大學或其它教育機構的學位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻均已在論文中作了明確的說明并表示謝意。作者簽名:日期:年月日論文使用授權本學位論文作者完全了解電子科技大學有關保留、使用學位論文的規(guī)定,有權保留并向國家有關部門或機構送交論文的復印件和磁盤,允許論文被查閱和借閱。本人
4、授權電子科技大學可以將學位論文的全部或部分內容編入有關數據庫進行檢索,可以采用影印、縮印或掃描等復制手段保存、匯編學位論文。(保密的學位論文在解密后應遵守此規(guī)定)作者簽名:導師簽名:日期:年月日摘要摘要近年來,隨著多媒體技術的普及,音頻數據在網絡上有了爆炸性的增長,這使得開發(fā)高效的檢索分類音頻數據的方法越來越受到關注。基于內容的音頻檢索系統(tǒng)利用從信號中提取出的聲學特征與數據庫中存儲的聲學特征進行比對從而檢索出音頻信號的元數據(作者,專輯,流派等)。其潛在應用包括自動音頻識別,音頻軌跡跟蹤,版權保護,電視節(jié)目檢索,廣告背景音樂檢測等等。本篇論文主要實現了基于內容的音頻檢索即通過數
5、字音頻指紋來檢索識別音頻文件。數字音頻指紋是從音頻內容中提取出的一段可以代表音頻重要聲學特征的緊致數字簽名,將數字音頻指紋作為用于識別音頻的索引,并和相應的元數據信息內容一起存儲在數據庫中,檢索時將未知音頻文件提取出的數字音頻指紋與數據庫中存儲的進行比對從而識別出未知音頻文件。本文著重對影響著音頻檢索系統(tǒng)魯棒性的幾個重要步驟:特征提取,指紋模型和匹配進行了研究:首先,本文研究比較了幾個頻譜特征,包括梅爾頻率倒譜系數(Mel-FrequencyCepstralCoefficients,MFCCs),色度頻譜(ChromaSpectrum),常數Q值轉換頻譜(ConstantQSp
6、ectrum),以及積譜(ProductSpectrum)。前三個特征提取只是來源于幅度譜,其已經廣泛應用于音頻信號處理及關鍵點檢測,而積譜則利用了幅度譜與群延遲的乘積,它在魯棒語音識別中效率非常高。實驗表明在音頻檢索系統(tǒng)中本文所用的基于積譜的特征提取方法比前三種特征提取方法更具有更高的檢索精確度。其次,本文提出了一個累積相似模型,以便能更好地提取出音頻數據之間的相似度。實驗表明累積相似模型比歐氏距離模型具有更好的效率與精確度。第三,本文使用高斯混合模型來提高音頻檢索系統(tǒng)的魯棒性。高斯混合模型通過使用期望最大值算法(EM)來訓練音頻數據庫,高斯混合模型能更好地描述聲學特征的特點
7、。通過訓練高斯混合模型,數據庫中的音頻和待檢測音頻片段的特征向量都轉換成了象征性的符號標記,然后在數據庫中進行檢索。實驗結果表明了高斯混合模型的優(yōu)點,它即使在嚴重的噪聲失真的情況下依然保持著較高的精確度。最后,通過實驗將本文提出的方法與一種目前通用的音頻檢索方法AudioDNA進行了比較。本文的方法與AudioDNA的最大區(qū)別是聲學特征提取方法的不同與以及相似性度量方法的不同。實驗結果表明,本文提出的方法更能抵抗噪聲攻擊引起的失真。I摘要關鍵詞:數字音頻指紋特征提取高斯混合模型累積相似模型頻