資源描述:
《基于數(shù)字指紋的音頻檢索研究_陳劍鋒 - 6.7》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、碩士學(xué)位論文基于數(shù)字指紋的音頻檢索研究作者姓名陳劍鋒學(xué)科專業(yè)計(jì)算機(jī)應(yīng)用技術(shù)指導(dǎo)教師王知衍所在學(xué)院計(jì)算機(jī)科學(xué)與工程學(xué)院論文提交日期二〇一一年五月ResearchontheAudioRetrievalBasedonDigitalFingerprintingADissertationSubmittedfortheDegreeofMasterCandidate:ChenJianfengSupervisor:Prof.WangZhiyanSouthChinaUniversityofTechnologyGuangzhou,China分類號(hào):TP391.41學(xué)校代號(hào):1056
2、1學(xué)號(hào):200820111126華南理工大學(xué)碩士學(xué)位論文基于數(shù)字指紋的音頻檢索研究作者姓名:陳劍鋒指導(dǎo)教師姓名、職稱:王知衍教授申請(qǐng)學(xué)位級(jí)別:碩士學(xué)科專業(yè)名稱:計(jì)算機(jī)應(yīng)用技術(shù)研究方向:圖像處理和模式識(shí)別論文提交日期:2011年4月20日論文答辯日期:2011年6月5日學(xué)位授予單位:華南理工大學(xué)學(xué)位授予日期:年月日答辯委員會(huì)成員:主席:委員:華南理工大學(xué)學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立進(jìn)行研究所取得的研究成果。除了文中特別加以標(biāo)注引用的內(nèi)容外,本論文不包含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫的成果作品。對(duì)本文的研究做出重要貢獻(xiàn)的個(gè)人
3、和集體,均已在文中以明確方式標(biāo)明。本人完全意識(shí)到本聲明的法律后果由本人承擔(dān)。作者簽名:日期:年月日學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,即:研究生在校攻讀學(xué)位期間論文工作的知識(shí)產(chǎn)權(quán)單位屬華南理工大學(xué)。學(xué)校有權(quán)保存并向國(guó)家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許學(xué)位論文被查閱(除在保密期內(nèi)的保密論文外);學(xué)??梢怨紝W(xué)位論文的全部或部分內(nèi)容,可以允許采用影印、縮印或其它復(fù)制手段保存、匯編學(xué)位論文。本人電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相一致。本學(xué)位論文屬于:□保密,在年解密后適用本授權(quán)書?!醪槐C?,同意在校園網(wǎng)上發(fā)布,供校內(nèi)
4、師生和與學(xué)校有共享協(xié)議的單位瀏覽;同意將本人學(xué)位論文提交中國(guó)學(xué)術(shù)期刊(光盤版)電子雜志社全文出版和編入CNKI《中國(guó)知識(shí)資源總庫(kù)》,傳播學(xué)位論文的全部或部分內(nèi)容。(請(qǐng)?jiān)谝陨舷鄳?yīng)方框內(nèi)打“√”)作者簽名:日期:指導(dǎo)教師簽名:日期作者聯(lián)系電話:電子郵箱:聯(lián)系地址(含郵編):摘要隨著互聯(lián)網(wǎng)的普及,尤其是移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來(lái),上網(wǎng)終端的多樣化使得多媒體應(yīng)用特別是音樂(lè)應(yīng)用,越來(lái)越深入人們的日常生活,這使得數(shù)字音頻內(nèi)容得到了極大的豐富,對(duì)數(shù)字音頻數(shù)據(jù)的管理也越來(lái)越重要。但是,人工管理海量的數(shù)字音頻數(shù)據(jù)是一件幾乎無(wú)法完成的工作,這就直接促使了音頻指紋技術(shù)的快速發(fā)展。音頻指紋是
5、一段基于音頻內(nèi)容的緊湊數(shù)字簽名,其目的是建立一種用于比較兩個(gè)音樂(lè)數(shù)據(jù)聽覺(jué)質(zhì)量的有效機(jī)制,可用于數(shù)字音頻內(nèi)容的音頻內(nèi)容識(shí)別、版權(quán)保護(hù)、內(nèi)容完整性校驗(yàn)等領(lǐng)域。本文介紹了音頻指紋技術(shù)的基本概念、產(chǎn)生背景、應(yīng)用領(lǐng)域和總體框架,并圍繞音頻指紋的關(guān)鍵技術(shù)展開研究,主要的工作有以下幾個(gè)方面:l)概述了現(xiàn)有的音頻指紋提取算法,并分析研究了一些經(jīng)典的音頻指紋提取算法,指出了各種經(jīng)典算法的優(yōu)缺點(diǎn)。2)分析了現(xiàn)有音頻指紋提取算法后,提出一種新的基于計(jì)算機(jī)視覺(jué)技術(shù)的音頻指紋提取算法,即采用一種基于小波變換并用LDA對(duì)其進(jìn)行降維的方法,來(lái)用于音頻指紋的提取。3)提取指紋后,分析了指紋在數(shù)
6、據(jù)庫(kù)中進(jìn)行檢索的相關(guān)算法,也對(duì)比了它們的優(yōu)缺點(diǎn)。4)針對(duì)本文音頻指紋數(shù)據(jù)庫(kù)數(shù)據(jù)量大、數(shù)據(jù)維數(shù)高的特點(diǎn),采用一種近似最近鄰的高維數(shù)據(jù)索引算法—位置敏感哈希(LocalitySensitiveHashing,LSH)算法用于音頻指紋檢索,并結(jié)合本文的應(yīng)用進(jìn)行了算法參數(shù)優(yōu)化。5)利用本文研究的音頻指紋提取和檢索算法,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)音頻指紋檢索系統(tǒng),取得了良好的效果。關(guān)鍵字:音頻檢索;音頻指紋;小波;高維索引IAbstractWiththepopularityoftheInternet,especiallythecomingoftheeraofmobileintern
7、et,thediversityoftheinternetterminalmakesmultimediaapplications,especiallymusicapplications,takeamoreandmoreimportantpartinpeople’sdailylives,whichleadstotheenrichmentofdigitalaudiocontentandtheimportanceofaudiodata’smanagement.However,themanualmanagementofvastamountsofdigitalaudioda
8、taisanalmost