資源描述:
《基于內(nèi)容的海量音頻高效檢索》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、萬方數(shù)據(jù)太原理工大學碩士研究生學位論文VI萬方數(shù)據(jù)太原理工大學碩士研究生學位論文目錄第一章緒論??????????????.?...?.?.....11.1課題研究背景及意義????.??.????..????.11.1.1課題研究背景???????.??????.?...11.1.2課題研究意義???????????.?...?....21.2基于內(nèi)容的音頻檢索系統(tǒng)國內(nèi)外應用現(xiàn)狀???..???...??.21.3課題主要研究內(nèi)容????????????????.41.4論文結(jié)構(gòu)????????????.???...?....5第二章音頻指紋???????????
2、????????72.1音頻特征介紹??.??????????????....72.2音頻指紋概述???????????..???.??..92.2.1音頻指紋定義???????.?????..??..92.2.2音頻指紋優(yōu)點?????????????.??.102.2.3音頻指紋性質(zhì)?????????.???..??.102.2.3音頻指紋應用???????????????.132.2.5音頻指紋相關(guān)研究???????????..??.132.3音頻指紋提取???????????.?..????.152.3.1音頻指紋提取過程??????.???.??.??.15
3、2.3.2Philips音頻指紋提取算法?????????.??.162.3.3Philips音頻指紋的誤判率和魯棒性??????..??.182.4本章小結(jié)??????????????????.21第三章基于內(nèi)容的音頻檢索.???????????????233.1基于內(nèi)容的音頻檢索框架???????????.??..233.2音頻檢索算法綜述????????????????253.2相似度匹配方法??????????????.??.263.3基于Philips指紋的檢索算法?.???.???????...273.3.1Phi1ips檢索算法????????????
4、??.273.3.2基于Fibonacci哈希的檢索算法???????..??.293.4檢索算法性能指標???????????.??.??.303.5本章小結(jié)???..’????????????.??.31第四章基于內(nèi)容的高效階梯式海量音頻過濾檢索系統(tǒng)??.???..??.334.1過濾檢索系統(tǒng)框架???????????.??..??334.2過濾檢索系統(tǒng)具體實現(xiàn)????????????.??.344.2.1音頻首尾靜音去除?????????????一.344.2.2音頻過濾指紋生成??????????????354.2.3基于閾值的固定間隔抽樣匹配算法???.?
5、.????..364.3實驗數(shù)據(jù)與分析????????????????..384.3.1實驗環(huán)境????????????????..384.3.2實驗設(shè)計????????????????..384.3.3實驗結(jié)果和分析??????????????..394.4本章小結(jié)????????????????.??45ⅥI萬方數(shù)據(jù)太原理工大學碩士研究生學位論文第五章研究結(jié)論和未來展望???????.?????..??..475.1研究結(jié)論????????????..?..?..??..475.2未來展望????..???????.....???.??47參考文獻???????
6、??.???????.???....49致謝??.??????????????.???.?.?53碩士期間發(fā)表的學術(shù)論文??????????..???..??.55ⅥII萬方數(shù)據(jù)太原理工大學碩士研究生學位論文1.1課題研究背景及意義1.1.1課題研究背景第一章緒論弟一早殖記隨著現(xiàn)代科技的飛速進步和網(wǎng)絡(luò)知識的全民普及,網(wǎng)絡(luò)數(shù)字化的時代已經(jīng)到來。作為互聯(lián)網(wǎng)載體承載的主要對象,數(shù)字多媒體資源數(shù)量每時每刻都在急劇增長。高容量存儲媒介為海量的數(shù)字多媒體資源的存儲實現(xiàn)提供了有利的條件,使得多媒體內(nèi)容在各行各業(yè)得到了廣泛應用。以數(shù)字音頻為例,近年來音樂門戶網(wǎng)站、音樂論壇、網(wǎng)絡(luò)音樂
7、播放器、網(wǎng)絡(luò)廣播電臺等音頻媒介如同雨后春筍般在互聯(lián)網(wǎng)中大規(guī)模涌現(xiàn),形形色色的數(shù)字音頻資源應有盡有,極大程度地滿足了人們的精神生活需求,大家可以根據(jù)自己了解的音頻信息在各大搜索引擎中檢索所需要的音頻文件。但隨著時間的推移和音頻內(nèi)容的不斷豐富,人們對音頻檢索的需求也不再僅僅滿足于根據(jù)音頻的名稱、作者等屬性進行檢索,而更希望能通過一段音頻內(nèi)容本身(例如在出租車上聽到某電臺的一段未知信息的音樂旋律)來在海量的音頻資源中搜尋自己希望得到的目標結(jié)果。這一大眾需求直接促使了基于內(nèi)容的音頻檢索(Content-BasedAudioRetrieval.CBAR)技術(shù)【l】【2】的