資源描述:
《基于內(nèi)容的音樂檢索技術(shù)研究 定稿》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、成績:江西科技師范學(xué)院畢業(yè)設(shè)計(論文)題目(中文):基于內(nèi)容的音樂檢索技術(shù)研究(外文):ResearchonContent-BasedMusicRetrievalTechnology系(院):專業(yè):學(xué)生姓名:學(xué)號:指導(dǎo)教師:2011年5月6日33目錄1.緒論11.1課題研究的目的和意義11.2國內(nèi)外研究狀況21.3核心問題和關(guān)鍵技術(shù)32.基于內(nèi)容的音樂檢索基礎(chǔ)42.1音樂樂理基礎(chǔ)42.2音樂信號的特征62.3音樂旋律的表示方法92.4音樂信息檢索123.MP3音樂格式分析和旋律特征抽取143.1MP3的音樂格式分析及編解碼算法143.2旋律特征提取224.單聲部音樂檢索264.
2、1類簡譜264.2單聲部查詢音樂的類簡譜表示274.3檢索和匹配過程274.4簡單舉例275.多聲部音樂檢索305.1Markov模型和隱Markov模型簡介305.2和弦特征315.3HMM和聲模型326.總結(jié)33參考文獻(xiàn)3433基于內(nèi)容的音樂檢索技術(shù)研究摘要:音樂是一類重要的音頻數(shù)據(jù),傳統(tǒng)的音樂檢索都是基于關(guān)鍵詞的檢索,使用受限。隨著互聯(lián)網(wǎng)的快速發(fā)展及數(shù)字化設(shè)備的普及,基于內(nèi)容的音樂檢索研究得到廣泛的關(guān)注。基于內(nèi)容的音樂檢索就是把音樂本身的內(nèi)涵,如節(jié)奏、旋律、和弦、伴奏音型、音色等,作為查詢條件,對一個由不同格式的音頻媒體(如MIDI、MP3或其它格式的波形音樂)所構(gòu)成的音
3、樂數(shù)據(jù)庫實(shí)施查詢檢索以獲取數(shù)據(jù)庫中滿足查詢條件或包含相同或相似音樂片段的音樂資源。這些表征不同音樂內(nèi)涵的查詢條件可以通過哼唱或借助現(xiàn)有的樂譜輸入工具輸入到檢索系統(tǒng)中以實(shí)施檢索。本論文對基于內(nèi)容的MP3音樂檢索技術(shù)進(jìn)行了研究,并實(shí)現(xiàn)了一個靈活的具有多種查詢音樂輸入方式的MP3音樂檢索原型系統(tǒng)。關(guān)鍵詞:音樂檢索;計算機(jī)音樂;MP3;特征提取;近似匹配1.緒論1.1課題研究的目的和意義音樂是一類重要的音頻數(shù)據(jù),傳統(tǒng)的音樂檢索都是基于關(guān)鍵詞的檢索,使用非常受限。隨著多媒體和Internet的廣泛應(yīng)用和深入普及,多媒體數(shù)據(jù)的數(shù)量正在呈指數(shù)增長。音頻數(shù)據(jù)作為多媒體數(shù)據(jù)的重要組成部分,其信息
4、量也在迅速膨脹。面對如此海量的音頻數(shù)據(jù),如何快速、準(zhǔn)確地檢索到所需的音頻已成為音頻檢索領(lǐng)域的一個熱點(diǎn)。傳統(tǒng)的音頻檢索采用文本檢索技術(shù),它們使用基于標(biāo)題或文件名的文本標(biāo)注方式,允許用戶通過音頻名稱等關(guān)鍵字進(jìn)行檢索。諸如我們生活中接觸到的Google和baidu這樣的搜索引擎。但是,基于文本標(biāo)注的音頻檢索方式具有其固有的局限性:(1)對音頻信號的文本描述具有不完整性和主觀性;(2)音頻信息的數(shù)量龐大并增長迅速,人工標(biāo)注需要花費(fèi)比較高的成本,并且根本無法完成對如此大規(guī)模音頻數(shù)據(jù)的標(biāo)注;(3)不能支持實(shí)時音頻數(shù)據(jù)流的檢索;(4)無法檢索出與指定音頻數(shù)據(jù)相同的信息等。為了解決上述問題,基
5、于內(nèi)容的音樂檢索技術(shù)應(yīng)運(yùn)而生。所謂基于內(nèi)容的音頻檢索,是指通過音頻特征分析,對不同音頻數(shù)據(jù)賦以不同的語義,使具有相同語義的音頻在聽覺上保持相似。其中,基于內(nèi)容的音樂檢索是具有較高實(shí)用價值的一部分?;趦?nèi)容的音樂檢索是根據(jù)音樂的內(nèi)容特征,如音樂的旋律、節(jié)奏等進(jìn)行檢索。目前的音樂檢索方式大多是基于文本的,即根據(jù)歌名、演唱者、歌詞等關(guān)鍵字進(jìn)行檢索。人們想查找到某首歌曲時,只有通過這首歌曲的這些文字性信息才能進(jìn)行檢索,如果忘記了這些文字性信息,就無法找到自己想要的歌曲,這顯然不能滿足人們的搜索需要。另外,基于文本描述的音樂檢索還需要人們對大量的音樂文件進(jìn)行標(biāo)注,這種工作費(fèi)時又費(fèi)力,并且
6、音樂CD33層出不窮,完成對如此大規(guī)模音樂的標(biāo)注幾乎是不可能的。最重要的是,音樂的旋律、節(jié)奏等重要特性無法用文本表達(dá)清楚。為了解決以上問題,就需要尋找其它的檢索方式,使得用戶可以方便、快捷地找到想要的音樂。假如我們能通過這樣一種檢索方式使得用戶在不知道某首歌曲的名字或演唱者等文字信息,但是對這首歌的旋律和風(fēng)格等非常熟悉的情況下,對著麥克風(fēng)將他熟悉的旋律“哼”或“唱”出來,然后通過計算機(jī)就可以檢索出與哼唱旋律類似的歌曲該有多好。這種新穎的檢索方式稱為哼唱檢索。哼唱檢索是一種基于內(nèi)容的音樂檢索方式,它通過用戶哼唱進(jìn)行檢索,使得用戶只需哼唱一個歌曲片段,系統(tǒng)便能根據(jù)用戶哼唱的旋律在音
7、樂數(shù)據(jù)庫中搜索出與之相似的歌曲。相對于傳統(tǒng)的基于關(guān)鍵字形式的用戶接口,哼唱檢索給用戶提供了更便捷、更自然、更人性化的檢索方式,并且給用戶帶來更佳的搜索體驗[6]。1.2國內(nèi)外研究狀況相對于文本和圖像檢索,基于內(nèi)容的音樂信息檢索技術(shù)的研究起步較晚,成果也比較有限。但自上個世紀(jì)90年代以來,研究工作取得較大進(jìn)展。在該研究領(lǐng)域中,比較重要的期刊和會議包括IEEETransactiononSpeechandAudioProeessing,IEEETransaetiononMultimedia,IEE