資源描述:
《基于內(nèi)容的音樂(lè)檢索技術(shù)研究 定稿》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、成績(jī):江西科技師范學(xué)院畢業(yè)設(shè)計(jì)(論文)題目(中文):基于內(nèi)容的音樂(lè)檢索技術(shù)研究(外文):ResearchonContent-BasedMusicRetrievalTechnology系(院):專業(yè):學(xué)生姓名:學(xué)號(hào):指導(dǎo)教師:2011年5月6日33目錄1.緒論11.1課題研究的目的和意義11.2國(guó)內(nèi)外研究狀況21.3核心問(wèn)題和關(guān)鍵技術(shù)32.基于內(nèi)容的音樂(lè)檢索基礎(chǔ)42.1音樂(lè)樂(lè)理基礎(chǔ)42.2音樂(lè)信號(hào)的特征62.3音樂(lè)旋律的表示方法92.4音樂(lè)信息檢索123.MP3音樂(lè)格式分析和旋律特征抽取143.1MP3的音樂(lè)格式分析及編解碼算法143.2旋律特征提取224.單聲部音樂(lè)檢索264.
2、1類簡(jiǎn)譜264.2單聲部查詢音樂(lè)的類簡(jiǎn)譜表示274.3檢索和匹配過(guò)程274.4簡(jiǎn)單舉例275.多聲部音樂(lè)檢索305.1Markov模型和隱Markov模型簡(jiǎn)介305.2和弦特征315.3HMM和聲模型326.總結(jié)33參考文獻(xiàn)3433基于內(nèi)容的音樂(lè)檢索技術(shù)研究摘要:音樂(lè)是一類重要的音頻數(shù)據(jù),傳統(tǒng)的音樂(lè)檢索都是基于關(guān)鍵詞的檢索,使用受限。隨著互聯(lián)網(wǎng)的快速發(fā)展及數(shù)字化設(shè)備的普及,基于內(nèi)容的音樂(lè)檢索研究得到廣泛的關(guān)注?;趦?nèi)容的音樂(lè)檢索就是把音樂(lè)本身的內(nèi)涵,如節(jié)奏、旋律、和弦、伴奏音型、音色等,作為查詢條件,對(duì)一個(gè)由不同格式的音頻媒體(如MIDI、MP3或其它格式的波形音樂(lè))所構(gòu)成的音
3、樂(lè)數(shù)據(jù)庫(kù)實(shí)施查詢檢索以獲取數(shù)據(jù)庫(kù)中滿足查詢條件或包含相同或相似音樂(lè)片段的音樂(lè)資源。這些表征不同音樂(lè)內(nèi)涵的查詢條件可以通過(guò)哼唱或借助現(xiàn)有的樂(lè)譜輸入工具輸入到檢索系統(tǒng)中以實(shí)施檢索。本論文對(duì)基于內(nèi)容的MP3音樂(lè)檢索技術(shù)進(jìn)行了研究,并實(shí)現(xiàn)了一個(gè)靈活的具有多種查詢音樂(lè)輸入方式的MP3音樂(lè)檢索原型系統(tǒng)。關(guān)鍵詞:音樂(lè)檢索;計(jì)算機(jī)音樂(lè);MP3;特征提取;近似匹配1.緒論1.1課題研究的目的和意義音樂(lè)是一類重要的音頻數(shù)據(jù),傳統(tǒng)的音樂(lè)檢索都是基于關(guān)鍵詞的檢索,使用非常受限。隨著多媒體和Internet的廣泛應(yīng)用和深入普及,多媒體數(shù)據(jù)的數(shù)量正在呈指數(shù)增長(zhǎng)。音頻數(shù)據(jù)作為多媒體數(shù)據(jù)的重要組成部分,其信息
4、量也在迅速膨脹。面對(duì)如此海量的音頻數(shù)據(jù),如何快速、準(zhǔn)確地檢索到所需的音頻已成為音頻檢索領(lǐng)域的一個(gè)熱點(diǎn)。傳統(tǒng)的音頻檢索采用文本檢索技術(shù),它們使用基于標(biāo)題或文件名的文本標(biāo)注方式,允許用戶通過(guò)音頻名稱等關(guān)鍵字進(jìn)行檢索。諸如我們生活中接觸到的Google和baidu這樣的搜索引擎。但是,基于文本標(biāo)注的音頻檢索方式具有其固有的局限性:(1)對(duì)音頻信號(hào)的文本描述具有不完整性和主觀性;(2)音頻信息的數(shù)量龐大并增長(zhǎng)迅速,人工標(biāo)注需要花費(fèi)比較高的成本,并且根本無(wú)法完成對(duì)如此大規(guī)模音頻數(shù)據(jù)的標(biāo)注;(3)不能支持實(shí)時(shí)音頻數(shù)據(jù)流的檢索;(4)無(wú)法檢索出與指定音頻數(shù)據(jù)相同的信息等。為了解決上述問(wèn)題,基
5、于內(nèi)容的音樂(lè)檢索技術(shù)應(yīng)運(yùn)而生。所謂基于內(nèi)容的音頻檢索,是指通過(guò)音頻特征分析,對(duì)不同音頻數(shù)據(jù)賦以不同的語(yǔ)義,使具有相同語(yǔ)義的音頻在聽覺(jué)上保持相似。其中,基于內(nèi)容的音樂(lè)檢索是具有較高實(shí)用價(jià)值的一部分?;趦?nèi)容的音樂(lè)檢索是根據(jù)音樂(lè)的內(nèi)容特征,如音樂(lè)的旋律、節(jié)奏等進(jìn)行檢索。目前的音樂(lè)檢索方式大多是基于文本的,即根據(jù)歌名、演唱者、歌詞等關(guān)鍵字進(jìn)行檢索。人們想查找到某首歌曲時(shí),只有通過(guò)這首歌曲的這些文字性信息才能進(jìn)行檢索,如果忘記了這些文字性信息,就無(wú)法找到自己想要的歌曲,這顯然不能滿足人們的搜索需要。另外,基于文本描述的音樂(lè)檢索還需要人們對(duì)大量的音樂(lè)文件進(jìn)行標(biāo)注,這種工作費(fèi)時(shí)又費(fèi)力,并且
6、音樂(lè)CD33層出不窮,完成對(duì)如此大規(guī)模音樂(lè)的標(biāo)注幾乎是不可能的。最重要的是,音樂(lè)的旋律、節(jié)奏等重要特性無(wú)法用文本表達(dá)清楚。為了解決以上問(wèn)題,就需要尋找其它的檢索方式,使得用戶可以方便、快捷地找到想要的音樂(lè)。假如我們能通過(guò)這樣一種檢索方式使得用戶在不知道某首歌曲的名字或演唱者等文字信息,但是對(duì)這首歌的旋律和風(fēng)格等非常熟悉的情況下,對(duì)著麥克風(fēng)將他熟悉的旋律“哼”或“唱”出來(lái),然后通過(guò)計(jì)算機(jī)就可以檢索出與哼唱旋律類似的歌曲該有多好。這種新穎的檢索方式稱為哼唱檢索。哼唱檢索是一種基于內(nèi)容的音樂(lè)檢索方式,它通過(guò)用戶哼唱進(jìn)行檢索,使得用戶只需哼唱一個(gè)歌曲片段,系統(tǒng)便能根據(jù)用戶哼唱的旋律在音
7、樂(lè)數(shù)據(jù)庫(kù)中搜索出與之相似的歌曲。相對(duì)于傳統(tǒng)的基于關(guān)鍵字形式的用戶接口,哼唱檢索給用戶提供了更便捷、更自然、更人性化的檢索方式,并且給用戶帶來(lái)更佳的搜索體驗(yàn)[6]。1.2國(guó)內(nèi)外研究狀況相對(duì)于文本和圖像檢索,基于內(nèi)容的音樂(lè)信息檢索技術(shù)的研究起步較晚,成果也比較有限。但自上個(gè)世紀(jì)90年代以來(lái),研究工作取得較大進(jìn)展。在該研究領(lǐng)域中,比較重要的期刊和會(huì)議包括IEEETransactiononSpeechandAudioProeessing,IEEETransaetiononMultimedia,IEE