資源描述:
《基于內(nèi)容的音頻檢索技術(shù)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、摘要20世紀(jì)90年代,多媒體信息檢索技術(shù)的研究引起了人們的極大興趣,開(kāi)始階段人們的注意力主要集中在基于內(nèi)容的圖像檢索和視頻檢索這兩個(gè)方面。但隨著音頻數(shù)據(jù)的大量出現(xiàn),人們?cè)絹?lái)越認(rèn)識(shí)到音頻檢索的重要性。而音頻信號(hào)數(shù)字處理、語(yǔ)音識(shí)別、說(shuō)話者識(shí)別和音樂(lè)的自動(dòng)記譜技術(shù)的日益成熟,則為基于內(nèi)容的音頻檢索的研究提供了必要的技術(shù)準(zhǔn)備?;趦?nèi)容的音頻檢索技術(shù)在相當(dāng)多的領(lǐng)域中都具有極大的應(yīng)用價(jià)值,例如,遠(yuǎn)程教學(xué)、衛(wèi)生醫(yī)療、數(shù)字圖書(shū)館、環(huán)境監(jiān)測(cè)、新聞節(jié)目檢索和娛樂(lè)節(jié)目的編輯和制作等。其研究?jī)?nèi)容可以概括為音頻內(nèi)容的自動(dòng)分類和分割、語(yǔ)音檢索、音樂(lè)檢索、內(nèi)容的描
2、述和索引、用戶查詢的構(gòu)造和細(xì)化等幾個(gè)方面。本文在認(rèn)真總結(jié)了前人的研究成果的基礎(chǔ)上,從音頻內(nèi)容的自動(dòng)分析著手,著重解決音頻中基于內(nèi)容的音頻自動(dòng)分類方面的問(wèn)題。本文的主要內(nèi)容包括以下幾個(gè)方面:(1)音頻的數(shù)據(jù)模型;(2)隱馬爾可夫模型模型(HMM)基本理論:(3)基于HMM的音頻內(nèi)容的自動(dòng)分類算法。關(guān)鍵詞:基于內(nèi)容的音頻檢索技術(shù),基于內(nèi)容的音頻自動(dòng)分類,隱馬爾可夫模型,支持向量機(jī),MPEG-7,音頻特征,音頻數(shù)據(jù)模型。遼寧工程技術(shù)大學(xué)碩士學(xué)位論文1ABSTRACTMultimediainformationretrievalhasbecom
3、eoneofthemostactiveresearchareasinattractedpeopleinthepastdecades.Andintilebeginningmostworkwereconcentratedoncontent-basedimageretrieval(CBIR)andcontent-basedvideoretrieval(CBVR).However,astherearemoreandmoredigitalaudiodatainplaceatpresent,peoplestarttorealizetheimpor
4、tanceofcontent一basedaudioretrieval.Withtiledevelopmentofsomerelatedkeytechnologiesincludingaudiosignalprocess,speechrecognition,speakerrecognition,andmusicautomatictranscription,etc,ithasestablishedthebasisofcontent-basedaudioretrieval((BAR).Content-basedaudioretrievalh
5、asawiderangeofapplicationsindistanceeducationmedicaltreatment,digitallibrary,environmentdetection,newsprogramretrieval,entertainmentindustry,andsurveillance,andsoon.Manyresearcheshavebeendoneoncontent一basedaudioclassificationandsegmentation,spokendocumentretrieval(SDR),
6、musicretrieval,audiocontentdescriptionandindexing,andqueiyconstructionandrefinement.Incorporatingtheseresearchfruits,thisdissertationdealswithautomaticaudiocontentanalysisthatsolvesthefollowingproblems,suchascontent-basedaudioclassification.Themajorcontentofthisdisserta
7、tioncanbeconcludedasfollows:(1)AudioDataPattern;(2)TheBasisTheoreticalofHiddenMarkovModel(HMM);(3)ResearchonHiddenMarkovModelbasedAutomaticAudioClassificationAlgorithm.Keywords:Content-basedAudioRetrieval,Content-basedAutomaticAudioClassification,HiddenMarkovModel(HMM),
8、SupportVectorMachine(SVM),MPEG一7,AudioCharacteristics,AudioDataPattern.插圖索引圖1.1音頻內(nèi)容的抽象層次·.....................