資源描述:
《多媒體數(shù)據(jù)庫技術(shù)9.ppt》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在PPT專區(qū)-天天文庫。
1、多媒體技術(shù)及應(yīng)用第9章多媒體數(shù)據(jù)庫技術(shù)——基于內(nèi)容的檢索與查詢多媒體數(shù)據(jù)對數(shù)據(jù)庫操作,特別是對數(shù)據(jù)庫操作的檢索與查詢提出了新的要求。非多媒體數(shù)據(jù)庫一般只提供基于表示形式的檢索,提供諸如關(guān)鍵字一類的檢索和查詢。多媒體數(shù)據(jù)庫則提供基于內(nèi)容的檢索,要求數(shù)據(jù)庫系統(tǒng)能對圖像或聲音等媒體進(jìn)行內(nèi)容語義分析,以達(dá)到更深的檢索層次。1.基于內(nèi)容的查詢基于內(nèi)容的查詢是MMDBS的一項(xiàng)高級功能,通過這一功能,用戶可以查找和獲取包含特定內(nèi)容的多媒體對象,例如,講述多媒體數(shù)據(jù)庫的文章、包含黑色轎車的圖片等。為了支持這一功能,MMDBS需要解決一系列新的問題,
2、例如,如何提取多媒體對象包含的內(nèi)容、如何對內(nèi)容進(jìn)行抽象及表示、如何為多媒體對象建立基于內(nèi)容的索引、如何提交內(nèi)容查詢、如何處理內(nèi)容查詢等。內(nèi)容查詢機(jī)制是MMDBS中一個(gè)較為復(fù)雜的子系統(tǒng),在諸如文檔資料管理系統(tǒng)、地理信息系統(tǒng)中有著廣泛的應(yīng)用2.多媒體對象的內(nèi)容屬性多媒體對象的內(nèi)容屬性是對多媒體對象所含內(nèi)容的一種概括性描述。例如,我們可以利用關(guān)鍵詞來概括文字對象的內(nèi)容、可以利用彩色直方圖來概括圖像對象的內(nèi)容等。內(nèi)容屬性能否準(zhǔn)確合理地表示多媒體對象的內(nèi)容會對內(nèi)容查詢的好壞產(chǎn)生直接的影響,因此,如何為庫存的多媒體對象選取恰當(dāng)?shù)膬?nèi)容屬性,就成為
3、了MMDBS在實(shí)現(xiàn)內(nèi)容查詢這一功能時(shí)應(yīng)當(dāng)首先解決的問題。下面,僅就一些媒體類型常見的內(nèi)容屬性作簡要的介紹。1)文本關(guān)鍵詞常被選作文本對象的內(nèi)容屬性。關(guān)鍵詞的取值為一個(gè)集合,由若干單詞構(gòu)成,這些單詞在文章中出現(xiàn)的頻率較高且反映了文章的主題。例如,一篇討論多媒體數(shù)據(jù)庫的文章,其關(guān)鍵詞可以是“多媒體”、“數(shù)據(jù)庫”和“MMDBS”。我們稱所有庫存文本對象關(guān)鍵詞屬性的集合為詞匯,詞匯往往同文本對象的應(yīng)用領(lǐng)域(如計(jì)算機(jī)應(yīng)用、經(jīng)濟(jì)等)有關(guān),是對某個(gè)領(lǐng)域具有代表性的單詞的匯總。此外,為了支持較為復(fù)雜的文本內(nèi)容查詢,一些MMDBS除了保存及管理詞匯之
4、外,還進(jìn)一步從應(yīng)用領(lǐng)域的特點(diǎn)出發(fā),發(fā)掘并維護(hù)與之密切相關(guān)的信息。以概念查詢?yōu)槔4嬖~匯之外,系統(tǒng)還維護(hù)某領(lǐng)域常用單詞之間在概念上的關(guān)聯(lián)關(guān)系。2)圖形圖形對象由若干彼此之間具有一定空域約束關(guān)系的幾何體構(gòu)成。幾何體的各種特征(如幾何體的形狀特征、面積、周長等)以及幾何體之間的位置關(guān)系(如幾何體的空間位置、幾何體間空域關(guān)系的類型等)常被選作圖形對象的內(nèi)容屬性。由于圖形對象與其應(yīng)用領(lǐng)域有關(guān),因此圖形對象的內(nèi)容屬性是與其應(yīng)用領(lǐng)域(如VLSI,CAD,GIS等)的特點(diǎn)相對應(yīng)的。(1)圖像。圖像對象常見的內(nèi)容屬性包括顏色、紋理、對象特征、圖像
5、邊緣等?,F(xiàn)簡單討論如下:①顏色。圖像的顏色特征常由顏色直方圖來表示。顏色直方圖反映了圖像像素在彩色空間的分布狀況,而與圖像包含的對象(如汽車、房屋、樹林等)關(guān)系不大。為了建立起顏色分布狀況與圖像中某些位置間的關(guān)聯(lián)關(guān)系,除了計(jì)算整幅圖像的顏色直方圖外,還可以將圖像分割為一系列區(qū)域,并獲取每個(gè)區(qū)域的顏色直方圖。②紋理。很多圖像在局部區(qū)域內(nèi)呈現(xiàn)不規(guī)則性,但在整體上表現(xiàn)出規(guī)律性,習(xí)慣上把圖像的這種特性稱為紋理。圖像內(nèi)容的紋理特征可進(jìn)一步由粗糙性、方向性及對比度3個(gè)參數(shù)來表示。③對象特征。顏色、紋理的內(nèi)容屬性反映了圖像數(shù)據(jù)自身的物理特點(diǎn),并不
6、能直接表示圖像所含的對象。為了支持用戶對包含某類對象的圖像的查詢(如返回所有包含汽車的圖片等),圖像中關(guān)鍵的對象的特征也常常被作為圖像的內(nèi)容屬性,這些特征包括對象的大小、對象在圖像中的位置以及形狀等。由于人們對形狀相似性的理解帶有較強(qiáng)的主觀色彩,因而對形狀的表示及比對是圖像內(nèi)容查詢中的難題。④邊緣特征。某些系統(tǒng)允許用戶在定義查詢表示時(shí),使用繪圖工具手工勾勒出目標(biāo)對象的邊沿形狀。這時(shí),系統(tǒng)就需要選取邊緣特征作為圖像的內(nèi)容屬性。在圖像分析中,圖像灰度級的局部不連續(xù)性稱為局部邊沿或邊沿元,而由諸多邊沿元沿其切線方向連接成的大范圍的線段,稱
7、為邊緣。所謂邊緣特征,是指一個(gè)由一幅圖像中若干邊緣構(gòu)成的集合,這些邊緣能夠抽象地表示圖像的內(nèi)容,如圖像所包含對象的輪廓等。此外,內(nèi)容屬性還有與生成圖像的應(yīng)用領(lǐng)域緊密相關(guān)的屬性,如在一個(gè)臉部圖像系統(tǒng)中,內(nèi)容屬性還包含五官的相對位置關(guān)系等。(2)視頻對象。視頻對象由一系列靜止圖像構(gòu)成,每幅圖像被稱為幀,即幀是視頻對象最基本的構(gòu)成單元。由于不同幀之間在內(nèi)容上關(guān)聯(lián)程度不同,所以在對視頻對象的內(nèi)容進(jìn)行抽象之前,往往需要首先對其進(jìn)行必要的層次劃分。因此,對視頻對象內(nèi)容的抽象可以轉(zhuǎn)化為對某些關(guān)鍵性鏡頭的內(nèi)容的抽象,相應(yīng)地,視頻對象的內(nèi)容屬性是那些
8、關(guān)鍵性鏡頭在內(nèi)容上呈現(xiàn)出來的特征,如鏡頭所含的各種攝像動作(如搖、推、拉、追蹤等)、鏡頭中運(yùn)動物體和鏡頭的關(guān)鍵幀等。鏡頭(Shot)由攝像機(jī)對某一場景不間斷地記錄時(shí)所獲取的視頻數(shù)據(jù)構(gòu)成,一個(gè)鏡頭所包含的各幀在內(nèi)容上最為相關(guān),即鏡頭是對