資源描述:
《多媒體數(shù)據(jù)挖掘中圖像數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、2005年12月第3卷第6期地理空間信息GEOSPATIALINFORMATIONDec.,2005Vol.3,No.6中圖分類號:P237.3文獻標識碼:B文章編號:1672-4623(2005)06-0033-03多媒體數(shù)據(jù)挖掘中圖像數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘張鶴,關(guān)澤群(武漢大學(xué)遙感信息工程學(xué)院,湖北武漢430079)摘要:多媒體數(shù)據(jù)挖掘是目前國際上數(shù)據(jù)庫、多媒體技術(shù)和信息決策領(lǐng)域最前沿的研究方向之一,是數(shù)據(jù)挖掘的一個新興且富有挑戰(zhàn)性的子領(lǐng)域。介紹了多媒體數(shù)據(jù)挖掘的系統(tǒng)結(jié)構(gòu),及以圖像數(shù)據(jù)為代表的關(guān)聯(lián)規(guī)則挖掘方法。關(guān)鍵詞:多媒體數(shù)據(jù);數(shù)據(jù)挖掘;圖像數(shù)據(jù);關(guān)聯(lián)規(guī)
2、則;元數(shù)據(jù)CorrelativeRuleofImageDataMininginMultimediaDataMiningZHANGHe,GUANZequn(SchoolofRemoteSensingandInformationEngineering,WuhanUniversity,Wuhan430079,China)Abstract:Multimediadataminingisapopularlyinternationalresearch.Itisoneofutmostfront-lineresearch-
ingorientationsfordatabas
3、e,multimediatechnologyandinformationdecision-makingfieldinternationallyand
alsoasub-fieldfordatabaseminingthatisnewandfullofchallenge.Thisarticleintroducedtheframeworkof
thesystem,andparticularlyintroducedthemethodofthecorrelativeruleminingbytakingimagedataasrepre-
sentative.Keywo
4、rds:Multimediadata;datamining;imagedata;correlativerule;metadata數(shù)據(jù)挖掘是信息技術(shù)自然演化的結(jié)果,它是從大由三部分組成:多媒體數(shù)據(jù)庫(MultimediaDatabase,量的、不完全的、有噪聲的、模糊的、隨機的實際數(shù)簡寫為MD),多媒體數(shù)據(jù)挖掘引擎(MultimediaMin-據(jù)中,提取出隱含在其中的、人們不知道的、但又是ingEngine,簡寫為MME)和挖掘的界面(Multimedia潛在有用的信息和知識的過程,即從數(shù)據(jù)當中發(fā)現(xiàn)趨MiningInterface,簡稱MMI。)其中多媒體數(shù)
5、據(jù)庫包括勢和模式的過程[1]。多媒體數(shù)據(jù)庫因為其數(shù)據(jù)量大,數(shù)數(shù)據(jù)預(yù)處理、特征提取、數(shù)據(jù)描述和數(shù)據(jù)庫的建立幾據(jù)結(jié)構(gòu)復(fù)雜、模式多樣等特點一直是人們研究的熱點個部分,它利用了多媒體檢索系統(tǒng)的數(shù)據(jù)庫,包括媒和難點。因此,對它的數(shù)據(jù)挖掘的研究也越來越多。體庫、特征庫、知識庫;挖掘引擎是多媒體數(shù)據(jù)挖掘而圖像數(shù)據(jù)挖掘作為數(shù)據(jù)挖掘的一個富有挑戰(zhàn)性的子的重要部分,它包括多媒體數(shù)據(jù)特征空間和挖掘功能領(lǐng)域,是目前多媒體數(shù)據(jù)庫和信息決策領(lǐng)域最前沿的模塊兩部分;利用并改進已有的數(shù)據(jù)挖掘方法,使之研究方向之一。適用于多媒體數(shù)據(jù)特征的挖掘,從而發(fā)現(xiàn)用戶感興趣1多媒體數(shù)據(jù)挖掘概述的知識。
6、常用的方法有:人工智能、機器學(xué)習(xí)、統(tǒng)計學(xué)、神經(jīng)網(wǎng)絡(luò)等。發(fā)現(xiàn)的知識也有多種,如:關(guān)聯(lián)規(guī)
多媒體數(shù)據(jù),包括圖形、圖像、文本、視頻和音頻數(shù)據(jù)等,數(shù)據(jù)類型復(fù)雜,多為半結(jié)構(gòu)或非結(jié)構(gòu)化數(shù)則、特征規(guī)則、分類規(guī)則、聚類規(guī)則等。挖掘的界面主要用于挖掘過程的交互和挖掘結(jié)果的可視化[2]。
據(jù)。多媒體數(shù)據(jù)挖掘系統(tǒng)是在基于內(nèi)容的多媒體數(shù)據(jù)2圖像的關(guān)聯(lián)規(guī)則挖掘檢索系統(tǒng)發(fā)展的基礎(chǔ)上出現(xiàn)的。它的一般結(jié)構(gòu)圖如圖1所示。從圖中可以看出,多媒體數(shù)據(jù)挖掘系統(tǒng)主要由于多媒體數(shù)據(jù)在結(jié)構(gòu)、特性、存儲方式等存在不同之處,對他們的數(shù)據(jù)挖掘方法差異很大。即便是同一類型的數(shù)據(jù),應(yīng)用目標或數(shù)據(jù)發(fā)現(xiàn)的模式不同,
7、挖掘方法也不同。這些模式包括預(yù)測、分類、關(guān)聯(lián)、聚類等。挖掘方法或稱挖掘技術(shù)如傳統(tǒng)統(tǒng)計分析、決策樹、遺傳算法、神經(jīng)網(wǎng)絡(luò)、關(guān)聯(lián)分析等都可以用于多媒體數(shù)據(jù)的挖掘。這里主要介紹圖像數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘。圖像數(shù)據(jù)的其他挖掘方法還有相似搜索、多維分析、分類、聚類和預(yù)測分析等。2.1關(guān)聯(lián)規(guī)則挖掘關(guān)聯(lián)規(guī)則是表示數(shù)據(jù)庫中一組對象之間某種關(guān)聯(lián)關(guān)系的規(guī)則。對關(guān)聯(lián)規(guī)則挖掘的研究在數(shù)據(jù)挖掘研究領(lǐng)域開展得比較活躍。關(guān)聯(lián)規(guī)則挖掘一般以事務(wù)為對收稿日期:2004-11-15·34·地理空間信息2005年象,辨別事務(wù)項目之間是否存在某種關(guān)聯(lián)關(guān)系?,F(xiàn)有系可以用數(shù)據(jù)挖掘的方法來發(fā)現(xiàn)。因此,提出了
8、如圖2的研究主要是面向事務(wù)數(shù)據(jù)庫的。問題是這樣描述所示的多媒體圖像