資源描述:
《多媒體數(shù)據(jù)挖掘中圖像數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、2005年12月第3卷第6期地理空間信息GEOSPATIALINFORMATIONDec.,2005Vol.3,No.6中圖分類號(hào):P237.3文獻(xiàn)標(biāo)識(shí)碼:B文章編號(hào):1672-4623(2005)06-0033-03多媒體數(shù)據(jù)挖掘中圖像數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘張鶴,關(guān)澤群(武漢大學(xué)遙感信息工程學(xué)院,湖北武漢430079)摘要:多媒體數(shù)據(jù)挖掘是目前國(guó)際上數(shù)據(jù)庫(kù)、多媒體技術(shù)和信息決策領(lǐng)域最前沿的研究方向之一,是數(shù)據(jù)挖掘的一個(gè)新興且富有挑戰(zhàn)性的子領(lǐng)域。介紹了多媒體數(shù)據(jù)挖掘的系統(tǒng)結(jié)構(gòu),及以圖像數(shù)據(jù)為代表的關(guān)聯(lián)規(guī)則挖掘方法。關(guān)鍵詞:多媒體數(shù)據(jù);數(shù)據(jù)挖掘;圖像數(shù)據(jù);關(guān)聯(lián)規(guī)
2、則;元數(shù)據(jù)CorrelativeRuleofImageDataMininginMultimediaDataMiningZHANGHe,GUANZequn(SchoolofRemoteSensingandInformationEngineering,WuhanUniversity,Wuhan430079,China)Abstract:Multimediadataminingisapopularlyinternationalresearch.Itisoneofutmostfront-lineresearch-
ingorientationsfordatabas
3、e,multimediatechnologyandinformationdecision-makingfieldinternationallyand
alsoasub-fieldfordatabaseminingthatisnewandfullofchallenge.Thisarticleintroducedtheframeworkof
thesystem,andparticularlyintroducedthemethodofthecorrelativeruleminingbytakingimagedataasrepre-
sentative.Keywo
4、rds:Multimediadata;datamining;imagedata;correlativerule;metadata數(shù)據(jù)挖掘是信息技術(shù)自然演化的結(jié)果,它是從大由三部分組成:多媒體數(shù)據(jù)庫(kù)(MultimediaDatabase,量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際數(shù)簡(jiǎn)寫為MD),多媒體數(shù)據(jù)挖掘引擎(MultimediaMin-據(jù)中,提取出隱含在其中的、人們不知道的、但又是ingEngine,簡(jiǎn)寫為MME)和挖掘的界面(Multimedia潛在有用的信息和知識(shí)的過(guò)程,即從數(shù)據(jù)當(dāng)中發(fā)現(xiàn)趨MiningInterface,簡(jiǎn)稱MMI。)其中多媒體數(shù)
5、據(jù)庫(kù)包括勢(shì)和模式的過(guò)程[1]。多媒體數(shù)據(jù)庫(kù)因?yàn)槠鋽?shù)據(jù)量大,數(shù)數(shù)據(jù)預(yù)處理、特征提取、數(shù)據(jù)描述和數(shù)據(jù)庫(kù)的建立幾據(jù)結(jié)構(gòu)復(fù)雜、模式多樣等特點(diǎn)一直是人們研究的熱點(diǎn)個(gè)部分,它利用了多媒體檢索系統(tǒng)的數(shù)據(jù)庫(kù),包括媒和難點(diǎn)。因此,對(duì)它的數(shù)據(jù)挖掘的研究也越來(lái)越多。體庫(kù)、特征庫(kù)、知識(shí)庫(kù);挖掘引擎是多媒體數(shù)據(jù)挖掘而圖像數(shù)據(jù)挖掘作為數(shù)據(jù)挖掘的一個(gè)富有挑戰(zhàn)性的子的重要部分,它包括多媒體數(shù)據(jù)特征空間和挖掘功能領(lǐng)域,是目前多媒體數(shù)據(jù)庫(kù)和信息決策領(lǐng)域最前沿的模塊兩部分;利用并改進(jìn)已有的數(shù)據(jù)挖掘方法,使之研究方向之一。適用于多媒體數(shù)據(jù)特征的挖掘,從而發(fā)現(xiàn)用戶感興趣1多媒體數(shù)據(jù)挖掘概述的知識(shí)。
6、常用的方法有:人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、神經(jīng)網(wǎng)絡(luò)等。發(fā)現(xiàn)的知識(shí)也有多種,如:關(guān)聯(lián)規(guī)
多媒體數(shù)據(jù),包括圖形、圖像、文本、視頻和音頻數(shù)據(jù)等,數(shù)據(jù)類型復(fù)雜,多為半結(jié)構(gòu)或非結(jié)構(gòu)化數(shù)則、特征規(guī)則、分類規(guī)則、聚類規(guī)則等。挖掘的界面主要用于挖掘過(guò)程的交互和挖掘結(jié)果的可視化[2]。
據(jù)。多媒體數(shù)據(jù)挖掘系統(tǒng)是在基于內(nèi)容的多媒體數(shù)據(jù)2圖像的關(guān)聯(lián)規(guī)則挖掘檢索系統(tǒng)發(fā)展的基礎(chǔ)上出現(xiàn)的。它的一般結(jié)構(gòu)圖如圖1所示。從圖中可以看出,多媒體數(shù)據(jù)挖掘系統(tǒng)主要由于多媒體數(shù)據(jù)在結(jié)構(gòu)、特性、存儲(chǔ)方式等存在不同之處,對(duì)他們的數(shù)據(jù)挖掘方法差異很大。即便是同一類型的數(shù)據(jù),應(yīng)用目標(biāo)或數(shù)據(jù)發(fā)現(xiàn)的模式不同,
7、挖掘方法也不同。這些模式包括預(yù)測(cè)、分類、關(guān)聯(lián)、聚類等。挖掘方法或稱挖掘技術(shù)如傳統(tǒng)統(tǒng)計(jì)分析、決策樹、遺傳算法、神經(jīng)網(wǎng)絡(luò)、關(guān)聯(lián)分析等都可以用于多媒體數(shù)據(jù)的挖掘。這里主要介紹圖像數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘。圖像數(shù)據(jù)的其他挖掘方法還有相似搜索、多維分析、分類、聚類和預(yù)測(cè)分析等。2.1關(guān)聯(lián)規(guī)則挖掘關(guān)聯(lián)規(guī)則是表示數(shù)據(jù)庫(kù)中一組對(duì)象之間某種關(guān)聯(lián)關(guān)系的規(guī)則。對(duì)關(guān)聯(lián)規(guī)則挖掘的研究在數(shù)據(jù)挖掘研究領(lǐng)域開展得比較活躍。關(guān)聯(lián)規(guī)則挖掘一般以事務(wù)為對(duì)收稿日期:2004-11-15·34·地理空間信息2005年象,辨別事務(wù)項(xiàng)目之間是否存在某種關(guān)聯(lián)關(guān)系?,F(xiàn)有系可以用數(shù)據(jù)挖掘的方法來(lái)發(fā)現(xiàn)。因此,提出了
8、如圖2的研究主要是面向事務(wù)數(shù)據(jù)庫(kù)的。問(wèn)題是這樣描述所示的多媒體圖像