資源描述:
《基于空間數(shù)據(jù)倉(cāng)庫(kù)的空間數(shù)據(jù)挖掘研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、維普資訊http://www.cqvip.com理論研奔遙感信息基于空間數(shù)據(jù)倉(cāng)庫(kù)的空間數(shù)據(jù)挖掘研究毛克彪①②,覃志豪①,李海濤①②,周若鴻⑧(①南京大學(xué)國(guó)際地球系統(tǒng)科學(xué)研究所,南京210093;②南京大學(xué)城市資源系GIS,南京210093;③南京大學(xué)計(jì)算機(jī)科學(xué)系,南京210093)摘要:分析了空間數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)和體系結(jié)構(gòu),在空間數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)上提出了一種空間數(shù)據(jù)挖掘的模型結(jié)構(gòu),介紹了一些常用空間數(shù)據(jù)挖掘算法,并展望了其廣闊的應(yīng)用前景。關(guān)鍵詞:數(shù)據(jù)倉(cāng)庫(kù);數(shù)據(jù)挖掘;空間數(shù)據(jù)倉(cāng)庫(kù);空間數(shù)據(jù)挖掘中圖分類號(hào):P208文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):100O一3177(2002)68-O19一O8據(jù)集
2、合[3]。它是一項(xiàng)基于數(shù)據(jù)管理和運(yùn)用的綜合性1引言技術(shù)和解決方案,是一種有效的數(shù)據(jù)存儲(chǔ)和組織形隨著遙感技術(shù)(Rs)、地理信息系統(tǒng)(GIS)和全式。經(jīng)過(guò)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)處理以后的數(shù)據(jù)是集成的、穩(wěn)球定位系統(tǒng)(GPS)的發(fā)展,空間數(shù)據(jù)庫(kù)的數(shù)據(jù)量飛定的、干凈的,從而有利于在后面集成并運(yùn)用數(shù)據(jù)挖速膨脹,已遠(yuǎn)遠(yuǎn)超過(guò)了人腦能夠分析的能力。例如,掘技術(shù)進(jìn)行分析處理。一幅1024×1024的224通道的AVIRIS高光譜遙空間數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)相結(jié)合產(chǎn)生了空間數(shù)據(jù)感影像,一張照片中會(huì)有1024×1024個(gè)16位的像倉(cāng)庫(kù)。它是在數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)上引入空間維數(shù)據(jù),根素,這樣10000張照片就會(huì)有167G的數(shù)據(jù),
3、包含著據(jù)主題從不同的GIS中截取從瞬態(tài)到區(qū)段直到全球大量的地物信息。正如納斯博指出的,“我們被淹沒(méi)系統(tǒng)的不同規(guī)模時(shí)空尺度上的信息,而空間數(shù)據(jù)挖在信息里,但感受到知識(shí)的饑餓”。因此,我們迫切需掘則是將GIS分析技術(shù)提高到發(fā)現(xiàn)知識(shí)的新階段,要借助數(shù)據(jù)挖掘技術(shù)對(duì)這些數(shù)據(jù)進(jìn)行及時(shí)有效的處使系統(tǒng)具有自動(dòng)學(xué)習(xí)的功能,使系統(tǒng)能自動(dòng)獲取知理,從巨量的、有噪音的、隨機(jī)的數(shù)據(jù)中提取有效的、識(shí),使GIS成為真正的智能系統(tǒng),從而促進(jìn)GPS、RS新穎的和事先未知而又潛在有用的信息[1]。它是數(shù)與GIS等技術(shù)的集成。據(jù)庫(kù)技術(shù)、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析等技術(shù)相結(jié)合而產(chǎn)生2空間數(shù)據(jù)倉(cāng)庫(kù)的新的領(lǐng)域。傳統(tǒng)的GIS數(shù)據(jù)庫(kù)技術(shù)
4、是以單一的數(shù)據(jù)資源,當(dāng)前,GIS正在從“以技術(shù)為中心”向“以數(shù)據(jù)為即以數(shù)據(jù)庫(kù)為中心,進(jìn)行從事物處理、批處理到?jīng)Q策中心”的方向轉(zhuǎn)變。GIS的功能日漸強(qiáng)大,與其它學(xué)分析的數(shù)據(jù)處理工作。不同類型的數(shù)據(jù)有著不同的科的結(jié)合促進(jìn)了它的發(fā)展。組成GIS的各類數(shù)據(jù)庫(kù)處理特點(diǎn),但是由于歷史的原因和各種數(shù)據(jù)庫(kù)系統(tǒng)的容量也在不斷增大,所包含的信息更為豐富,但其的數(shù)據(jù)結(jié)構(gòu)不一致的特點(diǎn),使得以單一的數(shù)據(jù)組織中的許多信息是隱含的、不為人們所直接認(rèn)識(shí)的。將方式進(jìn)行組織的數(shù)據(jù)庫(kù)不能反映這種差異,滿足不數(shù)據(jù)倉(cāng)庫(kù)和GIS技術(shù)結(jié)合起來(lái),可以大大擴(kuò)展GIS了數(shù)據(jù)處理多樣化的要求。近年來(lái),隨著數(shù)據(jù)庫(kù)應(yīng)用的應(yīng)用功能,可為全球
5、及區(qū)域的可持續(xù)發(fā)展研究提的廣泛普及,人們對(duì)數(shù)據(jù)處理的這種多樣化的特點(diǎn)供強(qiáng)有力的支持。有了更清晰的認(rèn)識(shí)。數(shù)據(jù)倉(cāng)庫(kù)的出現(xiàn)滿足了這種需2.1空間數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)求,數(shù)據(jù)倉(cāng)庫(kù)在GIS中也有很好的應(yīng)用前景。數(shù)據(jù)倉(cāng)空間數(shù)據(jù)倉(cāng)庫(kù)并不是GIS空間數(shù)據(jù)庫(kù)的簡(jiǎn)單集庫(kù)是面向主題的、集成的、穩(wěn)定的和隨時(shí)間變化的數(shù)合,而是在空間元數(shù)據(jù)和信息目錄的基礎(chǔ)上對(duì)空收稿日期:2002一O8修訂日期:2002—10作者簡(jiǎn)介:毛克彪(1977~),男,碩士,主要從事空間數(shù)據(jù)挖掘,遙感數(shù)字圖像信息提取和高光譜應(yīng)用等方面研究。E—mail:maokebiao@sina.corn.cn,tel:O25—3597077.19維普資
6、訊http://www.cqvip.com遙戚信息曩論砸究間數(shù)據(jù)庫(kù)的高度綜合。它包含以下主要的特點(diǎn):通知集成器,每當(dāng)有新的信息源連上數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),(1)空間數(shù)據(jù)倉(cāng)庫(kù)支持多種數(shù)據(jù)源,不僅是數(shù)據(jù)或者信息源中的相關(guān)信息發(fā)生變化時(shí),這些新的或庫(kù),還包括數(shù)據(jù)文件、文本文件、應(yīng)用程序等等。改變的數(shù)據(jù)就會(huì)傳送給集成器。集成器負(fù)責(zé)對(duì)這些(2)空間數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)包含多種成分,有時(shí)信息進(jìn)行過(guò)濾、總結(jié)或者與其它信息進(jìn)行合并處理間數(shù)據(jù)、空間數(shù)據(jù)、屬性數(shù)據(jù)以及其它一些異構(gòu)數(shù)并放入空間數(shù)據(jù)倉(cāng)庫(kù)中。為了把新的信息準(zhǔn)確地集據(jù)。中到空間數(shù)據(jù)倉(cāng)庫(kù)中,集成器還要從原來(lái)或相關(guān)的(3)空間數(shù)據(jù)倉(cāng)庫(kù)中存放的不僅是供使用的數(shù)
7、其它信息源中獲取進(jìn)一步的信息。圖1中從集成器據(jù),還有在一定條件下能主動(dòng)起作用的處理規(guī)則、算到包裝器、監(jiān)視器的箭頭表示了這種操作。法等。用戶(4)空間數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)不完全是原始數(shù)據(jù)的簡(jiǎn)單歸并或搬家,而必須經(jīng)過(guò)加工和集成,是對(duì)數(shù)據(jù)的增值和統(tǒng)一。(5)空間數(shù)據(jù)倉(cāng)庫(kù)是以時(shí)間為基準(zhǔn)來(lái)管理數(shù)據(jù)的,它可以截取不同時(shí)間尺度上的信息,從瞬態(tài)到區(qū)段時(shí)間直到全體??臻g數(shù)據(jù)倉(cāng)庫(kù)是依賴于時(shí)間維的數(shù)據(jù)結(jié)構(gòu)。(6)任何事物在自然界中都有自己的空間位置,彼此之間有相互的空間關(guān)系,因此任何信息都有相