資源描述:
《基于空間數(shù)據(jù)倉庫的空間數(shù)據(jù)挖掘研究》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在教育資源-天天文庫。
1、維普資訊http://www.cqvip.com理論研奔遙感信息基于空間數(shù)據(jù)倉庫的空間數(shù)據(jù)挖掘研究毛克彪①②,覃志豪①,李海濤①②,周若鴻⑧(①南京大學國際地球系統(tǒng)科學研究所,南京210093;②南京大學城市資源系GIS,南京210093;③南京大學計算機科學系,南京210093)摘要:分析了空間數(shù)據(jù)倉庫的特點和體系結(jié)構(gòu),在空間數(shù)據(jù)倉庫的基礎上提出了一種空間數(shù)據(jù)挖掘的模型結(jié)構(gòu),介紹了一些常用空間數(shù)據(jù)挖掘算法,并展望了其廣闊的應用前景。關鍵詞:數(shù)據(jù)倉庫;數(shù)據(jù)挖掘;空間數(shù)據(jù)倉庫;空間數(shù)據(jù)挖掘中圖分類號:P208文獻標識碼:A文章編號:100O一3177(2002)68-O19一O8據(jù)集
2、合[3]。它是一項基于數(shù)據(jù)管理和運用的綜合性1引言技術和解決方案,是一種有效的數(shù)據(jù)存儲和組織形隨著遙感技術(Rs)、地理信息系統(tǒng)(GIS)和全式。經(jīng)過數(shù)據(jù)倉庫技術處理以后的數(shù)據(jù)是集成的、穩(wěn)球定位系統(tǒng)(GPS)的發(fā)展,空間數(shù)據(jù)庫的數(shù)據(jù)量飛定的、干凈的,從而有利于在后面集成并運用數(shù)據(jù)挖速膨脹,已遠遠超過了人腦能夠分析的能力。例如,掘技術進行分析處理。一幅1024×1024的224通道的AVIRIS高光譜遙空間數(shù)據(jù)庫和數(shù)據(jù)倉庫相結(jié)合產(chǎn)生了空間數(shù)據(jù)感影像,一張照片中會有1024×1024個16位的像倉庫。它是在數(shù)據(jù)倉庫的基礎上引入空間維數(shù)據(jù),根素,這樣10000張照片就會有167G的數(shù)據(jù),
3、包含著據(jù)主題從不同的GIS中截取從瞬態(tài)到區(qū)段直到全球大量的地物信息。正如納斯博指出的,“我們被淹沒系統(tǒng)的不同規(guī)模時空尺度上的信息,而空間數(shù)據(jù)挖在信息里,但感受到知識的饑餓”。因此,我們迫切需掘則是將GIS分析技術提高到發(fā)現(xiàn)知識的新階段,要借助數(shù)據(jù)挖掘技術對這些數(shù)據(jù)進行及時有效的處使系統(tǒng)具有自動學習的功能,使系統(tǒng)能自動獲取知理,從巨量的、有噪音的、隨機的數(shù)據(jù)中提取有效的、識,使GIS成為真正的智能系統(tǒng),從而促進GPS、RS新穎的和事先未知而又潛在有用的信息[1]。它是數(shù)與GIS等技術的集成。據(jù)庫技術、機器學習、統(tǒng)計分析等技術相結(jié)合而產(chǎn)生2空間數(shù)據(jù)倉庫的新的領域。傳統(tǒng)的GIS數(shù)據(jù)庫技術
4、是以單一的數(shù)據(jù)資源,當前,GIS正在從“以技術為中心”向“以數(shù)據(jù)為即以數(shù)據(jù)庫為中心,進行從事物處理、批處理到?jīng)Q策中心”的方向轉(zhuǎn)變。GIS的功能日漸強大,與其它學分析的數(shù)據(jù)處理工作。不同類型的數(shù)據(jù)有著不同的科的結(jié)合促進了它的發(fā)展。組成GIS的各類數(shù)據(jù)庫處理特點,但是由于歷史的原因和各種數(shù)據(jù)庫系統(tǒng)的容量也在不斷增大,所包含的信息更為豐富,但其的數(shù)據(jù)結(jié)構(gòu)不一致的特點,使得以單一的數(shù)據(jù)組織中的許多信息是隱含的、不為人們所直接認識的。將方式進行組織的數(shù)據(jù)庫不能反映這種差異,滿足不數(shù)據(jù)倉庫和GIS技術結(jié)合起來,可以大大擴展GIS了數(shù)據(jù)處理多樣化的要求。近年來,隨著數(shù)據(jù)庫應用的應用功能,可為全球
5、及區(qū)域的可持續(xù)發(fā)展研究提的廣泛普及,人們對數(shù)據(jù)處理的這種多樣化的特點供強有力的支持。有了更清晰的認識。數(shù)據(jù)倉庫的出現(xiàn)滿足了這種需2.1空間數(shù)據(jù)倉庫的特點求,數(shù)據(jù)倉庫在GIS中也有很好的應用前景。數(shù)據(jù)倉空間數(shù)據(jù)倉庫并不是GIS空間數(shù)據(jù)庫的簡單集庫是面向主題的、集成的、穩(wěn)定的和隨時間變化的數(shù)合,而是在空間元數(shù)據(jù)和信息目錄的基礎上對空收稿日期:2002一O8修訂日期:2002—10作者簡介:毛克彪(1977~),男,碩士,主要從事空間數(shù)據(jù)挖掘,遙感數(shù)字圖像信息提取和高光譜應用等方面研究。E—mail:maokebiao@sina.corn.cn,tel:O25—3597077.19維普資
6、訊http://www.cqvip.com遙戚信息曩論砸究間數(shù)據(jù)庫的高度綜合。它包含以下主要的特點:通知集成器,每當有新的信息源連上數(shù)據(jù)倉庫系統(tǒng),(1)空間數(shù)據(jù)倉庫支持多種數(shù)據(jù)源,不僅是數(shù)據(jù)或者信息源中的相關信息發(fā)生變化時,這些新的或庫,還包括數(shù)據(jù)文件、文本文件、應用程序等等。改變的數(shù)據(jù)就會傳送給集成器。集成器負責對這些(2)空間數(shù)據(jù)倉庫中的數(shù)據(jù)包含多種成分,有時信息進行過濾、總結(jié)或者與其它信息進行合并處理間數(shù)據(jù)、空間數(shù)據(jù)、屬性數(shù)據(jù)以及其它一些異構(gòu)數(shù)并放入空間數(shù)據(jù)倉庫中。為了把新的信息準確地集據(jù)。中到空間數(shù)據(jù)倉庫中,集成器還要從原來或相關的(3)空間數(shù)據(jù)倉庫中存放的不僅是供使用的數(shù)
7、其它信息源中獲取進一步的信息。圖1中從集成器據(jù),還有在一定條件下能主動起作用的處理規(guī)則、算到包裝器、監(jiān)視器的箭頭表示了這種操作。法等。用戶(4)空間數(shù)據(jù)倉庫中的數(shù)據(jù)不完全是原始數(shù)據(jù)的簡單歸并或搬家,而必須經(jīng)過加工和集成,是對數(shù)據(jù)的增值和統(tǒng)一。(5)空間數(shù)據(jù)倉庫是以時間為基準來管理數(shù)據(jù)的,它可以截取不同時間尺度上的信息,從瞬態(tài)到區(qū)段時間直到全體??臻g數(shù)據(jù)倉庫是依賴于時間維的數(shù)據(jù)結(jié)構(gòu)。(6)任何事物在自然界中都有自己的空間位置,彼此之間有相互的空間關系,因此任何信息都有相