資源描述:
《基于網(wǎng)格的空間數(shù)據(jù)挖掘研究》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。
1、基于網(wǎng)格的空間數(shù)據(jù)挖掘研究112王銳馬德濤劉曉輝1.解放軍信息工程大學測繪學院4500522.解放軍防化指揮工程學院102205Email:wangruibetty@126.com摘要:本文針對傳統(tǒng)空間數(shù)據(jù)挖掘存在的種種問題,提出了網(wǎng)格環(huán)境下面向空間數(shù)據(jù)挖掘與知識發(fā)現(xiàn)的一體化空間知識獲取、管理與應用的解決思路。首先簡要介紹了空間數(shù)據(jù)挖掘與網(wǎng)格技術的概念及體系結構,并在此基礎上提出了基于網(wǎng)格的空間數(shù)據(jù)挖掘系統(tǒng)體系結構,重點介紹了網(wǎng)格環(huán)境下空間數(shù)據(jù)挖掘的關鍵技術,最后根據(jù)系統(tǒng)開發(fā)的需要設計出了基于GlobusToolkit4.0的空間數(shù)據(jù)挖掘體系結構。關鍵字:空間數(shù)
2、據(jù)挖掘網(wǎng)格GlobusToolkitAbstract:Aimedatthevariousproblemsintraditionalspatialdatamining,thispaperputsforwardanewsolutionabouttheacquisition、managementandapplicationofintegratedspatialknowledgeorientedtospatialdataminingandknowledgediscoveryunderthecircumstanceofgrid.thispaperfirstlyintrod
3、ucestheconceptsandarchitectureofspatialdataminingandgridtechnology.Afterwardsbringsforwardaspatialdataminingsystemarchitecturebasedongridandputsemphasisuponintroducingthekeytechniqueofspatialdataminingbasedongrid.FinallythespatialdataminingarchitecturebasedonGlobusToolkit4.0isdesigne
4、daccordingtotheneedofsystemdevelopmentKeyword:SpatialdataminingGridGlobusToolkit1.引言隨著天地一體化空間信息技術的迅速發(fā)展,人類通過遙感衛(wèi)星、航天航空測量、GPS、雷達、大地測量、地籍測量、數(shù)字化等技術手段獲取的空間數(shù)據(jù)/信息越來越多??臻g信息無論在數(shù)量級上還是在復雜性上都在迅速地增長,大量的數(shù)據(jù)分布在網(wǎng)絡上不同地理位置的空間數(shù)據(jù)庫、關系數(shù)據(jù)庫和數(shù)據(jù)倉庫中,已經(jīng)遠遠超出了人們的分析和解譯能力。用戶不可能詳細地分析所有的這些數(shù)據(jù),并提取感興趣的空間知識,在某種意義上說目前我們不是缺少
5、信息,而是被信息淹沒了,導致了”數(shù)據(jù)爆炸但知識貧乏”的現(xiàn)象。一方面人們需要有新的、更有效的手段對存儲在網(wǎng)絡上各種大量的數(shù)據(jù)進行挖掘以提取出用戶感興趣的知識和信息,另一方面,人們需要有效的模式支持對網(wǎng)絡上的空間知識的共享利用,這就對傳統(tǒng)空間知識的生產(chǎn)、組織、管理與應用提出了新的挑戰(zhàn)。而網(wǎng)格技術的出現(xiàn)為空間數(shù)據(jù)挖掘提供了一個良好的平臺,對廣域分布的海量地理數(shù)據(jù)進行高效的處理、分析和挖掘,為全世界資源的有效利用和共享提供了一個可靠環(huán)境。2.空間數(shù)據(jù)挖掘技術2.1空間數(shù)據(jù)挖掘概念空間數(shù)據(jù)挖掘,也稱基于空間數(shù)據(jù)庫的數(shù)據(jù)挖掘和知識發(fā)現(xiàn)(SpatialDataMiningan
6、dKnowledgeDiscovery),是指從空間數(shù)據(jù)庫中提取用戶感興趣的空間模式與特征、空間與非空間數(shù)據(jù)的普遍關系及其它一些隱含在數(shù)據(jù)庫中的普遍的數(shù)據(jù)特征??臻g數(shù)據(jù)挖掘是數(shù)據(jù)挖掘的一個新的分支。2.2傳統(tǒng)空間數(shù)據(jù)挖掘系統(tǒng)的體系結構傳統(tǒng)空間數(shù)據(jù)挖掘系統(tǒng)大致為三層結構,如圖2.1所示。其中,第一層是數(shù)據(jù)源,指利用空間數(shù)據(jù)庫或數(shù)據(jù)倉庫管理系統(tǒng)提供的索引、查詢優(yōu)化等功能獲取和提煉與問題領域相關的數(shù)據(jù),或直接利用存儲在空間立方體中的數(shù)據(jù),這些數(shù)據(jù)可稱為數(shù)據(jù)挖掘的數(shù)據(jù)源或信息庫。第二層是挖掘器,利用空間數(shù)據(jù)挖掘系統(tǒng)中的各種數(shù)據(jù)挖掘方法分析被提取的數(shù)據(jù)以達到用戶的需求。第
7、三層是用戶界面,使用多種方式(如可視化工具)將獲取的信息和發(fā)現(xiàn)的知識反映給用戶,用戶對發(fā)現(xiàn)的知識進行分析和評價,并將知識提供給空間決策支持使用,或?qū)⒂杏玫闹R存入領域知識庫內(nèi)。圖2.1傳統(tǒng)的空間數(shù)據(jù)挖掘系統(tǒng)3、網(wǎng)格技術3.1網(wǎng)格技術的概念網(wǎng)格作為一種十分復雜但有著非常強大功能的新技術,它具有新技術的兩個主要特征:其一,不同群體使用不同的名詞來稱謂它。有人把網(wǎng)格看成是未來的互聯(lián)網(wǎng)技術,稱之為“下一代因特網(wǎng)”、“下一代Web";有人把網(wǎng)格稱為“新一代高性能計算技術”,強調(diào)在廣域環(huán)境下的集合計算能力;有人將網(wǎng)格稱為“下一代信息服務技術”,強調(diào)信息的自動發(fā)現(xiàn)、收集、處理
8、和利用;也有人將網(wǎng)格加上