資源描述:
《基于網(wǎng)格技術(shù)的分布式空間數(shù)據(jù)挖掘算法研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、中南大學(xué)碩士學(xué)位論文摘要空間數(shù)據(jù)挖掘是空間信息技術(shù)發(fā)展的必然結(jié)果,其產(chǎn)生主要來自兩個方面的推動力。首先,由于數(shù)據(jù)挖掘研究領(lǐng)域的不斷拓展,由最初的關(guān)系數(shù)據(jù)和事務(wù)數(shù)據(jù)挖掘,發(fā)展到對空間數(shù)據(jù)庫的挖掘。其次,在地學(xué)領(lǐng)域,隨著衛(wèi)星和遙感技術(shù)的廣泛應(yīng)用,日益豐富的空間和非空間數(shù)據(jù)得到收集和存儲,海量的地理數(shù)據(jù)在一定程度上已經(jīng)超過了人們的處理能力,而傳統(tǒng)的地學(xué)分析難以勝任從這些海量數(shù)據(jù)中提取和發(fā)現(xiàn)地學(xué)知識,正如JohnNaisbett所說,“我們已被信息所淹沒,但是卻正在忍受缺乏知識的煎熬"。因此,從空間數(shù)據(jù)庫中自動地挖掘知識,尋找隱藏在空間數(shù)據(jù)庫中不明確的、隱含的知識、空
2、間關(guān)系或其它模式,即空間數(shù)據(jù)挖掘(SpatialDataMining,SDM),變得越來越重要。但是,GIS空間數(shù)據(jù)庫一般都具有海量特性并且往往分布存儲,利用SDM技術(shù)從空間數(shù)據(jù)庫或數(shù)據(jù)倉庫中獲取隱含的知識和信息,如果僅僅采用傳統(tǒng)的集中式處理模式,則無論從數(shù)據(jù)處理的效率還是空間數(shù)據(jù)本身的安全性方面來說,都提出了很大的挑戰(zhàn)。因此,分布式并行數(shù)據(jù)挖掘處理模式是目前研究的熱點(diǎn)問題之一。而空間知識網(wǎng)格技術(shù)的研究與發(fā)展,為數(shù)據(jù)挖掘提供了良好的計算環(huán)境和應(yīng)用前景。本文主要從空間數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則發(fā)現(xiàn)的串行算法入手,探討了關(guān)聯(lián)規(guī)則挖掘算法的并行化處理問題,并對網(wǎng)格技術(shù)應(yīng)用于
3、空間數(shù)據(jù)挖掘的相關(guān)體系結(jié)構(gòu)進(jìn)行了研究。本文的主要貢獻(xiàn)在于:(1)對空間關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行了系統(tǒng)研究。首先重點(diǎn)研究了Apriori算法、FP-growth算法及其對它們的改進(jìn),并將這兩個算法分別在5個不同大小的數(shù)據(jù)集上進(jìn)行了性能測試和對比;然后研究了空間統(tǒng)計學(xué)理論在空間數(shù)據(jù)挖掘領(lǐng)域的應(yīng)用,并以湖南省2004年到2006年各市州的GDP增長率為例,成功的挖掘了各市州GDP增長率之間的空間關(guān)聯(lián)關(guān)系;(2)研究了空間關(guān)聯(lián)規(guī)則挖掘算法的并行化處理模式。為了適應(yīng)GIS空間數(shù)據(jù)庫海量且往往分布存儲的特性,本文給出了分布式空間關(guān)聯(lián)規(guī)則挖掘算法的一般結(jié)構(gòu),并基于Apriori
4、算法介紹了4種并行計算方法:CD算法、CD-LGP算法、DD算法和皿算法,并對它們做了算法性能分析;(3)研究了基于網(wǎng)格技術(shù)的空間數(shù)據(jù)挖掘體系結(jié)構(gòu)。在遵循OGSA.體系結(jié)構(gòu)的基礎(chǔ)上,本文對面向服務(wù)的空間數(shù)據(jù)挖掘體系結(jié)構(gòu)基本特中南大學(xué)碩士學(xué)位論文摘要征進(jìn)行了分析,并對該體系結(jié)構(gòu)中的數(shù)據(jù)訪問服務(wù)、數(shù)據(jù)代理服務(wù)及空間數(shù)據(jù)挖掘服務(wù)的實(shí)現(xiàn)方式和流程做了深入的研究;(4)研究了網(wǎng)格環(huán)境下空間數(shù)據(jù)劃分的一般策略和方法。通過基于GridSim的網(wǎng)格仿真實(shí)驗(yàn),證實(shí)了在特定情形下該數(shù)據(jù)劃分策略存在一個最優(yōu)解,為網(wǎng)格代理在接收用戶提交的任務(wù)后對整個任務(wù)進(jìn)行自動化分解和在網(wǎng)格中進(jìn)行優(yōu)
5、化調(diào)度提供了依據(jù)。關(guān)鍵詞:網(wǎng)格技術(shù),空間數(shù)據(jù)挖掘,分布式算法,網(wǎng)格服務(wù),數(shù)據(jù)劃分。中南大學(xué)碩士學(xué)位論文ABSTI認(rèn)cTABSTRACTSpatialdataminingistheinevitableresultofthedevelopingofspatialinformationtechnology,anditsbirthhastwomainfactors.Firstly,astheresearchfieldexpandedconstantly,theobjectofdatamininghasevolvedfromrelationshipandtransact
6、iondatatospatialdatabase.Secondly,astheabroadapplicationofsatelliteandremotesensingtechnologyingeographicalscience,abundantspatialandnon-spatialdatahasbeencollectedandstored,廿leyhaveexceededpeople’Sprocessingcapabilityatacertainextent,butthetraditionalspatialanalysisCallhardlypick-u
7、panddiscovergeographicalknowledgefromthesegreatcapacitydata.AsJohnNaisbettsaid:“Wehavebeensubmergedbyinformation,butbeensufferedfromabsentknowledge.”So,miningknowledgeautomatically,findingambiguousandhiddenknowledge,spatialrelationshiporotherpaaemsfromspatialdatabase,namelyspatialda
8、tamining,hasbecomem