基于網(wǎng)格技術(shù)的分布式空間數(shù)據(jù)挖掘算法研究

基于網(wǎng)格技術(shù)的分布式空間數(shù)據(jù)挖掘算法研究

ID:33322819

大?。?.39 MB

頁數(shù):78頁

時(shí)間:2019-02-24

基于網(wǎng)格技術(shù)的分布式空間數(shù)據(jù)挖掘算法研究_第1頁
基于網(wǎng)格技術(shù)的分布式空間數(shù)據(jù)挖掘算法研究_第2頁
基于網(wǎng)格技術(shù)的分布式空間數(shù)據(jù)挖掘算法研究_第3頁
基于網(wǎng)格技術(shù)的分布式空間數(shù)據(jù)挖掘算法研究_第4頁
基于網(wǎng)格技術(shù)的分布式空間數(shù)據(jù)挖掘算法研究_第5頁
資源描述:

《基于網(wǎng)格技術(shù)的分布式空間數(shù)據(jù)挖掘算法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、中南大學(xué)碩士學(xué)位論文摘要空間數(shù)據(jù)挖掘是空間信息技術(shù)發(fā)展的必然結(jié)果,其產(chǎn)生主要來自兩個(gè)方面的推動(dòng)力。首先,由于數(shù)據(jù)挖掘研究領(lǐng)域的不斷拓展,由最初的關(guān)系數(shù)據(jù)和事務(wù)數(shù)據(jù)挖掘,發(fā)展到對(duì)空間數(shù)據(jù)庫的挖掘。其次,在地學(xué)領(lǐng)域,隨著衛(wèi)星和遙感技術(shù)的廣泛應(yīng)用,日益豐富的空間和非空間數(shù)據(jù)得到收集和存儲(chǔ),海量的地理數(shù)據(jù)在一定程度上已經(jīng)超過了人們的處理能力,而傳統(tǒng)的地學(xué)分析難以勝任從這些海量數(shù)據(jù)中提取和發(fā)現(xiàn)地學(xué)知識(shí),正如JohnNaisbett所說,“我們已被信息所淹沒,但是卻正在忍受缺乏知識(shí)的煎熬"。因此,從空間數(shù)據(jù)庫中自動(dòng)地挖掘知識(shí),尋找隱藏在空間數(shù)據(jù)庫中不明確的、隱含的知識(shí)、空

2、間關(guān)系或其它模式,即空間數(shù)據(jù)挖掘(SpatialDataMining,SDM),變得越來越重要。但是,GIS空間數(shù)據(jù)庫一般都具有海量特性并且往往分布存儲(chǔ),利用SDM技術(shù)從空間數(shù)據(jù)庫或數(shù)據(jù)倉(cāng)庫中獲取隱含的知識(shí)和信息,如果僅僅采用傳統(tǒng)的集中式處理模式,則無論從數(shù)據(jù)處理的效率還是空間數(shù)據(jù)本身的安全性方面來說,都提出了很大的挑戰(zhàn)。因此,分布式并行數(shù)據(jù)挖掘處理模式是目前研究的熱點(diǎn)問題之一。而空間知識(shí)網(wǎng)格技術(shù)的研究與發(fā)展,為數(shù)據(jù)挖掘提供了良好的計(jì)算環(huán)境和應(yīng)用前景。本文主要從空間數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則發(fā)現(xiàn)的串行算法入手,探討了關(guān)聯(lián)規(guī)則挖掘算法的并行化處理問題,并對(duì)網(wǎng)格技術(shù)應(yīng)用于

3、空間數(shù)據(jù)挖掘的相關(guān)體系結(jié)構(gòu)進(jìn)行了研究。本文的主要貢獻(xiàn)在于:(1)對(duì)空間關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行了系統(tǒng)研究。首先重點(diǎn)研究了Apriori算法、FP-growth算法及其對(duì)它們的改進(jìn),并將這兩個(gè)算法分別在5個(gè)不同大小的數(shù)據(jù)集上進(jìn)行了性能測(cè)試和對(duì)比;然后研究了空間統(tǒng)計(jì)學(xué)理論在空間數(shù)據(jù)挖掘領(lǐng)域的應(yīng)用,并以湖南省2004年到2006年各市州的GDP增長(zhǎng)率為例,成功的挖掘了各市州GDP增長(zhǎng)率之間的空間關(guān)聯(lián)關(guān)系;(2)研究了空間關(guān)聯(lián)規(guī)則挖掘算法的并行化處理模式。為了適應(yīng)GIS空間數(shù)據(jù)庫海量且往往分布存儲(chǔ)的特性,本文給出了分布式空間關(guān)聯(lián)規(guī)則挖掘算法的一般結(jié)構(gòu),并基于Apriori

4、算法介紹了4種并行計(jì)算方法:CD算法、CD-LGP算法、DD算法和皿算法,并對(duì)它們做了算法性能分析;(3)研究了基于網(wǎng)格技術(shù)的空間數(shù)據(jù)挖掘體系結(jié)構(gòu)。在遵循OGSA.體系結(jié)構(gòu)的基礎(chǔ)上,本文對(duì)面向服務(wù)的空間數(shù)據(jù)挖掘體系結(jié)構(gòu)基本特中南大學(xué)碩士學(xué)位論文摘要征進(jìn)行了分析,并對(duì)該體系結(jié)構(gòu)中的數(shù)據(jù)訪問服務(wù)、數(shù)據(jù)代理服務(wù)及空間數(shù)據(jù)挖掘服務(wù)的實(shí)現(xiàn)方式和流程做了深入的研究;(4)研究了網(wǎng)格環(huán)境下空間數(shù)據(jù)劃分的一般策略和方法。通過基于GridSim的網(wǎng)格仿真實(shí)驗(yàn),證實(shí)了在特定情形下該數(shù)據(jù)劃分策略存在一個(gè)最優(yōu)解,為網(wǎng)格代理在接收用戶提交的任務(wù)后對(duì)整個(gè)任務(wù)進(jìn)行自動(dòng)化分解和在網(wǎng)格中進(jìn)行優(yōu)

5、化調(diào)度提供了依據(jù)。關(guān)鍵詞:網(wǎng)格技術(shù),空間數(shù)據(jù)挖掘,分布式算法,網(wǎng)格服務(wù),數(shù)據(jù)劃分。中南大學(xué)碩士學(xué)位論文ABSTI認(rèn)cTABSTRACTSpatialdataminingistheinevitableresultofthedevelopingofspatialinformationtechnology,anditsbirthhastwomainfactors.Firstly,astheresearchfieldexpandedconstantly,theobjectofdatamininghasevolvedfromrelationshipandtransact

6、iondatatospatialdatabase.Secondly,astheabroadapplicationofsatelliteandremotesensingtechnologyingeographicalscience,abundantspatialandnon-spatialdatahasbeencollectedandstored,廿leyhaveexceededpeople’Sprocessingcapabilityatacertainextent,butthetraditionalspatialanalysisCallhardlypick-u

7、panddiscovergeographicalknowledgefromthesegreatcapacitydata.AsJohnNaisbettsaid:“Wehavebeensubmergedbyinformation,butbeensufferedfromabsentknowledge.”So,miningknowledgeautomatically,findingambiguousandhiddenknowledge,spatialrelationshiporotherpaaemsfromspatialdatabase,namelyspatialda

8、tamining,hasbecomem

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。