資源描述:
《基于網(wǎng)格服務(wù)的數(shù)據(jù)挖掘應(yīng)用研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、第l8卷第l2期計(jì)算機(jī)技術(shù)與發(fā)展Vo1.18NO.】22008年l2月COMPUTERTECI:{NOI』—)GYANDDEVELOPMENTI)ec.2008基于網(wǎng)格服務(wù)的數(shù)據(jù)挖掘應(yīng)用研究郭小雪(茂名學(xué)院理學(xué)院,廣東茂名525000)摘要:建立在網(wǎng)格基礎(chǔ)上的數(shù)據(jù)挖掘結(jié)合了網(wǎng)格技術(shù)的優(yōu)點(diǎn),能夠?qū)ntemet上廣域分布的海量信息進(jìn)行高效的處理、分析和挖掘。分析了網(wǎng)格與數(shù)據(jù)挖掘的特點(diǎn),并結(jié)合網(wǎng)格與數(shù)據(jù)挖掘的過程和關(guān)鍵技術(shù),詳細(xì)介紹了開放網(wǎng)格服務(wù)體系結(jié)構(gòu)、層次功能、網(wǎng)格服務(wù)及其接El,基于OGSA的網(wǎng)格數(shù)據(jù)挖掘的例子和應(yīng)用驗(yàn)證了數(shù)據(jù)挖掘網(wǎng)格系統(tǒng)的可行性和高效性。關(guān)鍵詞:網(wǎng)格服務(wù);數(shù)據(jù)挖
2、掘;開放式網(wǎng)格服務(wù)結(jié)構(gòu);服務(wù)接口中圖分類號(hào):1]P3u.13文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1673—629X(2008)12—0224一O4ResearchonApplicationofDataMiningBasedonGridServiceGUOXiao-xue(CollegeofScience,MaomingUniversity,Maoming525000,China)Abstract:Dataminingbasedondenvironmentwhichintegratesthemeritsofgrid,cantransactandanalyzethevastinformation,
3、anddiscovernewknowledge.Thefeaturesofgridanddataminingareanalyzed.Summarizetheprocedureandkeytechnologiesofdataminingwithgridcharacteristic,mainlydiscu~theopengridservicesarchitecture,layerfunctions,gird$~_-,vieeandserviceinterfaceofdataminingond.Finalygiveanexampleofdataminingbasedon0(A,thefe
4、asibiliWandtheefficiencyareproved.Keywords:girdservice;datamining;0GSA;serviceinterfaceO引言掘這些廣域分布的海量數(shù)據(jù),以獲取新的科學(xué)知識(shí)、規(guī)隨著Intemet的普及和計(jì)算機(jī)軟、硬件技術(shù)的發(fā)律和決策支持信息,傳統(tǒng)的數(shù)據(jù)挖掘模式和技術(shù)已經(jīng)展,網(wǎng)格技術(shù)越來越得到人們的重視,網(wǎng)格已經(jīng)被認(rèn)為無法勝任。建立在網(wǎng)格基礎(chǔ)上的數(shù)據(jù)挖掘結(jié)合網(wǎng)格計(jì)是下一代的互聯(lián)網(wǎng)_1J。網(wǎng)格是構(gòu)筑在Intemet上的一算的思想及其技術(shù)的優(yōu)點(diǎn),能夠?qū)V域分布的海量數(shù)組新興技術(shù)和基礎(chǔ)設(shè)施,其目標(biāo)是在動(dòng)態(tài)變化的、廣域據(jù)進(jìn)行高效的處理、分析
5、和挖掘。給科學(xué)研究領(lǐng)域、經(jīng)分布的異構(gòu)虛擬組織間實(shí)現(xiàn)協(xié)同資源共享、多領(lǐng)域的濟(jì)領(lǐng)域和社會(huì)生活帶來新的發(fā)現(xiàn)和巨大的價(jià)值-3J??茖W(xué)和工程的問題求解。網(wǎng)格技術(shù)的興起就是為了突破計(jì)算能力和地理物理位置的限制,節(jié)約資源,實(shí)現(xiàn)世1數(shù)據(jù)挖掘和網(wǎng)格界范圍的資源共享與服務(wù)協(xié)作-2J。網(wǎng)格計(jì)算技術(shù)是解數(shù)據(jù)挖掘(DM,DataMining)是一個(gè)利用各種分析決復(fù)雜海量科學(xué)數(shù)據(jù)的訪問、存儲(chǔ)、組織和管理的一種方法工具對(duì)海量數(shù)據(jù)進(jìn)行分析,建立模型和發(fā)現(xiàn)數(shù)據(jù)有效技術(shù)。間聯(lián)系,并在商業(yè)、科研等領(lǐng)域進(jìn)行應(yīng)用,輔助做出基未來的科學(xué)計(jì)算以數(shù)據(jù)為中心。數(shù)據(jù)已成為科于知識(shí)預(yù)測(cè)、決策的過程。數(shù)據(jù)挖掘指“從數(shù)據(jù)庫或數(shù)學(xué)、軍事、電
6、信、醫(yī)療等各個(gè)領(lǐng)域的重要資源。在網(wǎng)格據(jù)倉庫中發(fā)現(xiàn)隱藏的、預(yù)先未知的、有趣的信息的過計(jì)算環(huán)境下,許多科學(xué)與工程計(jì)算問題,如高分子材料程,該過程可以看作是知識(shí)發(fā)現(xiàn)中的一個(gè)核心的步分析、生物計(jì)算、數(shù)字地球等,以及信息服務(wù)、大型跨國驟”。這門新興的科學(xué)研究領(lǐng)域自從誕生后就成為研企業(yè)、遠(yuǎn)程醫(yī)療合作將產(chǎn)生大量的數(shù)據(jù)。要分析和挖究的熱點(diǎn),至今方興未艾_4J。數(shù)據(jù)挖掘的范圍非常廣泛,可以是經(jīng)濟(jì)、工業(yè)、農(nóng)業(yè)、軍事、社會(huì)、商業(yè)、科學(xué)的收稿Et期:2008—06—22數(shù)據(jù)和衛(wèi)星觀測(cè)得到的數(shù)據(jù)。數(shù)據(jù)的形態(tài)有數(shù)字、符基金項(xiàng)目:2006佛山市產(chǎn)學(xué)研專項(xiàng)資助項(xiàng)目(2006A018);茂名市科號(hào)、圖形、圖像、聲音
7、等。數(shù)據(jù)組織方式也各不相同,可技汁劃項(xiàng)目(2007029)作者簡介:郭小雪(1979~),女,廣東高州人,碩士,講師,研究方向以是有結(jié)構(gòu)、半結(jié)構(gòu)、非結(jié)構(gòu)的。數(shù)據(jù)挖掘的結(jié)果可以為分布式計(jì)算及網(wǎng)絡(luò)應(yīng)用。表示成各種形式,包括規(guī)則、法則、科學(xué)規(guī)律、方程和概第l2期郭小雪:基于網(wǎng)格服務(wù)的數(shù)據(jù)挖掘應(yīng)用研究·225·念網(wǎng)。數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模(5)網(wǎng)絡(luò)安全性要求更高。數(shù)據(jù)挖掘涉及廣域分糊的、隨機(jī)的數(shù)據(jù)集中識(shí)別有效的、新穎的、潛在有用布的屬于不同虛擬組織的數(shù)據(jù)源