網(wǎng)格的數(shù)據(jù)挖掘new

網(wǎng)格的數(shù)據(jù)挖掘new

ID:34371557

大?。?47.73 KB

頁數(shù):3頁

時(shí)間:2019-03-05

網(wǎng)格的數(shù)據(jù)挖掘new_第1頁
網(wǎng)格的數(shù)據(jù)挖掘new_第2頁
網(wǎng)格的數(shù)據(jù)挖掘new_第3頁
資源描述:

《網(wǎng)格的數(shù)據(jù)挖掘new》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、第10期侯文國等:網(wǎng)格的數(shù)據(jù)挖掘·241·*網(wǎng)格的數(shù)據(jù)挖掘侯文國,傅秀芬,謝翠萍(廣東工業(yè)大學(xué)計(jì)算機(jī)學(xué)院,廣東廣州510090)摘要:網(wǎng)格是網(wǎng)絡(luò)計(jì)算、分布式計(jì)算和高性能計(jì)算技術(shù)研究的熱點(diǎn)。隨著科學(xué)計(jì)算領(lǐng)域中的數(shù)據(jù)劇烈增長以及未來網(wǎng)格計(jì)算環(huán)境下廣域分布的海量數(shù)據(jù)共享成為現(xiàn)實(shí),數(shù)據(jù)挖掘技術(shù)將在挖掘有效的信息、發(fā)現(xiàn)新的知識和規(guī)律發(fā)揮著重要的作用。結(jié)合網(wǎng)格的特點(diǎn),概述了網(wǎng)格數(shù)據(jù)挖掘的特點(diǎn)和關(guān)鍵技術(shù),重點(diǎn)討論了網(wǎng)格數(shù)據(jù)挖掘的體系結(jié)構(gòu)和基本過程,最后給出了基于OGSA的網(wǎng)格數(shù)據(jù)挖掘的例子。關(guān)鍵詞:網(wǎng)格;網(wǎng)格計(jì)算;數(shù)據(jù)挖掘;體系結(jié)構(gòu);O

2、GSA;GIobus中圖法分類號:TP274文獻(xiàn)標(biāo)識碼:A文章編號:1001-3695(2004)10-0241-03DataMiningonGridHOUWen-guo,F(xiàn)UXiu-fen,XIECui-ping(CollegeofComputer,GuangdongUniuersityofTechnology,GuangzhouGuangdong510090,China)Abstract:GridisnowahotterresearchfieIdofgridcomputing,distributedcomputinga

3、ndhighperformancecomputingtech-noIogies.AsthenumberofdatainthescientificcomputationaIfieIdisenormousIyincreasingandinthefutureamassofshareddatadistributedgeographicaIIywiIIbereaIizedinthegridcomputingenvironment,dataminingtechnoIogywiIIpIayanimpor-tantroIeindiscov

4、eringvaIueinformation,newknowIedgeandIaws.SummarizethecharacteristicsandkeytechnoIogiesofdataminingwithgridcharacteristics.ThenwemainIydiscussthearchitectureandbasicprocessesofdataminingongrid.FinaIIywegiveanexampIeofdataminingbasedonOGSA.Keywords:Grid;GridComputi

5、ng;DataMining;Architecture;OGSA;GIobus網(wǎng)格是構(gòu)筑在Internet上的一組新興技術(shù)和基礎(chǔ)設(shè)施,其!.#"網(wǎng)格數(shù)據(jù)挖掘的特點(diǎn)目標(biāo)是在動態(tài)變化的,廣域分布的異構(gòu)虛擬組織間實(shí)現(xiàn)協(xié)同資(1)超級計(jì)算能力。網(wǎng)格計(jì)算能夠?yàn)榭茖W(xué)計(jì)算領(lǐng)域和社會[1]源共享,多領(lǐng)域的科學(xué)和工程的問題求解。數(shù)據(jù)網(wǎng)格計(jì)算經(jīng)濟(jì)生活領(lǐng)域提供超級的計(jì)算能力。網(wǎng)格的數(shù)據(jù)挖掘系統(tǒng)建技術(shù)是解決復(fù)雜海量科學(xué)數(shù)據(jù)的訪問、存儲、組織和管理的一立在網(wǎng)格計(jì)算的技術(shù)基礎(chǔ)上,數(shù)據(jù)的傳輸具有高效的并行性特種有效技術(shù)。未來的科學(xué)計(jì)算以數(shù)據(jù)為中心,數(shù)據(jù)已

6、成為科點(diǎn),而且數(shù)據(jù)處理能力超強(qiáng)。學(xué)、經(jīng)濟(jì)、醫(yī)療等領(lǐng)域的重要資源。在網(wǎng)格計(jì)算環(huán)境下,許多科(2)具有分布性和動態(tài)性,數(shù)據(jù)分布范圍廣。在網(wǎng)格計(jì)算學(xué)與工程計(jì)算問題,如高分子材料分析、生物計(jì)算、數(shù)字地球環(huán)境中,廣域分布的各種資源都是動態(tài)創(chuàng)建和刪除的。因此,等,以及信息服務(wù)、大型跨國企業(yè)、遠(yuǎn)程醫(yī)療合作將產(chǎn)生大量的網(wǎng)格的數(shù)據(jù)挖掘系統(tǒng)具備分布性和動態(tài)性,能夠靈活調(diào)整數(shù)據(jù)數(shù)據(jù)。要分析和挖掘這些廣域分布的海量數(shù)據(jù),以獲取新的科搜索的范圍;另外,由于數(shù)據(jù)的分布性特點(diǎn),數(shù)據(jù)挖掘算法是以學(xué)知識、規(guī)律和決策支持信息,傳統(tǒng)的數(shù)據(jù)挖掘模式和技術(shù)是分布計(jì)

7、算的方式并考慮數(shù)據(jù)流通負(fù)載來分析數(shù)據(jù)的。無法勝任的。建立在數(shù)據(jù)網(wǎng)格基礎(chǔ)上的數(shù)據(jù)挖掘結(jié)合網(wǎng)格計(jì)(3)具有高性能的I/O負(fù)載平衡能力。對廣域分布的海量算的思想及其技術(shù)的優(yōu)點(diǎn),能夠?qū)V域分布的海量數(shù)據(jù)進(jìn)行高數(shù)據(jù)處理的過程中,無論是數(shù)據(jù)的遠(yuǎn)程傳輸,還是挖掘過程中效的處理、分析和挖掘,給科學(xué)研究領(lǐng)域,經(jīng)濟(jì)領(lǐng)域和社會生活的數(shù)據(jù)處理、分析挖掘、模式評價(jià)等過程,數(shù)據(jù)的工作流都是很帶來新的發(fā)現(xiàn)和巨大的價(jià)值。大的。這需要網(wǎng)格提供網(wǎng)絡(luò)負(fù)載調(diào)度、管理和高性能的I/O負(fù)載平衡能力。!"網(wǎng)格的數(shù)據(jù)挖掘(4)高效的數(shù)據(jù)存儲服務(wù)、傳輸服務(wù)和復(fù)制管理。在數(shù)

8、據(jù)!.!"網(wǎng)格數(shù)據(jù)挖掘的基本概念挖掘過程中要進(jìn)行大數(shù)據(jù)集存儲、復(fù)制的時(shí)候,網(wǎng)格能夠提供高效的廣域網(wǎng)數(shù)據(jù)高速緩存服務(wù)以解決網(wǎng)絡(luò)帶寬管理的問題;網(wǎng)格的數(shù)據(jù)挖掘建立在數(shù)據(jù)網(wǎng)格的基礎(chǔ)設(shè)施和相關(guān)技術(shù)數(shù)據(jù)傳輸策略能夠支持多種存儲系統(tǒng),并行數(shù)據(jù)傳輸,部分文的基礎(chǔ)上,在廣域分布的海量數(shù)據(jù)和計(jì)算資源的環(huán)境中發(fā)現(xiàn)數(shù)件傳輸和

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時(shí)可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。