基于移動agent數(shù)據(jù)挖掘技術(shù)的研究

基于移動agent數(shù)據(jù)挖掘技術(shù)的研究

ID:32755827

大?。?.67 MB

頁數(shù):58頁

時間:2019-02-15

基于移動agent數(shù)據(jù)挖掘技術(shù)的研究_第1頁
基于移動agent數(shù)據(jù)挖掘技術(shù)的研究_第2頁
基于移動agent數(shù)據(jù)挖掘技術(shù)的研究_第3頁
基于移動agent數(shù)據(jù)挖掘技術(shù)的研究_第4頁
基于移動agent數(shù)據(jù)挖掘技術(shù)的研究_第5頁
資源描述:

《基于移動agent數(shù)據(jù)挖掘技術(shù)的研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫

1、摘要計算機技術(shù)、網(wǎng)絡(luò)技術(shù)、Internet技術(shù)的進步,帶來了數(shù)據(jù)挖掘技術(shù)的迅速發(fā)展。該技術(shù)主要是以從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)集中識別有效的、新穎的、潛在有用的、以及最終可理解的模式為目標,實現(xiàn)尋找模式的決策支持。實際工程中,數(shù)據(jù)集大部分都按地理位置分布于多個場所,若把這些數(shù)據(jù)重新收集到一個集中的地方(如數(shù)據(jù)倉庫),這要求有高的數(shù)據(jù)通訊網(wǎng)絡(luò),并且會導致響應(yīng)時間變長和數(shù)據(jù)私有性和安全性被破壞。分布式數(shù)據(jù)挖掘技術(shù)很好地解決了以上的問題,在分布式數(shù)據(jù)挖掘系統(tǒng)下,用戶、數(shù)據(jù)、硬件資源以及挖掘需要的軟件資源在物理上都可以使分布的。為了提高分布式

2、數(shù)據(jù)挖掘系統(tǒng)的通信效率、平臺兼容性并解決數(shù)據(jù)傳輸?shù)确矫娲嬖诘陌踩詥栴},本論文圍繞研究將移動Agent技術(shù)應(yīng)用到分布式數(shù)據(jù)挖掘中,構(gòu)建遠程交互、平臺無關(guān)、節(jié)約網(wǎng)絡(luò)帶寬且具有較高可維護性和靈活性的分布式數(shù)據(jù)挖掘系統(tǒng),以重慶交通大學研究生教育創(chuàng)新基金項目“網(wǎng)絡(luò)工程系統(tǒng)‘亞健康’狀態(tài)診斷及智能維護決策機制研究”為背景,對移動Agent技術(shù)在分布式數(shù)據(jù)挖掘方面的應(yīng)用進行了深入的研究與討論。論文主要研究成果包括:(1)對移動Agent做了深入的理解和掌握,深入分析了移動Agent模型的特征、系統(tǒng)結(jié)構(gòu)等。剖析了其它一些分布式計算模型的優(yōu)缺點,在此基礎(chǔ)上提出了一個基于

3、移動Agent的分布式數(shù)據(jù)挖掘模型。在分析影響分布式數(shù)據(jù)挖掘性能的因素的基礎(chǔ)上,建立了幾種典型的分布式數(shù)據(jù)挖掘模型的通信代價模型。(2)利用移動Agent平臺Aglet,設(shè)計并實現(xiàn)一個基于Aglet的分布式數(shù)據(jù)挖掘原型系統(tǒng),該系統(tǒng)利用移動Agent的移動性、反應(yīng)性、自主性等特征,主控站點派遣Aglet遷徙到遠程站點去執(zhí)行挖掘任務(wù),并將局部挖掘結(jié)果返回主控站點。只須移動的僅僅是Aglet本身少量的代碼、局部挖掘結(jié)果和Aglet本身的狀態(tài),減少了通信量。(3)在研究了關(guān)聯(lián)規(guī)則挖掘理論和各種分布式關(guān)聯(lián)規(guī)則挖掘算法的基礎(chǔ)上,對分布式關(guān)聯(lián)規(guī)則挖掘算法FDM算法進行

4、了改進,得出了DDMARBA算法。該算法中,由于移動Agent的介入,徹底改變了分布式環(huán)境中各站點間的通信方式,理論分析表明,A西et只需兩次往返于主控站點和目的主機之間(兩次往返的Aglet是具有不同挖掘任務(wù)的Aglet),即可得到遠程站點的局部挖掘結(jié)果,提高了挖掘效率。對UCI數(shù)據(jù)集,運用該算法進行實驗,證明了DDMARBA算法的有效性和較之Aprior算法的挖掘效率的優(yōu)勢,特別是對于海量數(shù)據(jù)集來說,挖掘效率優(yōu)勢愈加明顯。關(guān)鍵詞:數(shù)據(jù)挖掘;移動Agent:Aglet平臺;數(shù)據(jù)庫;關(guān)聯(lián)規(guī)則ABSTRACTWiththedevelopmentofcomp

5、utertechnology,networktechnologyandIntemette(!hnology’thetechnologyofdatamininghasdevelopedrapidly.Thistechnologyisengagedinidentifyingthemodewhichisvalid,novel,potentiallyusefulandultimatelycomprehensiblefromlarge,incomplete,noisy,fuzzyandstochasticdatasets,andachievesfindingdec

6、ision-makingsupportofmode.Inpractice,mostdatasetsdistributegeographicallyinseverallocations,therefore,ifthedataisproposedtobecollectedinoneplace(suchasdatawarehouse),high—speedcommunicationnetworkwillberequired.a(chǎn)saresult,timeofresponsewillbelongerandsecuritywillbedestroyed·Howeve

7、r.technologyofdistributeddataminingresolvestheaboveproblemswellandindistributeddataminingsystem,client,data,hardwareandsofhvareneededbydataminingcanbedistributedgeographically.Inordertoimprovethecommunicationefficiencyandplatformcompatibilityofdis仃ibuteddataminingandsolvethesecur

8、ityproblemsexistinginthefieldsofdatatraI

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。