基于粗糙集理論的數(shù)據(jù)挖掘算法研究

基于粗糙集理論的數(shù)據(jù)挖掘算法研究

ID:33403753

大?。?.52 MB

頁數(shù):57頁

時間:2019-02-25

基于粗糙集理論的數(shù)據(jù)挖掘算法研究_第1頁
基于粗糙集理論的數(shù)據(jù)挖掘算法研究_第2頁
基于粗糙集理論的數(shù)據(jù)挖掘算法研究_第3頁
基于粗糙集理論的數(shù)據(jù)挖掘算法研究_第4頁
基于粗糙集理論的數(shù)據(jù)挖掘算法研究_第5頁
資源描述:

《基于粗糙集理論的數(shù)據(jù)挖掘算法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫

1、Y782874授了.單化代碼:一10451研究生學(xué)號:~020衛(wèi)L密級:鄭州大學(xué)碩士學(xué)位論文論文題目研究生姓名學(xué)科門類一級學(xué)科專業(yè)研究方向?qū)煛⒙毞Q基王塑糙篡理論的塑握撞型篡這鯉筮萱綞塞工堂控制型堂皇工程控制理論與控制1二程麴堡撞趔皇翅遲叁塑匱叢墅.熬援二零零氕年五月八同摘要進入網(wǎng)絡(luò)信息時代,隨著計算機技術(shù)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,使得各個行業(yè)領(lǐng)域的信息急劇增加,如何從大量的、雜亂無章的數(shù)據(jù)中發(fā)現(xiàn)潛在的、有價值的、簡潔的知識呢?數(shù)據(jù)挖掘(DM)和知識發(fā)現(xiàn)(KDD)技術(shù)應(yīng)運而生。粗糙集理論與方法作為數(shù)據(jù)挖掘或者知識發(fā)現(xiàn)方法的一種,它與基于概率論的數(shù)據(jù)挖掘方法、基于

2、模糊理論的數(shù)據(jù)挖掘方法和基于證據(jù)理論的數(shù)據(jù)挖掘方法等其他處理不確定性問題理論的方法最顯著的區(qū)別是它不需要提供問題所需處理的數(shù)據(jù)集之外的任何先驗知識,而且與處理其他不確定性問題的理論有很強的互補性,特別是模糊理論。但是,粗糙集理論的基本運算是建立在求集合的并交補和求等價關(guān)系基礎(chǔ)之上的,利用粗糙集理論挖掘一般決策表的最簡規(guī)則或者所有規(guī)則是一個NP—Hard問題,NP_—Hard問題是計算數(shù)學(xué)的一個普遍難題,它的解決依賴于某個NP—Hard問題的解決,因此,如何降低算法的復(fù)雜度成為限制粗糙集理論應(yīng)用的一個根本性問題。本文介紹了粗糙集理論的基本概念和擴展的粗糙集理論

3、模型,研究了粗糙集理論進行數(shù)據(jù)挖掘算法的特點,通過證明一個半群一有限集合代數(shù)系統(tǒng)的可表示定理,將有限集合代數(shù)系統(tǒng)用一個與之同構(gòu)的位向量代數(shù)系統(tǒng)來描述,將集合的并交補運算轉(zhuǎn)化為位向量代數(shù)系統(tǒng)的與或非運算,該定理具有一定的普適性一基本上所有的基于粗糙集理論的各種算法都可以適用。在該定理的基礎(chǔ)上,設(shè)計了一種基于粗糙集論的數(shù)據(jù)挖掘?qū)傩约s簡算法和規(guī)則挖掘算法,與一般的算法比較,時間復(fù)雜度大大降低;空間的復(fù)雜度降為一般算法的八分之一。利用該算法開發(fā)了一個原型系統(tǒng)RSDM和一個MATLAB仿真軟件包,以進行數(shù)據(jù)挖掘的進一步研究和應(yīng)用。另一方面,粗糙挖掘算法的時間復(fù)雜度問題

4、并沒有得到完全的解決,因此本文介紹了基于消息傳遞的并行計算模型,在此模型基礎(chǔ)上,利用MPICH并行計算軟件包,初步研究了粗糙挖掘的并行計算算法。現(xiàn)將本文的主要工作列舉如下:1.給出并證明有限集合代數(shù)系統(tǒng)可表示定理,設(shè)計基于粗糙集理論的數(shù)據(jù)挖掘(以下簡稱粗糙挖掘1串行實現(xiàn)算法。2.介紹了一般知識發(fā)現(xiàn)過程,研究了粗糙挖掘的過程,設(shè)計開發(fā)了粗糙挖掘的原型系統(tǒng)RSDM和一個MATLAB粗糙挖掘軟件包。3.研究了基于Windows2000集群式系統(tǒng)上,采用消息傳遞的并行計算模型,利用MPI初步研究了基于粗糙理論的數(shù)據(jù)挖掘并行實現(xiàn)算法。關(guān)鍵詞:粗糙集,RoughSet,

5、數(shù)據(jù)挖掘,MPIAbstractNow,wearesteppinginaneraofnetinformation,Withthehigh—speeddevelopmentofcomputertechnologyandnettechnology,theinformationindifferentfieldshasincreasedextremely.Howtopickupthepotential,valuableandcompactknowledgefromthevastanddisordereddatahasbecomeadesiderativeproble

6、m?Thetechnologiesofdatamining(DM)andknowledgedatabasediscovery(KDD)haveemergedwitllsuchneeds.TheroughsettheoryisusedasanapproachofDMorKDD.Thedistinctdifferenceoftheroughsetapproachcomparedwithotherapproachesofdealingwimtheuncertainproblemsuchasthedataminingapproachbasedonprobabilit

7、y,thedataminingapproachbasedOilfuzzytheoryandthedataⅡlillingapproachbasedonprooftheoryisthatthemethodneednotprovideanyknownknowledgewhichisoutoftheapproachingdatasetdomains。Theroughsetmethodisworkedasallstrongerauxiliaryfunction、加Ⅱ1theothermethodsofdealingwithuncertainproblem.espec

8、iallywiththeapproachofthef

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。