資源描述:
《基于粗糙集與云決策樹的數(shù)據(jù)挖掘理論研究與應(yīng)用》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、申請上海交通大學(xué)博士學(xué)位論文.IS30<《工基于粗糙集與云決策樹的數(shù)據(jù)挖掘理論研究與應(yīng)用作者姓名:張樹瑜pD2。;9羅護(hù)孑6導(dǎo)師姓名:朱仲英教授學(xué)科專業(yè):控制理論與控制工程系別:自動化系上海交通大學(xué)2005年11月t-,奎1}yjDissertationSubmittedtoShanghaiJiaoTongUniversityforPH.D.RESEARCHONTHETHEORYANDA-PPLICAnONOFDAI'AMININGBASEDONROUGHSETSANDCLOUDDECISITONTREECandidate:ZhangShuyuSupervisor:Profess
2、orZhuZhongyingMajor:ControlTheoryandControlEngineeringDepartment:AutomationShanghaiJiaoTongUniversityNovember,2005,■【,●●●●●●●-~●.曩'附件四上海交通大學(xué)上海父逋大芋學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的學(xué)位論文,是本人在導(dǎo)師的指導(dǎo)下,獨(dú)立進(jìn)行研究工作所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本論文不包含任何其他個(gè)人或集體己經(jīng)發(fā)表或撰寫過的作品成果。對本文的研究做出重要貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。本人完全意識到本聲明的法律結(jié)果由本人承擔(dān)。
3、學(xué)位論文作者簽名:弓位柳渝日期:形年7月7日、■、j,√L●J.-----T●--._.附件五上海交通大學(xué)學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)上海交通大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。,保密甌在土年解密后適用本授權(quán)書。本學(xué)位論文屬于不保密口。(請?jiān)谝陨戏娇騼?nèi)打“√")學(xué)位論文作者簽名:弓錳柑渝指導(dǎo)教師簽名:鏟砌鉉日期:D6年J月7Et日期:。占年,月-7日\1\\上海交
4、通人學(xué)博l:學(xué)位論文摘要基于粗糙集與云決策樹的數(shù)據(jù)挖掘理論研究與應(yīng)用摘要隨著信息技術(shù)以及數(shù)據(jù)倉庫技術(shù)的發(fā)展,在商業(yè)企業(yè)、科研機(jī)構(gòu)以及政府部門出現(xiàn)了海量的、不同形式存儲的數(shù)據(jù),對數(shù)據(jù)挖掘方法在智能化和準(zhǔn)確度方面提出了更高的要求。決策樹方法因其具有可理解性高,計(jì)算量相對較小等特點(diǎn)而受到人們的歡迎。經(jīng)過多年的發(fā)展,決策樹方法經(jīng)已經(jīng)取得了很人進(jìn)步,內(nèi)容也得到了很大充實(shí),但實(shí)際中的數(shù)據(jù)大多都具有隨機(jī)性或不確定性,具有精確描述特征的決策樹!f1納學(xué)習(xí)已經(jīng)不能適應(yīng)一個(gè)系統(tǒng)中不精確知識自動獲取的要求,而云模型方法在處理模糊性和不確定性的問題方面具有自己的獨(dú)特性。云決策樹的推理使得決策樹這種優(yōu)良方
5、法可以應(yīng)用于更多的數(shù)據(jù)分析中,發(fā)揮更大的作用。另外,決策樹在處理冗余屬性方面還存在許多問題,而粗糙集理論的屬性約簡是處理冗余屬性很好的方法。對屬性進(jìn)行約簡就是去除與決策屬性不相關(guān)的條件屬性,這樣對于不同的數(shù)據(jù)集,尤其是大型數(shù)據(jù)集,可使決策樹的規(guī)模明顯減小,節(jié)點(diǎn)數(shù)量明顯減少,從而使得決策樹方法可理解性高、分類速度相對較快、計(jì)算復(fù)雜度相對較小以及分類準(zhǔn)確率相對較高的特點(diǎn)得到充分體現(xiàn)。粗糙集理論在處理不確定性問題或知識獲取時(shí),由于通過確定的數(shù)學(xué)公式描述直接對數(shù)據(jù)進(jìn)行分析與處理,即不需要提供一個(gè)先驗(yàn)知識(如隸屬函數(shù)),從而避免了主觀性的影響,因此可作為其它理論如模糊集理論的一個(gè)有效補(bǔ)充,
6、但粗糙集理論本身并不包含處理不確定性和不精確原始數(shù)據(jù)的機(jī)制。云決策樹雖然包含處理不確定性和不精確原始數(shù)據(jù)的機(jī)制,但需要給出一個(gè)隸屬度或隸屬函數(shù)(先驗(yàn)知識),具有相當(dāng)?shù)闹饔^性。因此,如果它們二者能夠有機(jī)結(jié)合,對丁組成的新系統(tǒng),不僅符合人類認(rèn)知的表達(dá),而且具有客觀性。本文首先在粗糙集知識約簡的基礎(chǔ)上對云決策樹進(jìn)行了推理,說明該方法適用于不確定性數(shù)據(jù)的決策問題;然后,將粗糙集分類器與云決策樹方法有機(jī)結(jié)合,組成了比單獨(dú)的粗糙集分類器或決策樹方法性能更好的系統(tǒng),在仿真結(jié)果中取得了令人滿意的效果;最后,將研究成果應(yīng)用于基于J2EE平臺的數(shù)據(jù)挖掘系統(tǒng)中。本文工作主要包含以下內(nèi)容:(1)主要研究
7、粗糙集的擴(kuò)展應(yīng)用。為了對邏輯概念中的概率進(jìn)行分析,引入流向網(wǎng)絡(luò)的確定性流向分析代替概率的思想,并利用一個(gè)簡單實(shí)例來闡明這個(gè)思想。由于實(shí)際中沒有一種普遍的關(guān)于沖突情況的數(shù)學(xué)模型被大家認(rèn)可,本文在另外一種基于粗糙集理論方法的基礎(chǔ)上來進(jìn)行分析,并利用~個(gè)沖突情況下投票分析的簡單實(shí)例來闡明這種方法的有效性。從粗l≤譬上海交通人學(xué)博上學(xué)位論文摘要糙隸屬函數(shù)定義出發(fā)研究粗糙整體部分關(guān)系邏輯,給出了粗糙整體部分關(guān)系邏輯的相關(guān)定義及性質(zhì),為整體部分關(guān)系邏輯關(guān)于復(fù)雜結(jié)構(gòu)的推理提供了一種新的思路。(