資源描述:
《基于粗糙集與云決策樹的數(shù)據(jù)挖掘理論研究與應(yīng)用》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、申請上海交通大學(xué)博士學(xué)位論文.IS30<《工基于粗糙集與云決策樹的數(shù)據(jù)挖掘理論研究與應(yīng)用作者姓名:張樹瑜pD2。;9羅護孑6導(dǎo)師姓名:朱仲英教授學(xué)科專業(yè):控制理論與控制工程系別:自動化系上海交通大學(xué)2005年11月t-,奎1}yjDissertationSubmittedtoShanghaiJiaoTongUniversityforPH.D.RESEARCHONTHETHEORYANDA-PPLICAnONOFDAI'AMININGBASEDONROUGHSETSANDCLOUDDECISITONTREECandidate:ZhangShuyuSupervisor:Profess
2、orZhuZhongyingMajor:ControlTheoryandControlEngineeringDepartment:AutomationShanghaiJiaoTongUniversityNovember,2005,■【,●●●●●●●-~●.曩'附件四上海交通大學(xué)上海父逋大芋學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的學(xué)位論文,是本人在導(dǎo)師的指導(dǎo)下,獨立進行研究工作所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本論文不包含任何其他個人或集體己經(jīng)發(fā)表或撰寫過的作品成果。對本文的研究做出重要貢獻的個人和集體,均已在文中以明確方式標(biāo)明。本人完全意識到本聲明的法律結(jié)果由本人承擔(dān)。
3、學(xué)位論文作者簽名:弓位柳渝日期:形年7月7日、■、j,√L●J.-----T●--._.附件五上海交通大學(xué)學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)上海交通大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。,保密甌在土年解密后適用本授權(quán)書。本學(xué)位論文屬于不保密口。(請在以上方框內(nèi)打“√")學(xué)位論文作者簽名:弓錳柑渝指導(dǎo)教師簽名:鏟砌鉉日期:D6年J月7Et日期:。占年,月-7日\1\\上海交
4、通人學(xué)博l:學(xué)位論文摘要基于粗糙集與云決策樹的數(shù)據(jù)挖掘理論研究與應(yīng)用摘要隨著信息技術(shù)以及數(shù)據(jù)倉庫技術(shù)的發(fā)展,在商業(yè)企業(yè)、科研機構(gòu)以及政府部門出現(xiàn)了海量的、不同形式存儲的數(shù)據(jù),對數(shù)據(jù)挖掘方法在智能化和準(zhǔn)確度方面提出了更高的要求。決策樹方法因其具有可理解性高,計算量相對較小等特點而受到人們的歡迎。經(jīng)過多年的發(fā)展,決策樹方法經(jīng)已經(jīng)取得了很人進步,內(nèi)容也得到了很大充實,但實際中的數(shù)據(jù)大多都具有隨機性或不確定性,具有精確描述特征的決策樹!f1納學(xué)習(xí)已經(jīng)不能適應(yīng)一個系統(tǒng)中不精確知識自動獲取的要求,而云模型方法在處理模糊性和不確定性的問題方面具有自己的獨特性。云決策樹的推理使得決策樹這種優(yōu)良方
5、法可以應(yīng)用于更多的數(shù)據(jù)分析中,發(fā)揮更大的作用。另外,決策樹在處理冗余屬性方面還存在許多問題,而粗糙集理論的屬性約簡是處理冗余屬性很好的方法。對屬性進行約簡就是去除與決策屬性不相關(guān)的條件屬性,這樣對于不同的數(shù)據(jù)集,尤其是大型數(shù)據(jù)集,可使決策樹的規(guī)模明顯減小,節(jié)點數(shù)量明顯減少,從而使得決策樹方法可理解性高、分類速度相對較快、計算復(fù)雜度相對較小以及分類準(zhǔn)確率相對較高的特點得到充分體現(xiàn)。粗糙集理論在處理不確定性問題或知識獲取時,由于通過確定的數(shù)學(xué)公式描述直接對數(shù)據(jù)進行分析與處理,即不需要提供一個先驗知識(如隸屬函數(shù)),從而避免了主觀性的影響,因此可作為其它理論如模糊集理論的一個有效補充,
6、但粗糙集理論本身并不包含處理不確定性和不精確原始數(shù)據(jù)的機制。云決策樹雖然包含處理不確定性和不精確原始數(shù)據(jù)的機制,但需要給出一個隸屬度或隸屬函數(shù)(先驗知識),具有相當(dāng)?shù)闹饔^性。因此,如果它們二者能夠有機結(jié)合,對丁組成的新系統(tǒng),不僅符合人類認(rèn)知的表達,而且具有客觀性。本文首先在粗糙集知識約簡的基礎(chǔ)上對云決策樹進行了推理,說明該方法適用于不確定性數(shù)據(jù)的決策問題;然后,將粗糙集分類器與云決策樹方法有機結(jié)合,組成了比單獨的粗糙集分類器或決策樹方法性能更好的系統(tǒng),在仿真結(jié)果中取得了令人滿意的效果;最后,將研究成果應(yīng)用于基于J2EE平臺的數(shù)據(jù)挖掘系統(tǒng)中。本文工作主要包含以下內(nèi)容:(1)主要研究
7、粗糙集的擴展應(yīng)用。為了對邏輯概念中的概率進行分析,引入流向網(wǎng)絡(luò)的確定性流向分析代替概率的思想,并利用一個簡單實例來闡明這個思想。由于實際中沒有一種普遍的關(guān)于沖突情況的數(shù)學(xué)模型被大家認(rèn)可,本文在另外一種基于粗糙集理論方法的基礎(chǔ)上來進行分析,并利用~個沖突情況下投票分析的簡單實例來闡明這種方法的有效性。從粗l≤譬上海交通人學(xué)博上學(xué)位論文摘要糙隸屬函數(shù)定義出發(fā)研究粗糙整體部分關(guān)系邏輯,給出了粗糙整體部分關(guān)系邏輯的相關(guān)定義及性質(zhì),為整體部分關(guān)系邏輯關(guān)于復(fù)雜結(jié)構(gòu)的推理提供了一種新的思路。(