資源描述:
《基于粗集理論的屬性約簡(jiǎn)方法及應(yīng)用研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、江蘇科技大學(xué)碩士學(xué)位論文基于粗集理論的屬性約簡(jiǎn)方法及應(yīng)用研究姓名:佘侃侃申請(qǐng)學(xué)位級(jí)別:碩士專(zhuān)業(yè):@指導(dǎo)教師:劉同明20050101AbstractTheResearchontheReductionanditsApplicationofRoughSetsABSTRACTRoughsettheoryisamathematicstooltodealwiththeuncertainandinconsistentproblems.Afterdetailedlyresearchingthecharacteristicsofuncertaintyproblemsin
2、thedataminingprocessandcarefullyanalyzingtheadvantagesanddisadvantagesofseveraluncertaintytheories,thedissertationselectsamethodbasedonroughsettheorytosolvetheaboveproblems.Ourmainlyresearchworkisthestudyofattributesreductionbasedonroughset.Themainachievementsincludes:zAccording
3、toPawlakmodel,weanalyzesthepropertiesofindiscernibilityrelation,focusingontwoimportantconcepts:indiscernibilityrelationandpositiveregion,thenproposesannewreductionalgorithm.Ithasbeenprovedtobemoreefficientthanthoseexistingalgorithms.zWealsosuggestaimprovedmodelcalledWVP-Tmodelco
4、mbiningthevariableprecisionmodelandthemodelbasedontolerantrelation.Itprovedtobeconsistentwiththestatisticandcanovercometheshortcomingofclassicalmodel.zOnthebasisoftheeffortsabove,thearchitectureofanIDSSbasedonroughsetattributereduction(RSAR)isdiscussed.Futhermoren,theIDSSsystemi
5、susedtoCRM,whichhasextendedtheapplicationareaofRSAR.Theresearchworkinthedissertationhaspartlysolvedtheproblemsofdiscoveringknowledgefromthedatawhichisuncertainorincomplete,madeitpossiblefortheRSARtechniquetobefurtherappliedtomanagementdecision.KeyWords:roughset,datamining,attrib
6、utesreduction,intelligentdecisionsupportsy-tems,customerrelationshipmanagement-II-第一章緒論第一章緒論1.1數(shù)據(jù)挖掘與粗集隨著計(jì)算機(jī)的日益普及,信息量也相應(yīng)劇增。面對(duì)如此龐大的數(shù)據(jù)資源,人們迫切需要一種新的工具來(lái)處理大量的、雜亂無(wú)章的數(shù)據(jù),并從中獲取有用的知識(shí)。眾多學(xué)者投入這方面的研究,并取得了一定的成績(jī),如目前常用的方法:模糊集法、神經(jīng)網(wǎng)絡(luò)法、證據(jù)理論等。這些方法在對(duì)數(shù)據(jù)處理時(shí)常依賴(lài)于先驗(yàn)知識(shí)的多少,因此專(zhuān)家的知識(shí)直接影響著人們獲取知識(shí)的準(zhǔn)確程度。粗集理論的出現(xiàn),為我們
7、處理不完整、不精確的數(shù)據(jù)提供了一種很好的建模工具。這種方法的強(qiáng)大優(yōu)越性在于不需要專(zhuān)家的知識(shí),不需要專(zhuān)門(mén)的機(jī)構(gòu)為原有的數(shù)據(jù)提供更多的解釋。我們可以直接從原有知識(shí)出發(fā),劃分等價(jià)類(lèi),因此對(duì)知識(shí)的劃分是粗集的出發(fā)點(diǎn)。系統(tǒng)的約簡(jiǎn)也是以劃分為基礎(chǔ),求出任意對(duì)象間的差別函數(shù),從而得出能夠區(qū)分所有對(duì)象的最小屬性集合,最終得出具有同等表達(dá)能力的新信息系統(tǒng)。綜上所述,基于粗集的數(shù)據(jù)挖掘技術(shù)在信息系統(tǒng)的研究領(lǐng)域中具有非常重要的意義。1.2粗集理論的研究現(xiàn)狀粗糙集(RoughSet)理論是波蘭數(shù)學(xué)家Z.Pawlak在1982年提出的一種分析數(shù)據(jù)的數(shù)[1]學(xué)理論。該理論在分類(lèi)的
8、意義下定義了模糊性和不確定性?xún)蓚€(gè)概念,是一種處理不確定、不相容數(shù)據(jù)和不精確問(wèn)題的新型數(shù)學(xué)工具。