資源描述:
《基于模糊粗糙集的數(shù)據(jù)分析模型與算法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、*分類編號(hào):?jiǎn)挝淮a:10167:密級(jí):學(xué)號(hào)2010000157碩士學(xué)位論文論文題目:基于模糊粗糙集的數(shù)據(jù)分析模型與算法研究ResearchonDataAnalsisModelandAlorithmygBasedonFuzzyRouhSetg作者姓名:馮唱指導(dǎo)教師:王長(zhǎng)忠教授專業(yè)名稱:應(yīng)用數(shù)學(xué)研究方向:數(shù)據(jù)挖掘2015級(jí)學(xué)院年級(jí):數(shù)理學(xué)院完成日期:2018年6月渤海大學(xué)研究生學(xué)院基于模糊粗糙集的數(shù)據(jù)分析模型與算法研究摘要今天的我們正處于信息化時(shí)代,信息化時(shí)代是當(dāng)今時(shí)代發(fā)展的
2、大趨勢(shì),隨之發(fā)展的網(wǎng)路信息技術(shù),正以前所未有的發(fā)展速度伴隨這我們生活的日常,大數(shù)據(jù)問(wèn)題的實(shí)際應(yīng)用問(wèn)題亟待解決。對(duì)于大數(shù)據(jù)的處理已經(jīng)成為數(shù)據(jù)挖掘方面的焦點(diǎn)問(wèn)題。模糊粗糙集是一個(gè)用于特征選擇的重要的粗糙集模型。經(jīng)典模糊粗糙集使用模糊依賴函數(shù)作為特征選擇的準(zhǔn)則。然而,這個(gè)準(zhǔn)則函數(shù)只能保持樣本到?jīng)Q策類的最大隸屬度,不能保證分類誤差最小。在本文中,我們引入了新的特征選擇標(biāo)準(zhǔn)來(lái)克服這個(gè)弱點(diǎn)。為了表征分類錯(cuò)誤率,首先引入一類模糊二元關(guān)系來(lái)構(gòu)造決策的模糊下近似和上近似。然后,引入新的依賴關(guān)系概念:錯(cuò)分率和內(nèi)積依賴度來(lái)描述分類錯(cuò)誤?;诖?,提出了新的特征選擇標(biāo)準(zhǔn)
3、來(lái)度量候選屬性的重要性。提出的準(zhǔn)則在保持最大依賴函數(shù)的同時(shí)還能保證最小分類誤差。本文中所提出的屬性約簡(jiǎn)算法理論推論和實(shí)驗(yàn)結(jié)果都可以證明,該特征選擇算法明顯優(yōu)于其他的經(jīng)典算法,特別是對(duì)于不同類別表現(xiàn)出很大程度重疊的數(shù)據(jù)集,降低了特征選擇的復(fù)雜度的同時(shí)提高了樣本的分類精度,具有一定的現(xiàn)實(shí)意義。[關(guān)鍵詞]:模糊粗糙集;模糊相似關(guān)系;模糊內(nèi)積依賴;分類錯(cuò)誤率IRESEARCHONDATAANALYSISMODELANDALGORITHMBASEDONFUZZYSETAABSTRACTTodayweareinaneraofinformationizati
4、on.Theeraofinformationizationisageneraltrendofdevelopmentinthepresentage.Withthedevelopmentofnetworkinformationtechnology,weareatanunprecedentedpaceofdevelopment.Withtherealityofdailylifeandbigdataproblemsofourlifewaitingtobesolved.Forfeatureselection,fuzzyroughsetisanimport
5、antclassicalroughsetmodel.Fuzzyroughsetsusefuzzydependentfunctionasfeatureselectionstandard.However,thisstandardfunctioncannotguaranteetheminimumclassificationerrorwhilemaintainingthemaximummembershipofasampletoadecisionclass.Inthispaper,anewfeatureselectioncriteriaisintrodu
6、cedtoovercomethisweakness.Inordertocharacterizetheclassificationerrorratio,firstintroducetheclassoffuzzybinaryrelationstoconstructthefuzzyupperapproximationandlowerapproximation.Then,introducethenewdependencyconcept:usemisclassificationrateandinnerproductdependencetodescribe
7、classificationerrors.Basedonthis,weproposenewfeatureselectioncriteriaformeasuringimportanceofcandidateattributes.Theproposedcriterioncanguaranteetheminimumclassificationerrorwhilemaintainingthemaximumdependencefunction.Thealgorithmandexperimentalresultsshowthatthefeaturesele
8、ctionalgorithminthispaperoutperformssomeotherclassicalalgorithms,especially