資源描述:
《基于粗糙集的數(shù)據(jù)挖掘應(yīng)用研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、論文題目:基于粗糙集的數(shù)據(jù)挖掘應(yīng)用研究專業(yè):應(yīng)用數(shù)學(xué)碩士生:王佳指導(dǎo)教師:丁正生馮衛(wèi)兵(簽名)(簽名)摘要數(shù)據(jù)挖掘是一種對數(shù)據(jù)分析、理解,并研究數(shù)據(jù)內(nèi)部蘊(yùn)含知識的技術(shù),是當(dāng)前人工智能研究中特別活躍的領(lǐng)域。粗糙集是一種新的數(shù)據(jù)挖掘技術(shù),該理論不需要任何先驗(yàn)的知識,就可以分析和處理不精確、不完整的信息,并從中發(fā)現(xiàn)隱含的知識,揭示潛在的規(guī)律,近年來基于粗糙集的數(shù)據(jù)挖掘越來越被人們重視。本文首先對近年來基于粗糙集理論的數(shù)據(jù)挖掘的歷史、過程及方法進(jìn)行了綜述。介紹了粗糙集理論的基礎(chǔ)知識。其次,介紹了粗糙集的核心部分即屬性約簡及決策規(guī)則獲取的算法。討論了兩種基于差別矩陣的屬
2、性約簡算法,并對這兩種算法進(jìn)行了舉例說明。并針對差別矩陣在解決較大的決策表的屬性約簡問題時出現(xiàn)的時空復(fù)雜度偏高的問題,提出了運(yùn)用邏輯差別矩陣來進(jìn)行屬性的約簡,這就大大提高了運(yùn)算的效率,同時針對不一致的決策表,對邏輯差別矩陣概念進(jìn)行了修正,提出了本文的改進(jìn)算法,該算法直接利用改進(jìn)的邏輯差別矩陣進(jìn)行矩陣的生成,避免了決策表不一致時傳統(tǒng)算法帶來的錯誤結(jié)果,又對幾個屬性在邏輯差別矩陣中出現(xiàn)的次數(shù)相同的情況進(jìn)行了補(bǔ)充,并在算法得到約簡后,加上了一個反向相消的過程,這些都使得該約簡算法能更加有效的得出最小的約簡集合。再次,簡單的介紹了規(guī)則獲取算法,并在其基礎(chǔ)上增加了刪除重復(fù)記
3、錄的步驟,有效提高了約簡效率。最后,針對當(dāng)代大學(xué)生學(xué)習(xí)風(fēng)氣狀況,運(yùn)用本文提出的屬性約簡算法和規(guī)則提取算法,研究了影響大學(xué)生學(xué)習(xí)風(fēng)氣的幾種因素與大學(xué)生綜合績點(diǎn)的關(guān)系,并確定了影響綜合績點(diǎn)的關(guān)鍵因素,提出了提高大學(xué)生綜合績點(diǎn)的規(guī)則。關(guān)鍵詞:數(shù)據(jù)挖掘;屬性約簡;邏輯差別矩陣;規(guī)則提取;大學(xué)生學(xué)習(xí)風(fēng)氣研究類型:應(yīng)用研究Subject:Specialty:TheStudyontheApplicationofDataMiningBasedonRoughSetAppliedMathematicsName:WangJia(Signature)Instructor:DingZ
4、heng-shengFengWei-bing(Signature)ABSTRACTDataminingisanimportanttechnologyfordataanalysis,understandingandthestudyingoftheknowledgewhichinternallycontainsthedata,isparticularlyactiveareasofartificialintelligenceresearch.Roughsetisanewtechniqueofdatamining,thetheorydoesnotrequireanypr
5、ioriknowledge,youcananalyzeanddealwithimprecise,incompleteinformation,anddiscoverhiddenknowledge,andrevealpotentiallaw.Dataminingbasedonroughsethasarousedgreatattentioninrecentyears,Firstly,thepaperreviewedthehistory,processandmethodsaboutdataminingbasedonroughsettheory.Inthesametimes
6、,basicknowledgeoftheroughsetwasintroducedinthispaper.Secondly,thealgorithmofroughsetattributereductionandobtainingofdecisionruleswasintroduced.Twomethodsofattributereductionalgorithmbasedondiscernibilitymatrixwerediscussedandillustratedinthispaper.Usingdiscernibilitymatrixwilloccurshi
7、ghtimeandspacecomplexitywhenyousolvethelargerdecision-makingtable,sotheauthorproposedusinglogicdiscernibilitymatrixtodeducttheattribute.Thisimprovestheefficiencyofoperationsgreatly.Then,thedefinitionofdecisiontableforinconsistentdecisionwasamendedandtheimprovedalgorithmwasgiveninthepa
8、per.