資源描述:
《基于粗糙集的一種屬性值約簡算法及其應(yīng)用》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第26卷第2期計算機應(yīng)用與軟件Vol26No.22009年2月ComputerApplicationsandSoftwareFeb.2009基于粗糙集的一種屬性值約簡算法及其應(yīng)用吳尚智(西北師范大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院甘肅蘭州730070)摘要闡述粗糙集理論的基本概念,并且對屬性約簡和值約簡算法進行研究,提出了一種基于粗糙集的屬性值約簡算法。通過實例介紹該算法的應(yīng)用。研究表明,該算法不僅能得到最佳的決策規(guī)則,而且能夠大大降低信息系統(tǒng)所需的存儲空間,該算法可以解決各種有關(guān)的實際問題。關(guān)鍵詞粗糙集理論算法值約簡信息系統(tǒng)ANA
2、LGORITHMOFATTRIBUTEVALUEREDUCTIONANDITSAPPLICATIONBASEDONROUGHSETSWuShangzhi(CollegeofMathematicsandInformationScience,NorthwestNormalUniversity,Lanzhou730070,Gansu,China)AbstractInthispaperitexpoundsthebasicconceptionsoftheroughsetstheory,discussestheapproachesofattributere
3、ductionandattributevaluereduction,putsforwardanalgorithmofattributevaluereductionbasedonroughsets,introducesapplicationofthealgorithmbyexamples.Thestudiesshowthatthealgorithmnotonlycangetthebestdecisionrules,butalsocangreatlydecreasestoragespacethattheinformationsystemrequir
4、es.Itcanbeappliedtosolvevariouspracticalproblems.KeywordsRoughsetstheoryAlgorithmValuereductionInformationsystem又稱為知識的相對約簡,其最終結(jié)果是將決策表中的知識化成0引言少量的決策規(guī)則。定義1U上的一族劃分稱為關(guān)于U的一個知識庫。一個粗糙集理論是波蘭數(shù)學(xué)家Z.Pawlak于1982年初提出的一知識庫就是一個關(guān)系系統(tǒng)K=(U,R),其中U是非空有限集,R[1~4]種處理不精確、不完整、不確定性數(shù)據(jù)的數(shù)學(xué)工具。知識約為U上等
5、價關(guān)系的一個族集。U/R表示R的所有等價類(或者簡是粗糙集理論的核心內(nèi)容之一,其主要思想是在保持分類能U上的分類)構(gòu)成的集合,[x]R表示的是包含元素xU的R等力不變的前提下,消除信息系統(tǒng)(決策表)中不必要的知識,導(dǎo)價類。出最終的決策或分類規(guī)則。定義2若PR,且P,則P中所有等價關(guān)系的交集也通過信息系統(tǒng)的屬性約簡可以使信息系統(tǒng)得到簡化,但經(jīng)是一個等價關(guān)系,稱為P上的不可分辨關(guān)系,記為ind(P),且有過屬性約簡的信息系統(tǒng)還不是一個最簡的信息系統(tǒng),它包含著[x]ind(P)=[x]R。RP大量的冗余信息,即在約簡后的信息系統(tǒng),并不是每一
6、條記錄的U/ind(P)(即等價關(guān)系ind(P)的所有等價類)表示與等價每一個屬性值都能對信息系統(tǒng)最后決策規(guī)則的提取產(chǎn)生作用。關(guān)系族P相關(guān)的知識,稱為K中關(guān)于U的P基本知識(P基本因此,需要進一步對信息系統(tǒng)進行處理,得到更簡化的信息系集)。為簡單起見,用U/P代替U/ind(P),ind(P)的等價類稱統(tǒng),就是信息系統(tǒng)的屬性值約簡(簡稱值約簡)。值約簡的過程為知識P的基本概念或基本范疇。就是對每一條記錄中的冗余條件屬性進行篩選并刪除的過程。定義3形式上一個四元組S=(U,A,V,f)是一個知識表達系統(tǒng),其中U為論域,A為屬性集,V=Va(aA
7、),Va是屬性[3~8]1粗糙集約簡理論a的值域,f為信息函數(shù):UAV。通常知識表達系統(tǒng)也稱為信息系統(tǒng),通常也用S=(U,A)在粗糙集理論中,知識是用信息系統(tǒng)(即屬性值對表)來來代替S=(U,A,V,f)。表示的。一般情況下,表中的列標(biāo)記不同的屬性;行標(biāo)記論域的知識表達系統(tǒng)的數(shù)據(jù)以關(guān)系表的形式給出,關(guān)系表中的每對象。如果將信息系統(tǒng)中的屬性進一步分為條件屬性和決策屬一行對應(yīng)于要研究的對象,列則對應(yīng)于對象的屬性,對象的基本性,則稱該信息系統(tǒng)為決策表。知識約簡的目的是考察信息系信息是通過指定對象的各個屬性的值來表達的。統(tǒng)(或決策表)中給出的知識是
8、否都是必要的(相對于決策而容易看出,一個屬性對應(yīng)一個等價關(guān)系,因此一個表就可以言)。知識約簡是刪除信息系統(tǒng)(或決策表)中冗