資源描述:
《基于粗糙集的一種屬性值約簡(jiǎn)算法及其應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、第26卷第2期計(jì)算機(jī)應(yīng)用與軟件Vol26No.22009年2月ComputerApplicationsandSoftwareFeb.2009基于粗糙集的一種屬性值約簡(jiǎn)算法及其應(yīng)用吳尚智(西北師范大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院甘肅蘭州730070)摘要闡述粗糙集理論的基本概念,并且對(duì)屬性約簡(jiǎn)和值約簡(jiǎn)算法進(jìn)行研究,提出了一種基于粗糙集的屬性值約簡(jiǎn)算法。通過(guò)實(shí)例介紹該算法的應(yīng)用。研究表明,該算法不僅能得到最佳的決策規(guī)則,而且能夠大大降低信息系統(tǒng)所需的存儲(chǔ)空間,該算法可以解決各種有關(guān)的實(shí)際問(wèn)題。關(guān)鍵詞粗糙集理論算法值約簡(jiǎn)信息系統(tǒng)ANA
2、LGORITHMOFATTRIBUTEVALUEREDUCTIONANDITSAPPLICATIONBASEDONROUGHSETSWuShangzhi(CollegeofMathematicsandInformationScience,NorthwestNormalUniversity,Lanzhou730070,Gansu,China)AbstractInthispaperitexpoundsthebasicconceptionsoftheroughsetstheory,discussestheapproachesofattributere
3、ductionandattributevaluereduction,putsforwardanalgorithmofattributevaluereductionbasedonroughsets,introducesapplicationofthealgorithmbyexamples.Thestudiesshowthatthealgorithmnotonlycangetthebestdecisionrules,butalsocangreatlydecreasestoragespacethattheinformationsystemrequir
4、es.Itcanbeappliedtosolvevariouspracticalproblems.KeywordsRoughsetstheoryAlgorithmValuereductionInformationsystem又稱為知識(shí)的相對(duì)約簡(jiǎn),其最終結(jié)果是將決策表中的知識(shí)化成0引言少量的決策規(guī)則。定義1U上的一族劃分稱為關(guān)于U的一個(gè)知識(shí)庫(kù)。一個(gè)粗糙集理論是波蘭數(shù)學(xué)家Z.Pawlak于1982年初提出的一知識(shí)庫(kù)就是一個(gè)關(guān)系系統(tǒng)K=(U,R),其中U是非空有限集,R[1~4]種處理不精確、不完整、不確定性數(shù)據(jù)的數(shù)學(xué)工具。知識(shí)約為U上等
5、價(jià)關(guān)系的一個(gè)族集。U/R表示R的所有等價(jià)類(或者簡(jiǎn)是粗糙集理論的核心內(nèi)容之一,其主要思想是在保持分類能U上的分類)構(gòu)成的集合,[x]R表示的是包含元素xU的R等力不變的前提下,消除信息系統(tǒng)(決策表)中不必要的知識(shí),導(dǎo)價(jià)類。出最終的決策或分類規(guī)則。定義2若PR,且P,則P中所有等價(jià)關(guān)系的交集也通過(guò)信息系統(tǒng)的屬性約簡(jiǎn)可以使信息系統(tǒng)得到簡(jiǎn)化,但經(jīng)是一個(gè)等價(jià)關(guān)系,稱為P上的不可分辨關(guān)系,記為ind(P),且有過(guò)屬性約簡(jiǎn)的信息系統(tǒng)還不是一個(gè)最簡(jiǎn)的信息系統(tǒng),它包含著[x]ind(P)=[x]R。RP大量的冗余信息,即在約簡(jiǎn)后的信息系統(tǒng),并不是每一
6、條記錄的U/ind(P)(即等價(jià)關(guān)系ind(P)的所有等價(jià)類)表示與等價(jià)每一個(gè)屬性值都能對(duì)信息系統(tǒng)最后決策規(guī)則的提取產(chǎn)生作用。關(guān)系族P相關(guān)的知識(shí),稱為K中關(guān)于U的P基本知識(shí)(P基本因此,需要進(jìn)一步對(duì)信息系統(tǒng)進(jìn)行處理,得到更簡(jiǎn)化的信息系集)。為簡(jiǎn)單起見,用U/P代替U/ind(P),ind(P)的等價(jià)類稱統(tǒng),就是信息系統(tǒng)的屬性值約簡(jiǎn)(簡(jiǎn)稱值約簡(jiǎn))。值約簡(jiǎn)的過(guò)程為知識(shí)P的基本概念或基本范疇。就是對(duì)每一條記錄中的冗余條件屬性進(jìn)行篩選并刪除的過(guò)程。定義3形式上一個(gè)四元組S=(U,A,V,f)是一個(gè)知識(shí)表達(dá)系統(tǒng),其中U為論域,A為屬性集,V=Va(aA
7、),Va是屬性[3~8]1粗糙集約簡(jiǎn)理論a的值域,f為信息函數(shù):UAV。通常知識(shí)表達(dá)系統(tǒng)也稱為信息系統(tǒng),通常也用S=(U,A)在粗糙集理論中,知識(shí)是用信息系統(tǒng)(即屬性值對(duì)表)來(lái)來(lái)代替S=(U,A,V,f)。表示的。一般情況下,表中的列標(biāo)記不同的屬性;行標(biāo)記論域的知識(shí)表達(dá)系統(tǒng)的數(shù)據(jù)以關(guān)系表的形式給出,關(guān)系表中的每對(duì)象。如果將信息系統(tǒng)中的屬性進(jìn)一步分為條件屬性和決策屬一行對(duì)應(yīng)于要研究的對(duì)象,列則對(duì)應(yīng)于對(duì)象的屬性,對(duì)象的基本性,則稱該信息系統(tǒng)為決策表。知識(shí)約簡(jiǎn)的目的是考察信息系信息是通過(guò)指定對(duì)象的各個(gè)屬性的值來(lái)表達(dá)的。統(tǒng)(或決策表)中給出的知識(shí)是
8、否都是必要的(相對(duì)于決策而容易看出,一個(gè)屬性對(duì)應(yīng)一個(gè)等價(jià)關(guān)系,因此一個(gè)表就可以言)。知識(shí)約簡(jiǎn)是刪除信息系統(tǒng)(或決策表)中冗