資源描述:
《變精度粗糙集擴展模型及屬性約簡算法研究》由會員上傳分享,免費在線閱讀,更多相關內容在教育資源-天天文庫。
1、變精度粗糙集擴展模型及屬性約簡算法研究ResearchonExtendedVariablePrecisionRoughSetModelanditsAttributeReductionAlgorithm姓名胡文君學科專業(yè)研究方向指導教師完成時間計算機軟件與理論粗糙集理論及應用鄒海2008年5月獨創(chuàng)性聲明本人聲明所呈交的學位論文是本人在導師指導下進行的研究工作及取得的研究成果。據我所知,除了文中特別加以標注和致謝的地方外,論文中不包含其他人已經發(fā)表或撰寫過的研究成果,也不包含為獲得或其他教育機構的學位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻均已在論文中作了
2、明確的說明并表示謝意。學位論文作者簽名:胡文君簽字日期:年月日學位論文版權使用授權書本學位論文作者完全了解有關保留、使用學位論文的規(guī)定,有權保留并向國家有關部門或機構送交論文的復印件和磁盤,允許論文被查閱和借閱。本人授權可以將學位論文的全部或部分內容編入有關數(shù)據庫進行檢索,可以采用影印、縮印或掃描等復制手段保存、匯編學位論文。(保密的學位論文在解密后適用本授權書)學位論文作者簽名:胡文君導師簽名:簽字日期:年月日簽字日期:年月日學位論文作者畢業(yè)去向:工作單位:通訊地址:電話:郵編:摘要摘要經典粗糙集模型分類要求嚴格按等價關系進行,不存在某種程度上的包含
3、關系,在實際應用中,缺乏對噪聲數(shù)據的適應能力。為了克服這個缺點,W.ziarko提出一種變精度的粗糙集模型,引入了變精度β因子,允許上近似集和下近似集存在一定的分類誤差,對噪音數(shù)據具有一定的容錯能力,更加符合實際應用的需要。自引入變精度粗糙集模型以來,粗糙集理論的實際應用得到了較快的發(fā)展,變精度粗糙集模型是對經典粗糙集理論的擴展。變精度粗糙集模型雖然可以提高粗糙集模型的抗噪聲能力,但是并沒有考慮到每個對象的重要性問題。通常粗糙集模型在對決策信息系統(tǒng)進行數(shù)據預處理后,往往是把相同的規(guī)則直接合并成一個規(guī)則,對不同對象的重要性問題未加考慮。而在現(xiàn)實生活中,決策信息系統(tǒng)中一個規(guī)則僅出現(xiàn)一次
4、或出現(xiàn)多次意義可能是完全不同的。因此,為了能更加適用于實際生活中的數(shù)據,在變精度粗糙集理論研究的基礎上,引入對象重要性的概念,改進變精度粗糙集模型,并對基于改進后模型的屬性約簡算法進行深入研究。本文的主要工作如下:(1)在對經典粗糙集及變精度粗糙集模型進行研究的基礎上構建了一種基于對象重要性的變精度粗糙集模型(OI-VPRS),對變精度粗糙集模型的分類錯誤率、包含度、近似空間及屬性約簡進行了重定義,并給出該模型的一些性質和定理,經典粗糙集模型和變精度粗糙集模型可視為該模型的一個特例。通過對某決策表分別采用經典粗糙集模型、變精度粗糙集模型和OI-VPRS模型進行計算,結果表明:在相同
5、的分類誤差水平上,該模型在分類質量和抗噪音能力方面都較前兩個模型有所提高,該模型不僅具有容錯性,并較好地體現(xiàn)了決策表中每個對象的重要程度,能合理地對現(xiàn)實數(shù)據進行解釋。(2)對OI-VPRS模型下的屬性約簡算法進行深入研究。首先,在對經典粗糙集模型下基于屬性依賴度的約簡算法進行研究的基礎上,提出了OI-VPRS模型下的基于屬性依賴度的約簡算法。算法采用了OI-VPRS模型下屬性依賴度的計算方法,并且為了得到更簡化的結果,引入了依賴度誤差因子ε。UCI實驗結果表明,當數(shù)據集中各對象的重要性均勻分布時,能夠得到與變精度模型相近的-I-變精度粗糙集擴展模型及屬性約簡算法研究約簡結果和近似分
6、類質量。當數(shù)據集中對象重要性存在較大的差異時,基于OI-VPRS算法結果比變精度模型約簡結果更加簡化,同時分類質量也較變精度粗糙集模型有所提高。其次詳細分析了分類誤差因子β和依賴度誤差因子ε的取值對約簡的影響,實驗結果表明β取值增大,決策表的近似分類質量增大,得到的約簡集中屬性個數(shù)減少,ε取值越大,得到的約簡越簡化,算法運行時間也越短。(3)胡可云算法研究表明利用屬性頻率求屬性重要性的計算量要優(yōu)于利用屬性依賴度求屬性重要性的計算量,因此,提出一種將屬性頻率和對象重要性作為啟發(fā)信息的約簡算法。算法首先計算決策表的可辨識矩陣,利用可辨識矩陣中屬性出現(xiàn)頻率和屬性所區(qū)分的對象的權值重新定義
7、了屬性重要性函數(shù),并且在每添加一個屬性到約簡集后,都將可辨識矩陣中含有該屬性的項刪除,避免了屬性計算的重復性。該算法采用貪心的思想能夠保證找到一個約簡,并且時間復雜度較基于屬性依賴度算法的時間復雜度低。實驗結果表明,當對象和屬性個數(shù)較大時,該算法的運行時間要明顯優(yōu)于基于屬性依賴度的算法運行時間。關鍵詞:粗糙集,變精度粗糙集,可辨識矩陣,對象重要性,屬性約簡IIAbstractAbstractTheClassificationisstrictlydealedwithun