資源描述:
《基于鄰域粗糙集和蟻群優(yōu)化的屬性約簡算法》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、第32卷第5期河北科技大學(xué)學(xué)報(bào)Vo1.32,No.52011年1O月JournalofHebeiUniversityofScienceandTechnology0ct.20l1文章編號:1008—1542(2011)05~0403—06基于鄰域粗糙集和蟻群優(yōu)化的屬性約簡算法張冬雯,王鵬,仇計(jì)清(1.河北科技大學(xué)理學(xué)院,河北石家莊050018;2.河北科技大學(xué)信息科學(xué)與工程學(xué)院,河北石家莊050018)摘要:在分析單一、給定的鄰域大小設(shè)定方法弊端的基礎(chǔ)上,提出了基于屬性數(shù)據(jù)標(biāo)準(zhǔn)差的閾值設(shè)定方法,并將蟻群優(yōu)化算法引入到屬性約
2、簡中,以屬性重要度為啟發(fā)信息,構(gòu)造了基于鄰域粗糙集和蟻群優(yōu)化的屬性約簡算法,使用了4個(gè)UCI數(shù)據(jù)集進(jìn)行約簡。實(shí)驗(yàn)結(jié)果表明,提出的算法在約簡的分類精度和約簡中屬性個(gè)數(shù)方面具有更好的性能。關(guān)鍵詞:鄰域粗糙集;蟻群優(yōu)化;屬性約簡;標(biāo)準(zhǔn)差中圖分類號:O231文獻(xiàn)標(biāo)志碼:AApproachtOfeatureselectionbasedonneighborhoodroughsetandantcolonyoptimizationZHANGDong—wen,WANGPeng,QIUJi—qing(1.CollegeofSciences,
3、HebeiUniversityofScienceandTechnology,ShijiazhuangHebei050018,China;2.CollegeofInforma—tionScienceandEngineering,HebeiUniversityofScienceandTechnology,ShijiazhuangHebei050018,China)Abstract:Thispaperanalysestheweaknessofsettingasingle,specifiedthresholdforthesize
4、ofneighborhood,andthenputsforwardanewneighborhoodsettingmethodbasedonthestandarddeviationoffeaturedata.Thepaperintroducesantcolongopbimization(ACO)intofeatureselectionandproposesanapprovedfeatureselectionalgorithmbasedonNRSandACO,inwhichthefeatureimportanceistake
5、nastheheuristicinformation.InordertOevaluatetheperformanceoftheproposedalgo—rithm,fourdatasetsfromUCIareusedandtheexperimentalresultsshowthattheproposedalgorithmhasabetterperformanceinclassificationaccuracyofreduetandfeaturenumberinreduct.Keywords:neighborhoodrou
6、ghset;antcolonyoptimization;featureselection;standarddeviation屬性約簡的目的是在不降低預(yù)測分類精度的前提下對數(shù)據(jù)的屬性集合進(jìn)行約簡,摒棄冗余的屬性,從而降低對數(shù)據(jù)處理時(shí)的時(shí)間和空間復(fù)雜度[1]。所有的屬性約簡算法都包括2個(gè)重要的部分:評價(jià)函數(shù)和子集生成器。評價(jià)函數(shù)是對屬性子集的分辨能力的一種量度,它能夠?qū)傩宰蛹念A(yù)測分類精度進(jìn)行評估;子集生成器是使用評價(jià)函數(shù)對屬性集合進(jìn)行約簡,得到最優(yōu)屬性子集的過程。作為一個(gè)重要的粒度計(jì)算工具,粗糙集理論(RST)l_2被廣
7、泛應(yīng)用于屬性約簡的算法中[a-sJ。然而,粗糙集理論使用等價(jià)關(guān)系和等價(jià)類的概念對整個(gè)論域進(jìn)行劃分,這只適用于處理離散型屬性的數(shù)據(jù)。對于現(xiàn)實(shí)應(yīng)用中的大量數(shù)據(jù),往往同時(shí)存在離散型和連續(xù)型2種屬性。對于連續(xù)型屬性,應(yīng)用粗糙集理論就必須首先對這些屬性進(jìn)行離散化,顯然,對連續(xù)型屬性進(jìn)行離散化必然會帶來數(shù)據(jù)信息的丟失。文獻(xiàn)[61提出了基于鄰域的粗糙集(NRS)模型來對連續(xù)型屬性進(jìn)行約簡的算法。該算法使用鄰域關(guān)系對論域進(jìn)行劃分,然后使用這種由鄰域關(guān)系形成的粒子族來對決收稿日期:2010—12-26;修回日期:2011-06—08;責(zé)任
8、編輯:張軍基金項(xiàng)目:國家自然科學(xué)基金資助項(xiàng)目(60874003)作者簡介:張冬雯(1964一),女,河北石家莊人,教授,博士,主要從事優(yōu)化、預(yù)測控制方面的研究。404河北科技大學(xué)學(xué)報(bào)策屬性進(jìn)行逼近,從而提出了鄰域決策表模型,并基于此模型構(gòu)造了連續(xù)型屬性的屬性約簡算法。作為該模型的一個(gè)重要參數(shù),鄰域的大小對屬性約簡的結(jié)