資源描述:
《鄰域粗糙集的屬性約簡算法及其在分類器中應(yīng)用》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、分類號:TP391密級:無UDC:681學(xué)校代碼:11065碩士學(xué)位論文鄰域粗糙集的屬性約簡算法及其在分類器中應(yīng)用郭功振指導(dǎo)教師劉遵仁副教授學(xué)科專業(yè)名稱軟件工程論文答辯日期2016年5月28日摘要近幾年,隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,大量企業(yè)開始關(guān)注業(yè)務(wù)所產(chǎn)生的數(shù)據(jù),紛紛建立起自己的數(shù)據(jù)倉庫,收集大量的數(shù)據(jù),以期通過處理這些數(shù)據(jù)獲得決策支持、創(chuàng)造新的價值。但隨著數(shù)據(jù)的不斷累積,信息處理的成本也不斷提升。而且這些數(shù)據(jù)往往還要講究時效性,如果沒有及時獲取數(shù)據(jù)中的價值,那么這些數(shù)據(jù)將會白白浪費大量的資源。因此怎樣從那些
2、累積如海的數(shù)據(jù)中高效獲取知識成為新的研究熱點。鄰域粗糙集既可以省掉繁瑣的離散化處理過程,直接作用于連續(xù)數(shù)據(jù),又能夠處理那些重復(fù)、不確定的數(shù)據(jù)。因此為了獲取更高的效率,本文所有工作將以鄰域粗糙集為基礎(chǔ),從兩個方面進(jìn)行改進(jìn),即降維和分類。因此,本文主要的任務(wù)為:(1)屬性約簡是鄰域粗糙集對數(shù)據(jù)進(jìn)行降維的一種手段。本文將對屬性約簡中最為頻繁和最復(fù)雜的鄰域計算進(jìn)行深入的分析和研究。然后根據(jù)數(shù)學(xué)推導(dǎo)得出的新性質(zhì),提出了改進(jìn)的屬性約簡算法。該算法通過保存當(dāng)前計算結(jié)果并用于下一次的計算,有效減少了鄰域的計算次數(shù)。經(jīng)過實驗驗
3、證,該算法對于提高鄰域計算的效率是有效的。(2)通過對現(xiàn)有的分類算法進(jìn)行研究和分析,提出基于鄰域粗糙集的分類算法。該算法通過逐步添加屬性的方式進(jìn)行迭代判斷類別,在保持與kNN算法同樣準(zhǔn)確率的情況下,大幅度提高了分類算法的速度。關(guān)鍵字:粗糙集;鄰域;屬性約簡;分類;AbstractInrecentyears,withtherapiddevelopmentofInternettechnology,alargenumberofcompaniesbegantofocusonthedatageneratedbytheb
4、usiness.Theyhavesetuptheirowndatawarehousetocollectlargeamountsofdatainordertoobtainadecisionsupportandcreatenewvalue.Butwiththeaccumulationofdata,thecostofinformationprocessingisalsorising.Andthesedataareoftentime-sensitive.Ifyoudonotgetvaluefromthese,alot
5、ofresourceswillbewasted.Sohowtoacquireknowledgeinanefficientwayhasbecomeanewhotspotfromlargeamountsofdata.Neighborhoodroughsetcannotonlyhandleimprecise,inconsistentandincompletedata,butalsohasadirectroleincontinuousdata.Therefore,inordertoobtainhighereffici
6、ency,thispaperwillbebasedonneighborhoodroughsetandtwoaspects,dimensionalityreductionandclassification,willbeimproved.Themaintaskofthispaperisasfollows:1.Intheneighborhoodroughset,attributereductionisawayofdimensionalityreduction.Aparticularanalysisaboutthec
7、omplexoperationofcalculatingtheneighborhoodelementsofeachrecordinneighborhoodroughsetmodelisgiven.Thenthispaperalsodescribeshowtodeduceanewpropertybytheexistingproperties,andusingthenewpropertyimprovestheexistingattributereductionalgorithmtoreducethenumbero
8、fcomputingneighborhoods.Experimentalresultsshowthattheimprovedalgorithmiseffective.2.Throughtheexistingclassificationalgorithmsresearchandanalysis,thisarticlealsodescribesaclassificationalgorithmbasedo