資源描述:
《基于核魯棒k-均值的模糊支持向量機算法.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、第5卷第3期智能計算機與應(yīng)用Vo1.5No.32015年6月INTELUGENTCOMPUTERANDAPPLICAT【ONSJun.2015基于核魯棒k一均值的模糊支持向量機算法王孝彤。程遠志(哈爾濱工業(yè)大學(xué)計算機科學(xué)與技術(shù)學(xué)院。哈爾濱150001)摘要:支持向量機對訓(xùn)練數(shù)據(jù)中的噪聲敏感,為了解決這一問題,本文提出基于核魯棒k一均值算法的模糊支持向量機算法。算法首先在每類訓(xùn)練樣本上應(yīng)用核魯棒k一均值算法,得到每個樣本的模糊隸屬度,將該隸屬度賦予訓(xùn)練樣本,得到模糊訓(xùn)練集,然后在模糊訓(xùn)練集上訓(xùn)練模糊支持向量機,得到分類決策
2、函數(shù)。實驗表明,對于帶噪聲的訓(xùn)練樣本,本文的算法能夠為噪聲樣本賦予小的隸屬度,提高分類準確率。關(guān)鍵詞:模糊支持向量機;核魯棒k一均值;模糊訓(xùn)練集;噪聲中圖分類號:TP391.41文獻標識碼:A文章編號:2095—2163(2015)o3—0099—03FuzzySupportVectorMachinebasedonKernelRobustk—-meansWANGXiaotong.CHENGYuanzhi(SchoolofComputerSdenceandTechnology,HarbinInstituteofTechno
3、logy,Harbin150001,China)Abstract:Thesupportvectormachine(SVM)issensitivetonoisesinthetrainingset.Inordertodealwiththisproblem,afuzzysupportvectormachine(FSVM)basedonkernelrobustk—meansisproposedinthispaper.Kernelrobustk—meansisappliedtosamplesofeachclassrespectiv
4、ely,andallsamplesaregivenmembershipdegrees,whichiscombinedwiththeoriginaltrainingsettoyieldafuzzytrainingset.FSVMisthentrainedonthefuzzytrainingsettogetadecisionfunction.Theexperimentresultshowsthatnoisesobtainsmallmembershipdegrees.a(chǎn)ndtheclassificationaccuracyis
5、im.provedwhenthetrainingsetispollutedwithnoises.Keywords:FuzzySupportVectorMachine;KernelRobustk—means;FuzzyTrainingSet;Noise0引言通過為噪聲賦予更小的隸屬度權(quán)重,就減少了其對分類決策支持向量機是模式識別和機器學(xué)習(xí)領(lǐng)域中解決分類問的影響,同時也提高了支持向量機的抗噪性。基于此,如何題¨以及非線性函數(shù)估計問題的一種重要方法。針對二為訓(xùn)練集設(shè)置合理的隸屬度即已隨之而成為模糊支持向量類分類問題,支持向量機
6、在高維特征空間中構(gòu)建最大化兩類機的一個關(guān)鍵研究問題。分類間隔的分類超平面,通過核函數(shù),可以學(xué)習(xí)非線性支持本文提出了一種基于核魯棒k一均值的模糊支持向量機向量機。算法,對兩類訓(xùn)練樣本分別應(yīng)用核魯棒k一均值聚類算法,得分類問題中通常存在一部分輸入訓(xùn)練樣本的類別標錯到每個樣本的隸屬度,與原始的訓(xùn)練樣本結(jié)合得到模糊訓(xùn)練的情況,這種錯誤的類別標號稱為錯誤類別噪聲j,簡稱噪樣本集,而后通過模糊支持向量機算法訓(xùn)練分類器,提高了聲。錯誤類別噪聲經(jīng)常出現(xiàn)在兩類樣本具有相似的特征的支持向量機的抗噪性。時候。由于擬合這些樣本,支持向量機學(xué)習(xí)的
7、最優(yōu)分類面與1核魯棒k一均值算法不存在錯誤類別噪聲時的最優(yōu)分類面產(chǎn)生偏差,從而降低了1.1魯棒k一均值算法支持向量機的準確性。也就是說,支持向量機的訓(xùn)練過程對魯棒k一均值算法(Rkmeans)是k一均值算法的推廣。訓(xùn)練集中的錯誤類別噪聲敏感。給定樣本集合以及聚類數(shù)目C,魯棒k一均值算法尋找c個聚支持向量機對于錯誤類別噪聲的敏感性主要是由于在類,并將每個樣本劃分給一個聚類。與k一均值算法不同的支持向量機理論中,所有的訓(xùn)練樣本均同等對待J,而支持是,每個樣本對于其所屬聚類均有一個隸屬度,作為其對于向量機的分類決策面則依賴于在
8、訓(xùn)練集中占少數(shù)的支持向整個類的隸屬度,代表了各樣本隸屬于整個類的程度,其中,量。由于錯誤類別噪聲樣本與其他訓(xùn)練樣本具有相同的重隸屬度小于給定閾值的樣本即可判定為是噪聲J。要性,但卻更容易被分類器錯分,從而成為支持向量,為了減設(shè)樣本集合為D=li=1,2,?,s},其中∈置“,聚類小錯分懲罰,支持向量機將擬合這些樣本,