資源描述:
《基于核魯棒k-均值的模糊支持向量機算法.pdf》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在行業(yè)資料-天天文庫。
1、第5卷第3期智能計算機與應用Vo1.5No.32015年6月INTELUGENTCOMPUTERANDAPPLICAT【ONSJun.2015基于核魯棒k一均值的模糊支持向量機算法王孝彤。程遠志(哈爾濱工業(yè)大學計算機科學與技術學院。哈爾濱150001)摘要:支持向量機對訓練數(shù)據(jù)中的噪聲敏感,為了解決這一問題,本文提出基于核魯棒k一均值算法的模糊支持向量機算法。算法首先在每類訓練樣本上應用核魯棒k一均值算法,得到每個樣本的模糊隸屬度,將該隸屬度賦予訓練樣本,得到模糊訓練集,然后在模糊訓練集上訓練模糊支持向量機,得到分類決策
2、函數(shù)。實驗表明,對于帶噪聲的訓練樣本,本文的算法能夠為噪聲樣本賦予小的隸屬度,提高分類準確率。關鍵詞:模糊支持向量機;核魯棒k一均值;模糊訓練集;噪聲中圖分類號:TP391.41文獻標識碼:A文章編號:2095—2163(2015)o3—0099—03FuzzySupportVectorMachinebasedonKernelRobustk—-meansWANGXiaotong.CHENGYuanzhi(SchoolofComputerSdenceandTechnology,HarbinInstituteofTechno
3、logy,Harbin150001,China)Abstract:Thesupportvectormachine(SVM)issensitivetonoisesinthetrainingset.Inordertodealwiththisproblem,afuzzysupportvectormachine(FSVM)basedonkernelrobustk—meansisproposedinthispaper.Kernelrobustk—meansisappliedtosamplesofeachclassrespectiv
4、ely,andallsamplesaregivenmembershipdegrees,whichiscombinedwiththeoriginaltrainingsettoyieldafuzzytrainingset.FSVMisthentrainedonthefuzzytrainingsettogetadecisionfunction.Theexperimentresultshowsthatnoisesobtainsmallmembershipdegrees.a(chǎn)ndtheclassificationaccuracyis
5、im.provedwhenthetrainingsetispollutedwithnoises.Keywords:FuzzySupportVectorMachine;KernelRobustk—means;FuzzyTrainingSet;Noise0引言通過為噪聲賦予更小的隸屬度權重,就減少了其對分類決策支持向量機是模式識別和機器學習領域中解決分類問的影響,同時也提高了支持向量機的抗噪性。基于此,如何題¨以及非線性函數(shù)估計問題的一種重要方法。針對二為訓練集設置合理的隸屬度即已隨之而成為模糊支持向量類分類問題,支持向量機
6、在高維特征空間中構建最大化兩類機的一個關鍵研究問題。分類間隔的分類超平面,通過核函數(shù),可以學習非線性支持本文提出了一種基于核魯棒k一均值的模糊支持向量機向量機。算法,對兩類訓練樣本分別應用核魯棒k一均值聚類算法,得分類問題中通常存在一部分輸入訓練樣本的類別標錯到每個樣本的隸屬度,與原始的訓練樣本結合得到模糊訓練的情況,這種錯誤的類別標號稱為錯誤類別噪聲j,簡稱噪樣本集,而后通過模糊支持向量機算法訓練分類器,提高了聲。錯誤類別噪聲經(jīng)常出現(xiàn)在兩類樣本具有相似的特征的支持向量機的抗噪性。時候。由于擬合這些樣本,支持向量機學習的
7、最優(yōu)分類面與1核魯棒k一均值算法不存在錯誤類別噪聲時的最優(yōu)分類面產(chǎn)生偏差,從而降低了1.1魯棒k一均值算法支持向量機的準確性。也就是說,支持向量機的訓練過程對魯棒k一均值算法(Rkmeans)是k一均值算法的推廣。訓練集中的錯誤類別噪聲敏感。給定樣本集合以及聚類數(shù)目C,魯棒k一均值算法尋找c個聚支持向量機對于錯誤類別噪聲的敏感性主要是由于在類,并將每個樣本劃分給一個聚類。與k一均值算法不同的支持向量機理論中,所有的訓練樣本均同等對待J,而支持是,每個樣本對于其所屬聚類均有一個隸屬度,作為其對于向量機的分類決策面則依賴于在
8、訓練集中占少數(shù)的支持向整個類的隸屬度,代表了各樣本隸屬于整個類的程度,其中,量。由于錯誤類別噪聲樣本與其他訓練樣本具有相同的重隸屬度小于給定閾值的樣本即可判定為是噪聲J。要性,但卻更容易被分類器錯分,從而成為支持向量,為了減設樣本集合為D=li=1,2,?,s},其中∈置“,聚類小錯分懲罰,支持向量機將擬合這些樣本,