資源描述:
《基于孿生支持向量機的特征選擇與分類算法研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、代號10701學號1010120913分類號TP181密級公開題(中、英文)目基于孿生支持向量機的特征選擇與分類算法研究ResearchonFeatureSelectionandClassificationMethodsAlgorithmResearchUsingTwinSupportVectorMachine作者姓名封瑞指導教師姓名、職務姬紅兵教授學科門類工學學科、專業(yè)信號與信息處理提交論文日期二○一三年一月摘要I摘要孿生支持向量機(TWSVM)摒棄了傳統(tǒng)SVM平行約束的條件,通過求解兩個形如SVM的二次規(guī)劃問題來獲得分類模型,可以將訓練時間縮短到原SVM的1/4。然而,原始TWSVM并
2、沒有考慮到數(shù)據(jù)的分布信息,對于一些分布復雜的數(shù)據(jù),TWSVM就不能進行有效的分類識別。針對此問題,本文從流形學習和聚類兩方面進行討論,對TWSVM進行改進。首先,從流形學習進行考慮,通過將數(shù)據(jù)的流形結構引入至分類目標函數(shù)中,提出基于流形結構的TWSVM(MTSVM)分類算法,其主旨是假設所處理的數(shù)據(jù)采樣于一個潛在的流形上,通過建立類內散度矩陣,獲得數(shù)據(jù)內部的流形結構,并將其引入到目標函數(shù)中,使得類內鄰近樣本之間的距離最小化,不同類樣本之間的間隔最大化。進一步,為了提高其計算速度,提出基于流形結構的最小二乘TWSVM(LS-MTSVM)算法。其次,我們通過采用聚類技術,提出基于聚類結構的TW
3、SVM(STSVM)分類算法,其通過對數(shù)據(jù)在類內進行聚類,將獲得的結構信息以協(xié)方差矩陣的形式引入到分類算法的目標函數(shù)中,在保證各類數(shù)據(jù)都盡量圍繞在其分類面周圍的同時,使得同一類內數(shù)據(jù)分布更加緊湊。進一步,為了提高其計算速度,提出基于聚類結構的最小二乘TWSVM算法。此外,對于STSVM在處理非均衡數(shù)據(jù)時存在的問題對其進行改進,提出非對稱型STSVM(AS-STSVM)算法。最后,在STSVM的基礎上,構造了基于STSVM的特征選擇算法(LP-STSVM),該分類器只需求解一個線性規(guī)劃,在保證得到與STSVM相當?shù)姆诸愋阅芤约拜^快的計算速度上,此方式還減少了輸入空間的特征數(shù),對于非線性問題,
4、其可以減少核函數(shù)數(shù)目。通過在機器學習標準數(shù)據(jù)集、圖像數(shù)據(jù)和雷達輻射源數(shù)據(jù)上的實驗驗證了本文所提方法的有效性以及在工程應用中的潛在價值。關鍵詞:孿生支持向量機流形學習聚類最小二乘孿生支持向量機特征選擇AbstractIIIAbstractTwinsupportvectormachine(TWSVM)removestheconstraintsoftheparallelseparatinghyperplaneoftraditionalSVM.ItdeterminesthetwononparallelhyperplanesbysolvingtworelatedSVM-typeproblems,su
5、chthatitscomputingcostinthetrainingstageis1/4ofstandardSVM.However,TWSVMdoesnottakeintoconsiderationoftheinformationofdatadistribution.Forsomedatawithcomplexlydistribution,TWSVMcannotmakeeffectiveclassification.Therefore,manifoldlearningandclusteringtechnologyareintroducedinthisthesistoimprovethep
6、erformanceofTWSVM.Firstly,amanifoldstructure-basedTwinSVM(MTSVM)isproposed,whichtakethemanifoldstructureofdataintotheobjectfunctionofTwinSVMfromtheperspectiveofmanifoldlearning.Itassumesthatthedataneedtobeprocessedaresampledfromapotentialmanifoldandobtainstheinnermanifoldstructureofdatabyestablish
7、ingwithin-classscattermatrix.Itthenintroducesthestructureinformationintotheobjectfunctiontominimizethedistancesbetweentheadjacentwithin-classsampleswhilemaximizingthemarginsbetweensamplesfromdifferentclasses.Furt