資源描述:
《淺議基于加權(quán)度量支持向量機(jī)下的分類算法研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、中山大學(xué)碩士學(xué)位論文基于加權(quán)度量支持向量機(jī)下的分類算法研究姓名:梅芳申請學(xué)位級別:碩士專業(yè):計(jì)算機(jī)軟件與理論指導(dǎo)教師:印鑒20060606基于加權(quán)度量支持向量機(jī)下的分類算法研究論文題目:基于加權(quán)度量支持向量機(jī)下的分類算法研究專業(yè):計(jì)算機(jī)軟件與理論碩士生:梅芳指導(dǎo)教師:印鑒教授摘要支持向量機(jī)(SVM)在分類算法原理中基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化的優(yōu)越性使得其應(yīng)用領(lǐng)域越來越廣泛。其順次最小優(yōu)化算法(sMO)比傳統(tǒng)的塊算法和固定工作樣本集的迭代優(yōu)化算法具有更好的時(shí)間復(fù)雜性和空間復(fù)雜性。雖然SVM是專門針對有限樣本發(fā)展起來且不依賴對所解問題先驗(yàn)知識的分類算法,但是在實(shí)
2、際應(yīng)用領(lǐng)域中往往對樣本的需求量仍然很大。目前已有研究證明在一些應(yīng)用領(lǐng)域中專家知識在理論上可以代替樣本不足的問題。本文提出了引入先驗(yàn)知識的支持向量機(jī)模型即加權(quán)度量支持向量機(jī)WM-SVM(WeightedMarginSVM),通過對訓(xùn)練樣本引入先驗(yàn)信息量而減少所需的樣本數(shù)量,同時(shí)提出了相應(yīng)的WM-SMO算法,基于LIBSVM2.6和c++語言編寫實(shí)驗(yàn)程序并應(yīng)用于中醫(yī)證候分類。實(shí)驗(yàn)數(shù)據(jù)來自廣東省中醫(yī)藥管理局資助課題“中醫(yī)證候信息數(shù)據(jù)庫系統(tǒng)的設(shè)計(jì)與開發(fā)”中的中醫(yī)證候數(shù)據(jù)庫。首先通過專家所提供的中醫(yī)證候?qū)<抑R規(guī)則對訓(xùn)練樣本集進(jìn)行置信度的計(jì)算,然后使用WM—S
3、MO算法訓(xùn)練wM.SVM并測試。實(shí)驗(yàn)結(jié)果表明WM—SMO是~種對SVM在具體應(yīng)用問題下更有效的算法,它能把應(yīng)用背景中的先驗(yàn)知識與t『『f練樣本中的信息量很好地結(jié)合起來,在中醫(yī)證候分類有專家知識的情況下,分類的正確率比原有SVM有較大的提高。關(guān)鍵詞:分類,支持向量機(jī),中醫(yī)證候。先驗(yàn)知識,WM-SVM,WM—SMO基于加權(quán)度量支持向量機(jī)下的分類算法研究Title:TheResearchofClassificationAlgoriflmaontheWeighted-MarginSVMMajor:ComputerSoftwareandTheoryName:M
4、eiFangSupervisor:YinJianProfessorABSTRACTSupportVectorMachines(SVM)hasbeensuccessfullyappliedinmanyreal—worldapplications.SequenceMinimumOptimization(SMO)algorithmhaslesscomplexityoftimeandspacecomparedwithtraditionalblockalgorithmandfixativesamplecollectionalgorithm,SVMisfocus
5、edonthelimitedsampleandindependentofpriorknowledge,however,thesampleneededinrealapplicationfieldisstillverylarge.Insomeapplications,theremightbehumanknowledge,availablethat,inprinciple,couldcompensateforthelackofdata.ThispaperproposesamethodWM-SVMthatcanreducethedemandingquanti
6、tyofsamplesbyintroducingtheinformationofpriorknowledgeintothesamples,meanwhile#vestherelatedalgorithmnamedWM-SMO.Ourexperimentdatasetcomesfromthesoftware—developingproject:/nformationManagementSystemofTCMSyndrome,fundedbytheGuangdongBureauofTraditionalChineseMedicine(TCM)Admini
7、stration.Afterformingtherulesfromexpertknowledge,weatfirstcalculatetheconfidencevaluesofeachsample,andthenusethesamplesettotrainWM—SVMbyusingWM—SMOalgorithm,whichisapriorknowledgebasedimprovedversionoutofthetraditionalones./ntheapplicationofChineseMedicineSyndromeclassification
8、,weuseLIBSVM2.6andC++inprogrammingimplement.puttingthe