資源描述:
《支持向量機(jī)分類算法的若干研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、單位代碼:10293密級(jí):碩士學(xué)位論文論文題目:支持向量機(jī)分類算法的若干研究學(xué)號(hào)1011081804姓名吳敏導(dǎo)師張化朋學(xué)科專業(yè)應(yīng)用數(shù)學(xué)研究方向非線性分析及應(yīng)用申請(qǐng)學(xué)位類別理學(xué)碩士論文提交日期二零一四年二月萬方數(shù)據(jù)SomeReasearchesontheAlgorithmofSupportVectorMachineClassificationThesisSubmittedtoNanjingUniversityofPostsandTelecommunicationsfortheDegreeofMasterofScienceByWu
2、MinSupervisor:ZhangHua-PengFebruary2014萬方數(shù)據(jù)南京郵電大學(xué)學(xué)位論文原創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是我個(gè)人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得南京郵電大學(xué)或其它教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對(duì)本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說明并表示了謝意。本人學(xué)位論文及涉及相關(guān)資料若有不實(shí),愿意承擔(dān)一切相關(guān)的法律責(zé)任。研究生簽名:____________
3、_日期:____________南京郵電大學(xué)學(xué)位論文使用授權(quán)聲明本人授權(quán)南京郵電大學(xué)可以保留并向國(guó)家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子文檔;允許論文被查閱和借閱;可以將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索;可以采用影印、縮印或掃描等復(fù)制手段保存、匯編本學(xué)位論文。本文電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相一致。論文的公布(包括刊登)授權(quán)南京郵電大學(xué)研究生院辦理。涉密學(xué)位論文在解密后適用本授權(quán)書。研究生簽名:____________導(dǎo)師簽名:____________日期:_____________萬方數(shù)據(jù)摘要支持向量機(jī)(Su
4、pportVectorMachine,SVM)是在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上發(fā)展起來的一種性能優(yōu)良的機(jī)器學(xué)習(xí)方法,它越來越多地被應(yīng)用到數(shù)據(jù)挖掘,模式識(shí)別,信號(hào)處理等領(lǐng)域中,并取得巨大成功,因此研究支持向量機(jī)的性能具有十分重要的意義。影響支持向量機(jī)性能的因素有很多,如核函數(shù)的構(gòu)造,噪聲野點(diǎn)的存在,以及數(shù)據(jù)集的類不平衡性等,這些是當(dāng)前支持向量機(jī)研究中的熱點(diǎn)問題。本文針對(duì)支持向量機(jī)中核函數(shù)的構(gòu)造和模糊支持向量機(jī)中隸屬度函數(shù)的修正,以及支持向量機(jī)在不平衡數(shù)據(jù)集上的應(yīng)用進(jìn)行了研究。主要?jiǎng)?chuàng)新工作是:(1)提出了一種基于黎曼幾何的修正核函數(shù)方法。該
5、方法是通過構(gòu)造一個(gè)三角形式的保角變換函數(shù),并且用訓(xùn)練點(diǎn)到分劃超平面的距離來修正核函數(shù)(TrigonometricKernelScaling,TKS)。TKS方法提供了一種新的保角變換函數(shù)形式,從幾何的角度豐富了核函數(shù)的構(gòu)造,實(shí)驗(yàn)表明,該方法能夠有效地提高SVM的分類精度。(2)提出了一種基于距離的隸屬度函數(shù)的修正方法。該方法是通過在模糊支持向量機(jī)中根據(jù)不同樣本在不同區(qū)域內(nèi)對(duì)分類超平面的重要程度,來對(duì)基于距離的隸屬度函數(shù)引入不同的系數(shù)。實(shí)驗(yàn)表明,修正后的基于距離的隸屬度函數(shù)能夠有效地區(qū)分有效樣本和噪聲野點(diǎn),從而提高SVM的分類性
6、能。(3)提出了欠抽樣和代價(jià)敏感支持向量機(jī)(CostSensitiveSupportVectorMachine,CS-SVM)相結(jié)合的不平衡數(shù)據(jù)分類算法。該方法首先通過一種新的欠抽樣方法來對(duì)不平衡數(shù)據(jù)集進(jìn)行數(shù)據(jù)預(yù)處理,為了獲得更好的分類效果,然后再用代價(jià)敏感支持向量機(jī)對(duì)預(yù)處理后的數(shù)據(jù)集進(jìn)行訓(xùn)練。實(shí)驗(yàn)表明,該算法能夠有效改善SVM在不平衡數(shù)據(jù)集上的分類性能。關(guān)鍵詞:支持向量機(jī),核函數(shù),保角變換,隸屬度函數(shù),不平衡數(shù)據(jù)集I萬方數(shù)據(jù)AbstractSupportVectorMachine(SVM)isamachinelearning
7、methodwithgoodperformance,whichdevelopesbasedonthestatisticallearningtheory,itachievesgreatsuccessinmanydomains,suchasdataming,patternrecognitionandthesignalprocessingetc,soitisofgreatsignificancetoresearchtheperformanceofsupportvectormachine.Therearemanyfactorsthat
8、canaffecttheperformanceofsupportvectormachine,suchastheconstructionofkernelfunction,theexistenceofnoiseandoutliers,andimbalanceddatasetset