資源描述:
《支持向量機分類算法的若干研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、單位代碼:10293密級:碩士學位論文論文題目:支持向量機分類算法的若干研究學號1011081804姓名吳敏導(dǎo)師張化朋學科專業(yè)應(yīng)用數(shù)學研究方向非線性分析及應(yīng)用申請學位類別理學碩士論文提交日期二零一四年二月萬方數(shù)據(jù)SomeReasearchesontheAlgorithmofSupportVectorMachineClassificationThesisSubmittedtoNanjingUniversityofPostsandTelecommunicationsfortheDegreeofMasterofScienceByWu
2、MinSupervisor:ZhangHua-PengFebruary2014萬方數(shù)據(jù)南京郵電大學學位論文原創(chuàng)性聲明本人聲明所呈交的學位論文是我個人在導(dǎo)師指導(dǎo)下進行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得南京郵電大學或其它教育機構(gòu)的學位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻均已在論文中作了明確的說明并表示了謝意。本人學位論文及涉及相關(guān)資料若有不實,愿意承擔一切相關(guān)的法律責任。研究生簽名:____________
3、_日期:____________南京郵電大學學位論文使用授權(quán)聲明本人授權(quán)南京郵電大學可以保留并向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和電子文檔;允許論文被查閱和借閱;可以將學位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索;可以采用影印、縮印或掃描等復(fù)制手段保存、匯編本學位論文。本文電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相一致。論文的公布(包括刊登)授權(quán)南京郵電大學研究生院辦理。涉密學位論文在解密后適用本授權(quán)書。研究生簽名:____________導(dǎo)師簽名:____________日期:_____________萬方數(shù)據(jù)摘要支持向量機(Su
4、pportVectorMachine,SVM)是在統(tǒng)計學習理論基礎(chǔ)上發(fā)展起來的一種性能優(yōu)良的機器學習方法,它越來越多地被應(yīng)用到數(shù)據(jù)挖掘,模式識別,信號處理等領(lǐng)域中,并取得巨大成功,因此研究支持向量機的性能具有十分重要的意義。影響支持向量機性能的因素有很多,如核函數(shù)的構(gòu)造,噪聲野點的存在,以及數(shù)據(jù)集的類不平衡性等,這些是當前支持向量機研究中的熱點問題。本文針對支持向量機中核函數(shù)的構(gòu)造和模糊支持向量機中隸屬度函數(shù)的修正,以及支持向量機在不平衡數(shù)據(jù)集上的應(yīng)用進行了研究。主要創(chuàng)新工作是:(1)提出了一種基于黎曼幾何的修正核函數(shù)方法。該
5、方法是通過構(gòu)造一個三角形式的保角變換函數(shù),并且用訓練點到分劃超平面的距離來修正核函數(shù)(TrigonometricKernelScaling,TKS)。TKS方法提供了一種新的保角變換函數(shù)形式,從幾何的角度豐富了核函數(shù)的構(gòu)造,實驗表明,該方法能夠有效地提高SVM的分類精度。(2)提出了一種基于距離的隸屬度函數(shù)的修正方法。該方法是通過在模糊支持向量機中根據(jù)不同樣本在不同區(qū)域內(nèi)對分類超平面的重要程度,來對基于距離的隸屬度函數(shù)引入不同的系數(shù)。實驗表明,修正后的基于距離的隸屬度函數(shù)能夠有效地區(qū)分有效樣本和噪聲野點,從而提高SVM的分類性
6、能。(3)提出了欠抽樣和代價敏感支持向量機(CostSensitiveSupportVectorMachine,CS-SVM)相結(jié)合的不平衡數(shù)據(jù)分類算法。該方法首先通過一種新的欠抽樣方法來對不平衡數(shù)據(jù)集進行數(shù)據(jù)預(yù)處理,為了獲得更好的分類效果,然后再用代價敏感支持向量機對預(yù)處理后的數(shù)據(jù)集進行訓練。實驗表明,該算法能夠有效改善SVM在不平衡數(shù)據(jù)集上的分類性能。關(guān)鍵詞:支持向量機,核函數(shù),保角變換,隸屬度函數(shù),不平衡數(shù)據(jù)集I萬方數(shù)據(jù)AbstractSupportVectorMachine(SVM)isamachinelearning
7、methodwithgoodperformance,whichdevelopesbasedonthestatisticallearningtheory,itachievesgreatsuccessinmanydomains,suchasdataming,patternrecognitionandthesignalprocessingetc,soitisofgreatsignificancetoresearchtheperformanceofsupportvectormachine.Therearemanyfactorsthat
8、canaffecttheperformanceofsupportvectormachine,suchastheconstructionofkernelfunction,theexistenceofnoiseandoutliers,andimbalanceddatasetset