資源描述:
《基于支持向量機(jī)的若干分類(lèi)問(wèn)題研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、摘要分類(lèi)問(wèn)題是實(shí)際應(yīng)用中普遍存在的問(wèn)題,也是機(jī)器學(xué)習(xí)領(lǐng)域的基礎(chǔ)研究之一,快速發(fā)展的信息技術(shù)對(duì)其在理論研究和實(shí)際應(yīng)用中提出了許多新的難題和挑戰(zhàn)。支持向量機(jī)(SupportVectorMachine,SVM)是基于統(tǒng)計(jì)學(xué)習(xí)理論,借助最優(yōu)化方法來(lái)解決機(jī)器學(xué)習(xí)問(wèn)題的有力工具,目前,已表現(xiàn)出很多優(yōu)于已有方法的性能。本文以深入探討分類(lèi)問(wèn)題為研究目標(biāo),立足于對(duì)支持向量分類(lèi)機(jī)的理論模型和在實(shí)際中的應(yīng)用進(jìn)行完善、推廣和創(chuàng)新。論文的主要內(nèi)容包括以下幾個(gè)方面:1.對(duì)本文采用的基礎(chǔ)理論進(jìn)行了介紹。主要包括機(jī)器學(xué)習(xí)的主要問(wèn)題,統(tǒng)計(jì)學(xué)習(xí)理論的基本內(nèi)容,以及支持向量機(jī)的基本思想和研究現(xiàn)狀。2.從特征空間的幾何結(jié)構(gòu)
2、入手,對(duì)核函數(shù)所蘊(yùn)含的黎曼度量、距離度量和角度度量進(jìn)行詳細(xì)分析,在此基礎(chǔ)上深入探討高斯徑向基核函數(shù)的幾何性質(zhì),并分析了映射、核與度量之間的關(guān)系,說(shuō)明支持向量機(jī)算法的解本質(zhì)上依賴(lài)于度量。3.提出一種新的解決類(lèi)不平衡與代價(jià)敏感分類(lèi)問(wèn)題的方法。支持向量機(jī)通過(guò)核函數(shù),將數(shù)據(jù)嵌入到高維特征空間的一個(gè)低維流形表面,利用微分幾何中流形表面誘導(dǎo)的黎曼度量,在半徑間隔界的控制下,通過(guò)保角映射,放大類(lèi)不平衡問(wèn)題中少樣本類(lèi)與分界面之間的間隔,從而在保證多數(shù)類(lèi)準(zhǔn)確率較高的前提下,達(dá)到提高少數(shù)類(lèi)的分類(lèi)準(zhǔn)確率,有效的減少了支持向量機(jī)在類(lèi)不平衡問(wèn)題中的有偏性。4.對(duì)1.v.r方法中子分類(lèi)器采用不同核參數(shù)時(shí),各決策
3、輸出值的可比性進(jìn)行了深入分析,說(shuō)明此時(shí)將各子分類(lèi)問(wèn)題映射到不同的特征空間,其決策輸出值仍具有可比性,且能提高總體分類(lèi)的性能。5.對(duì)分解多分類(lèi)方法中存在的不可分現(xiàn)象進(jìn)行了研究,針對(duì)一些實(shí)際應(yīng)用問(wèn)題,提出一種基于決策間隔的模糊輸出支持向量機(jī)算法,該方法可以更為有效地解決不可分問(wèn)題。6.從VC維的角度比較了有序與無(wú)序分類(lèi)問(wèn)題的復(fù)雜度,說(shuō)明線性分類(lèi)器的VC維與其分級(jí)維相同;結(jié)合支持向量機(jī)技術(shù)提出一種改進(jìn)的內(nèi)嵌空間算法,并在實(shí)際有序分類(lèi)問(wèn)題——企業(yè)信用風(fēng)險(xiǎn)評(píng)估問(wèn)題中驗(yàn)證了該方法的有效性。最后,對(duì)本文的工作進(jìn)行了總結(jié),并對(duì)今后的研究工作提出了展望。關(guān)鍵詞:分類(lèi)問(wèn)題;統(tǒng)計(jì)學(xué)習(xí)理論;支持向量機(jī)Abs
4、tractClassificationproblemisacommonprobleminpracticalapplications,aswellasabasicresearchtopicinmachine-learningdomain.Itfacesmanynewpuzzlesandchallengesbothintheoreticalresearchandinpracticalapplicationsontherapidlydevelopinginformationtechnique.SupportVectorMachine(SVM)isanewlydevelopedmachine
5、learningmethodbasedonthefoundationoftheStatisticalLearningTheory(SLT)andtheoptimizationtheory.Now,SVMhasalreadyshownexcellentlearningperformanceinmanyfields.Thisthesisfocuses011theclassificationproblem,particularlyconcernsoftheresearchesonthetheoreticalmodelaswellasthepracticalapplicationsofSVM
6、.Themainworksofthisthesisarcasthefollowing:1.Thebasictheoriesusedinthisthesiswereintroduced,includingthemainproblemsandmethodsinMachineLearning,StatisticalLearningTheoryandSupportVectorMachines;then,someoftherecentresearchesonSVMwerealsoreviewed.2.Fromtheviewpointofgeometricstructureofthefeatur
7、espace,somemetrics(Riemannianmetric,distancemetric,andanglemetric)inducedbythekernelfunctionarcanalyzed;thegeometriccharacterofGaussianRadiusBasiskernelisdiscussedindetail;therelationsamongthemapping,thekernelandthemetricarealsoan