基于svm的分類挖掘算法及其應用

基于svm的分類挖掘算法及其應用

ID:33407903

大小:1.80 MB

頁數(shù):56頁

時間:2019-02-25

基于svm的分類挖掘算法及其應用_第1頁
基于svm的分類挖掘算法及其應用_第2頁
基于svm的分類挖掘算法及其應用_第3頁
基于svm的分類挖掘算法及其應用_第4頁
基于svm的分類挖掘算法及其應用_第5頁
資源描述:

《基于svm的分類挖掘算法及其應用》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫

1、大慶石油學院碩士學位論文基于SVM的分類挖掘算法及其應用姓名:張興旺申請學位級別:碩士專業(yè):計算機應用技術指導教師:司光宇20070312基于SVM的分類挖掘算法及其應用摘要隨著數(shù)據(jù)庫技術的應用越來越普及,各行各業(yè)在經(jīng)營過程中收集了大量的業(yè)務數(shù)據(jù),在這大量的數(shù)據(jù)中蘊藏著豐富的信息,如何挖掘出這些信息使其成為有用的知識,指導企業(yè)的經(jīng)營決策,已經(jīng)成為一個迫切需要解決的問題,數(shù)據(jù)挖掘技術在這種背景下應運而生。數(shù)據(jù)挖掘是在數(shù)據(jù)庫中發(fā)現(xiàn)有用的、潛在的、最終可理解的模式的非平凡過程。分類是其中一種最常用的數(shù)據(jù)挖掘任務。支持向量機(S

2、VM)作為一種新興的基于統(tǒng)計學習理論的分類算法,以其堅實的理論基礎,巧妙的算法實現(xiàn)和突出的卓越性能脫穎而出。與其它分類算法相比,SVM方法具有全局最優(yōu)、結構簡單、推廣能力強等優(yōu)點,目前在很多領域獲得了相對其它分類方法的最優(yōu)的性能。鑒于此,結合參與自來水公司數(shù)據(jù)挖掘項目中遇到的問題,對基于SVM的分類算法在數(shù)據(jù)挖掘中的應用進行了研究。本文首先討論了數(shù)據(jù)挖掘的基本概念,挖掘任務以及挖掘的基本過程,并比較分析了幾種常用的分類挖掘算法及其優(yōu)缺點并簡單介紹了評估分類模型的幾種方法。然后詳細闡述了統(tǒng)計學習理論及結構風險最小化原則,基

3、于最大間隔分類超平面對SVM算法進行了理論推導,并分析了SVM作為一種新的分類方法所具有的優(yōu)勢。在此基礎上,研究了把SVM應用于數(shù)據(jù)挖掘分類任務時需解決的問題,如適用于大數(shù)據(jù)集訓練的選塊算法、分解算法和序列最小化算法;基于二分類支持向量機構造多分類支持向量機的一對多、一對一及DDAG算法;結合隨機分層采用技術改進了基于網(wǎng)格搜索的SVlvi模型參數(shù)尋優(yōu)方法。在作了充分的理論分析后,論文提出了一種基于SVM的水費欠費用戶預測建模方案。結合數(shù)據(jù)挖掘理論闡述了數(shù)據(jù)預處理的過程,對建立的挖掘模型采用分層隨機采樣的交叉驗證網(wǎng)格搜索方

4、法確立模型參數(shù)進行了較為深入的研究。關鍵詞:數(shù)據(jù)挖掘;支持向量機;核函數(shù);交叉驗證;分層隨機采樣ⅡResearchofClassificationAlgorithmBasedonSVMandItsApplicationinDataMiningAbstractWiththemoreuniversalapplicationofdatabasetechnology,everywalkoflifehascollectedlargevolumesofrawdatainwhichabundanceofinformationmerge

5、d.Consequently,howtoabstractusefulknowledgefromitandthusdirecttheoperationofbusinessb@Acome$aproblemneedtobesolvedimminenfly.DammiIlil唱technologycom囂intobeinginthisbackground.Dataminingisanon-trivialprocesssearchingforuseful,potentialandunderstandableformfromsets

6、ofdata,inwhichclassificationisoneofthemostwidelyuseddataminingtasks.Asanewemergjngclassificationalgorithmbasedollstatisticallearningtheory,mlpportvectormachine(SVM)isprominentbyitssolidtheoryfoundation,smartalgodthmimplementationandexcellentperformance.Comparedwi

7、thotherclassificationalgoriOuns,SVMhastheadvantagesofglobaloptimization,simplestructurcandhighgeneralizationability.Sofar,ithasachievedthebestperformanceinmanyfields.Inconsiderationofthis,applicationofSVMintodatamiD.iIlgisstudiedintll_isthesisfortheproblemsencoun

8、teredintheparticipatingintothedataininillgprojectforwatersupplycompany.Theconcepts,ra“ngtaskandbasicminingprocessofdataminingisaddressedatthebeginning.Also,som

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內容,確認文檔內容符合您的需求后進行下載,若出現(xiàn)內容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。