資源描述:
《模式分類中特征選擇算法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、國內(nèi)圖書分類號:TP391.4唧㈣㈣11IIIIII㈣IIIIIIIIIIIIIIl㈣lnIIIY2509509。工學碩士學位論文模式分類中特征選擇算法研究碩士研究生:導師:申請學位級別:學科、專業(yè):所在單位:答辯日期:授予學位單位:劉依戀黃金杰工學碩士控制理論與控制工程自動化學院2014年3月哈爾濱理工大學工學碩士學位論文模式分類中特征選擇算法研究劉依戀哈爾濱理工大學2014年3月ClassifiedIndex:TP391.4DissertationfortheMasterDegreeinEngineeringResear
2、chonFeatureSelectionAlgorithmCandidate:Supervisor:forPatternClassificationLiuYilianHuangJinjieAcademicDegreeAppliedfor:MasterofEngineeringSpecialty。ControlTheoryandControlEngineeringDateofOralExamination:March,2014University:HarbinUniversityofScienceandTechnology哈爾
3、濱理工大學碩士學位論文原創(chuàng)性聲明本人鄭重聲明:此處所提交的碩士學位論文《模式分類中特征選擇算法研究》,是本人在導師指導下,在哈爾濱理工大學攻讀碩士學位期間獨立進行研究工作所取得的成果。據(jù)本人所知,論文中除已注明部分外不包含他人己發(fā)表或撰寫過的研究成果。對本文研究工作做出貢獻的個人和集體,均在文中以明確方式注明。本聲明的法律結(jié)果將由本人承擔。作者簽名:劉岱≮悉、日期:201%.5月炒日哈爾濱理工大學碩士學位論文使用授權(quán)書《模式分類中特征選擇算法研究》系本人在哈爾濱理工大學攻讀碩士學位期間在導師指導下完成的碩士學位論文。本論文的
4、研究成果歸哈爾濱理工大學所有,本論文的研究內(nèi)容不得以其它單位的名義發(fā)表。本人完全了解哈爾濱理工大學關(guān)于保存、使用學位論文的規(guī)定,同意學校保留并向有關(guān)部門提交論文和電子版本,允許論文被查閱和借閱。本人授權(quán)哈爾濱理工大學可以采用影印、縮印或其他復制手段保存論文,可以公布論文的全部或部分內(nèi)容。本學位論文屬于保密口,在年解密后適用授權(quán)書。不保密團。作者簽名:文-艄,導師簽名:鍘日期:別華年一弓月b日日期:加I斗年3月\O日哈爾濱理-丁大學工學碩上學位論文模式分類中特征選擇算法研究摘要新技術(shù)的蓬勃發(fā)展使我們每天都接觸到海量的信息,如何
5、從這些海量數(shù)據(jù)中獲取對自己有用的信息,關(guān)鍵的環(huán)節(jié)就是模式識別技術(shù)。在模式識別系統(tǒng)中,由于獲取的數(shù)據(jù)規(guī)模越來越大并且具有樣本少、維數(shù)高等特點,如何從高維度原始數(shù)據(jù)中選擇合適特征子集,避免“維數(shù)災難”,同時不影響分類性能,使得特征選擇算法面臨更大的挑戰(zhàn)。特征選擇是模式識別系統(tǒng)中非常重要的一部分,也是設計一個性能優(yōu)良分類器的前提和必要條件。本文通過研究國內(nèi)外各種特征選擇算法,在對有監(jiān)督的特征選擇算法中的評價測度、搜索方向和搜索策略等深入研究的基礎(chǔ)上,提出了改進的特征選擇算法?;谥鞒煞址治?PrincipleComponentAn
6、alysis,PCA)的多層Filter式特征選擇算法,它將PCA特征提取運用于特征選擇之前,能有效去除特征間冗余,克服了特征選擇被用于依賴性較高的數(shù)據(jù)集時為了有效檢測到冗余的高計算量問題。之后引入信息熵的理論,研究特征的最大相關(guān)最小冗余的非線性相關(guān)性。針對Filter特征選擇效率高但是不能保證獲得規(guī)模最小的特征子集的不足,本文提出分層Filter式特征選擇,減少每層計算量,逐層降低特征維數(shù),得到維數(shù)最低冗余度小的特征子集。基于信息相關(guān)性的嵌入式動態(tài)特征選擇算法是在這樣的基礎(chǔ)上:信息相關(guān)的度量方法是建立在概率論的基礎(chǔ)上的,預
7、先要知道數(shù)據(jù)集上的概率分布情況;隨著特征選擇的不斷進行,待選特征子集不斷縮小,己選特征子集不斷壯大,數(shù)據(jù)類別的不確定性越來越小,而信息熵計算不變,顯然信息熵中包含部分“假信息”。通過改進特征選擇中單個特征的評價函數(shù),同時在特征選擇算法中嵌入k近鄰分類器,根據(jù)己選特征子集來得到可識別樣本,將其從原樣本中去除,重新計算信息熵來實現(xiàn)動態(tài)特征選擇。關(guān)鍵詞模式識別;特征選擇;過濾式;嵌入式;信息論哈爾濱理工大學T學碩士學位論文ResearchonFeatureSelectionAlgorithmforPatternClassifica
8、tionAbstractTherapiddevelopmentofnewtechnologiesbringsUSalargeamountofinformationeveryday,themostimportantsteptoobtainusefulinformationfromthemas