資源描述:
《基于魯棒距離度量的判別分析研究與應用》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。
1、中圖分類號:TP391論文編號:102871613-S048學科分類號:081200碩士學位論文基于魯棒距離度量的判別分析研究與應用研究生姓名王嗣鈞學科、專業(yè)計算機科學與技術研究方向模式識別指導教師陳松燦教授南京航空航天大學研究生院計算機科學與技術學院二О一二年十二月NanjingUniversityofAeronauticsandAstronauticsTheGraduateSchoolCollegeofComputerScienceandTechnologyResearchonRobustDistanceMeasureBasedDisc
2、riminantAnalysisandApplicationsAThesisinComputerAppliedTechnologybyWangSijunAdvisedbyProf.ChenSongcanSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringDecember,2012承諾書本人聲明所呈交的碩士學位論文是本人在導師指導下進行的研究工作及取得的研究成果。除了文中特別加以標注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究
3、成果,也不包含為獲得南京航空航天大學或其他教育機構的學位或證書而使用過的材料。本人授權南京航空航天大學可以將學位論文的全部或部分內(nèi)容編入有關數(shù)據(jù)庫進行檢索,可以采用影印、縮印或掃描等復制手段保存、匯編學位論文。(保密的學位論文在解密后適用本承諾書)作者簽名:日期:南京航空航天大學碩士學位論文摘要特征提取是模式識別所研究的關鍵問題之一,其基本任務是尋求對分類盡可能有效的特征。在監(jiān)督的特征提取方法中,線性判別分析(LDA)具有代表性,并已在人臉識別、文本分類、信息檢索等領域得到廣泛應用。LDA旨在尋求一個降維子空間或一組投影方向,使在該子空間中
4、數(shù)據(jù)的類間距離最大化,類內(nèi)距離最小化。然而,在真實世界中,由于各種無法避免的原因,數(shù)據(jù)往往夾雜著噪聲或野值(outlier),因此,魯棒判別分析算法(RDA)的研究便具有十分重要的意義。近年來,研究人員們已陸續(xù)提出了一些魯棒判別分析算法,但這些算法各自固有的缺陷與算法之間所存在的聯(lián)系并沒有得到應有的重視與研究。針對這一問題,本文從不同算法所基于的魯棒距離度量角度出發(fā),在深入分析各算法魯棒性的基礎上,對現(xiàn)有算法進行了分類和比較,并提出了幾種一般性的魯棒判別分析算法。本文的主要研究內(nèi)容與成果如下:1.根據(jù)算法的魯棒化方式不同,對現(xiàn)有魯棒判別分析
5、算法進行了分類。具體地,分為直接魯棒判別分析和間接魯棒判別分析兩類。2.提出了一種核誘導距離度量的魯棒判別分析算法。通過在距離度量中采用魯棒徑向基核(RBF),使該方法不僅適用于處理非高斯分布的非線性數(shù)據(jù),還能有效處理含噪數(shù)據(jù)。值得指出的是,由于RBF核函數(shù)的多樣性,該方法可被視為一個直接魯棒判別分析框架。3.提出了一個新穎的間接魯棒判別分析框架。該框架采用一種魯棒主成分分析,即核誘導距離度量的魯棒主成分分析,作為預處理算法。事先通過預處理手段除去數(shù)據(jù)中的野值,為后續(xù)判別分析算法清除了障礙。該框架本質(zhì)的魯棒性歸咎于其在優(yōu)化目標中,采用核誘導
6、的、魯棒的非歐距離替代原有的非魯棒的歐氏距離。多種數(shù)據(jù)集上的實驗結果驗證了該框架的有效性與一般性。4.分別從理論與實驗兩方面,分析和比較了現(xiàn)有算法(state-of-the-art)及本文所提魯棒判別分析算法的分類性能。根據(jù)多種數(shù)據(jù)集上的大量實驗結果,總結出了一些有意義的結論,為后續(xù)研究提供了準備。關鍵詞:線性判別分析;魯棒判別分析;主成分分析;魯棒距離度量;核誘導距離度量;降維i基于魯棒距離度量的判別分析研究與應用ABSTRACTFeatureextractionplaysanimportantroleinpatternrecogniti
7、onanditaimsatsearchingthemostefficientfeatureusedforclassification.Lineardiscriminantanalysis(LDA)isoneoftherepresentativesandhasalreadybeensuccessfullyappliedinmanydomainssuchasfacerecognition,textclassification,informationretrieval,etc.LDAaimsatfindingaoptimalsubspaceofa
8、setofprojectiondirectionsthatmakesthebetween-classdistanceasmaximalaspossiblewhilethewith