資源描述:
《基于核誘導(dǎo)距離度量的魯棒典型相關(guān)分析研究與應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、中圖分類號(hào):TP391論文編號(hào):102871613-S030
學(xué)科分類號(hào):081200碩士學(xué)位論文基于核誘導(dǎo)距離度量的魯棒典型相關(guān)分析研究與應(yīng)用研究生姓名丁鑫學(xué)科、專業(yè)計(jì)算機(jī)科學(xué)與技術(shù)研究方向模式識(shí)別與應(yīng)用指導(dǎo)教師陳松燦南京航空航天大學(xué)研究生院計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院二○一三年一月NanjingUniversityofAeronauticsandAstronauticsTheGraduateSchoolCollegeofComputerScienceandTechnologyRobustCanonicalCorrelationAnalysis
2、
basedonKernel-inducedmeasureandIts
RelativeApplicationsAThesisinComputerScienceandTechnology
byDingXinAdvisedbyProf.ChenSongcanSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringJanuary,2013承諾書本人聲明所呈交的碩士學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。除了文中特別加以標(biāo)注和
3、致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得南京航空航天大學(xué)或其他教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。本人授權(quán)南京航空航天大學(xué)可以將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。(保密的學(xué)位論文在解密后適用本承諾書)作者簽名:日期:南京航空航天大學(xué)碩士學(xué)位論文摘要數(shù)據(jù)降維是模式識(shí)別領(lǐng)域中一個(gè)重要環(huán)節(jié),其基本任務(wù)是從高維數(shù)據(jù)中提取穩(wěn)定有效的特征以滿足后續(xù)學(xué)習(xí)任務(wù)。典型相關(guān)分析作為一種經(jīng)典的多視圖數(shù)據(jù)降維方法,其目的是研究同一對(duì)象兩組變量間線性相關(guān)性進(jìn)行特征
4、提取,已經(jīng)在模式識(shí)別領(lǐng)域得到廣泛的關(guān)注和應(yīng)用,然而,由于真實(shí)世界中數(shù)據(jù)的多樣性,導(dǎo)致CCA如下典型缺陷:(1)作為一種線性算法,其不能很好地直接應(yīng)用于非線性問題;(2)真實(shí)世界中數(shù)據(jù)難免帶有噪聲,所采用的歐氏距離度量導(dǎo)致了其本質(zhì)上的非魯棒性。近年來(lái),研究人員陸續(xù)提出一些改進(jìn)的CCA算法,然而,大多數(shù)算法只解決了CCA的非線性缺陷,仍舊缺乏對(duì)魯棒性的研究。因此,本文針對(duì)典型相關(guān)分析魯棒性問題做了深入研究,主要內(nèi)容和研究成果如下:首先提出一種新的基于核誘導(dǎo)距離的魯棒典型相關(guān)分析(KI-CCA),該方法采用徑向基核函數(shù)誘導(dǎo)的魯棒距離度量,不僅克
5、服了CCA非魯棒的不足,而且使1)現(xiàn)有的基于最大相關(guān)熵的魯棒PCA成為特例;2)CCA具有非線性相關(guān)分析的能力。一方面由于核的多樣性,使得KI-CCA也具有多樣性,從而使其成為一般性的分析算法。另一方面,同CCA刻畫問題相似使其解可歸結(jié)為廣義特征值問題。在人工數(shù)據(jù)集、多特征手寫體數(shù)據(jù)集(MFD)和人臉數(shù)據(jù)集上(yale,AR,ORL)的實(shí)驗(yàn)驗(yàn)證了該方法的有效性。其次根據(jù)魯棒化方式不同,對(duì)魯棒典型相關(guān)分析進(jìn)行了分類,具體分為直接魯棒典型相關(guān)分析與間接魯棒典型相關(guān)分析。KI-CCA算法即屬于一類直接魯棒典型相關(guān)分析。本文進(jìn)一步提出一種間接魯棒
6、典型相關(guān)分析框架,該框架采用一種新的魯棒主成分分析,即KI-PCA,作為數(shù)據(jù)預(yù)處理方法。該框架魯棒的本質(zhì)在于用魯棒的數(shù)據(jù)預(yù)處理方法發(fā)現(xiàn)數(shù)據(jù)中的野值點(diǎn),為CCA后續(xù)任務(wù)提供魯棒性保證。最后深入研究本文中兩種不同魯棒方式的典型相關(guān)分析,從理論和實(shí)驗(yàn)上比較二者的性能。根據(jù)大量數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果總結(jié)出結(jié)論,為后續(xù)的研究提供有意義的指導(dǎo)。關(guān)鍵詞:降維;典型相關(guān)分析;核誘導(dǎo);廣義特征值;直接魯棒;間接魯棒;數(shù)據(jù)預(yù)處理i基于核誘導(dǎo)距離度量的魯棒典型相關(guān)分析研究與應(yīng)用ii南京航空航天大學(xué)碩士學(xué)位論文AbstractDatadimensionalityred
7、uctionisaimportantpartofpatternrecognition,itsbasictaskistoextractstableandeffectivefeaturesfromhigh-dimensionaldatatomeetthesubsequentlearningtask.Canonicalcorrelationanalysis(CCA)isaclassicmulti-viewdatadimensionalityreductionmethod,whichaimstosearchingforthelinearcorre
8、lationbetweenthetwosetsofvariablesofthesameobject.Inrecentyears,CCAiscommonlyusedandhasattracted