資源描述:
《基于局部近鄰的投影子空間分類方法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、基于局部近鄰的投影子空間分類方法Projectionsubspaceclassificationmethodsbasedonlocalityneighborhood學(xué)科專業(yè):信息與通信工程研究生:周博指導(dǎo)教師:龐彥偉教授天津大學(xué)電氣自動(dòng)化與信息工程學(xué)院二零一七年十一月摘要分類算法作為數(shù)據(jù)挖掘的一種重要方法,廣泛應(yīng)用于圖像識(shí)別、文本檢索、信息安全等方面。而隨著信息技術(shù)的快速發(fā)展,對(duì)各種類型的數(shù)據(jù)的處理需求大幅增長(zhǎng),對(duì)分類算法的研究也從處理小樣本、低維數(shù)據(jù)在向處理高維空間大數(shù)據(jù)的方向發(fā)展。高維數(shù)據(jù)通常存在“維數(shù)災(zāi)難”問(wèn)題,即隨著數(shù)據(jù)中維數(shù)
2、的增加,計(jì)算量以指數(shù)形式增長(zhǎng)。此外,高維空間中的數(shù)據(jù)在原始空間分布稀疏,在原始空間直接建立分類模型十分困難。而傳統(tǒng)的維數(shù)約簡(jiǎn)算法通常在原始空間直接尋找近鄰和計(jì)算相似度,這樣會(huì)導(dǎo)致選取的近鄰不準(zhǔn)確,難以取得很好的投影效果。因此本文為了處理高維數(shù)據(jù)的分類問(wèn)題,根據(jù)高維數(shù)據(jù)的特點(diǎn)在投影子空間中提取其特征并進(jìn)行分類,用以提高算法的識(shí)別率。本文提出一種基于局部近鄰的投影子空間分類方法,該方法將近鄰點(diǎn)的選擇和相似度均視為投影子空間中的變量,在特征提取時(shí)利用數(shù)據(jù)的類內(nèi)信息和類間信息構(gòu)建一個(gè)由相似項(xiàng)和正則懲罰項(xiàng)組成的目標(biāo)函數(shù),在白化約束和概率約束條件
3、下最小化目標(biāo)函數(shù)來(lái)迭代優(yōu)化鄰接矩陣和投影矩陣,并將高維數(shù)據(jù)投影到低維子空間中進(jìn)行分類。將本文方法在人臉識(shí)別、物體識(shí)別、手寫(xiě)識(shí)別等領(lǐng)域進(jìn)行具體應(yīng)用研究,并在多個(gè)數(shù)據(jù)庫(kù)上進(jìn)行實(shí)驗(yàn)。通過(guò)與傳統(tǒng)維數(shù)約簡(jiǎn)算法分類識(shí)別率的對(duì)比,證明了本文方法能夠取得更好的投影效果,在識(shí)別率上也有了明顯的提高。實(shí)驗(yàn)結(jié)果表明了本文方法具有一定的理論意義與實(shí)際應(yīng)用價(jià)值。關(guān)鍵詞:數(shù)據(jù)挖掘,分類算法,局部近鄰,子空間投影IABSTRACTAsanimportantmethodofdatamining,classificationalgorithmiswidelyusedi
4、nimagerecognition,textretrieval,informationsecurityandsoon.Withtherapiddevelopmentofinformationtechnology,thedemandforprocessingvariousdatahasincreaseddramatically.Researchonclassificationalgorithmshasalsobeendevelopingfromsmallsamplesinlow-dimensionalspacetothelarge-sc
5、aledatainhigh-dimensionalspace.High-dimensionaldatausuallyhasa"curseofdimensionality"problem,inwhichtheamountofcomputationincreasesexponentiallyasthenumberofdimensionsincreases.Inaddition,thedatainhigh-dimensionalspaceissparselydistributedintheoriginalspaceandisverydiff
6、iculttoestablishtheclassificationmodeldirectly.However,thetraditionaldimensionreductionalgorithmsusuallyselectneighborsandcalculatethesimilaritydirectlyintheoriginalspace,whichleadtoinaccurateselectionofneighborsanddifficultyinobtainingoptimalprojectionresults.Therefore
7、,inordertodealwiththeclassificationproblemofhigh-dimensionaldata,ourpaperextractsfeatureintheprojectionsubspaceforclassificationtoimprovetherecognitionrateofthealgorithm.Inthispaper,weproposeaprojectionsubspaceclassificationmethodbasedonlocalityneighborhood.Boththeselec
8、tionofneighborsandsimilarityaresetasvariablesintheprojectionsubspace.Whenextractingfeatures,weusethewithin-cla