資源描述:
《聚類算法及其應(yīng)用研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、上海交通大學(xué)碩士學(xué)位論文聚類算法及其應(yīng)用研究姓名:何虎翼申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):模式識(shí)別與智能系統(tǒng)指導(dǎo)教師:姚莉秀20070101上海交通大學(xué)碩士學(xué)位論文摘要(3)針對(duì)具體的目標(biāo)識(shí)別問題。首先對(duì)幾個(gè)具有一定分類特性的特征進(jìn)行了簡(jiǎn)單的融合;接著在本文提出的子空間聚類算法基礎(chǔ)上,采用基于競(jìng)爭(zhēng)的修剪方式得到了新的易于區(qū)分的特征;最后用確定的類別參數(shù)代替聚類有效性指標(biāo)作為投票法的類融合停止準(zhǔn)則,建立了分類器的多中心表達(dá)模型,并結(jié)合兩級(jí)糾錯(cuò)訓(xùn)練模式設(shè)計(jì)了合理有效的識(shí)別分類器,在分類測(cè)試中取得了較好的效果。本文的貢獻(xiàn)和創(chuàng)新主要體現(xiàn)在上述兩個(gè)算法的改進(jìn)和應(yīng)用上:(1)完成
2、了自動(dòng)聚類算法,其創(chuàng)新點(diǎn)體現(xiàn)在:一,結(jié)合多種方法較好的解決了傳統(tǒng)聚類算法遇到的問題;二,改進(jìn)了傳統(tǒng)的k-means算法使之適應(yīng)在壓縮數(shù)據(jù)上進(jìn)行聚類操作;三,對(duì)投票法進(jìn)行了加權(quán)處理以適應(yīng)壓縮數(shù)據(jù)。(2)針對(duì)高維數(shù)據(jù)的聚類問題提出了從稀疏區(qū)域著手的基于密度和網(wǎng)格的子空間聚類算法,創(chuàng)新點(diǎn)體現(xiàn)在:一,提出了基于競(jìng)爭(zhēng)的修剪方式;二,提出了一種形式化的“投影尋蹤”搜索策略來得到合適子空間并生成類。(3)將子空間聚類算法中基于競(jìng)爭(zhēng)的修剪方式運(yùn)用到目標(biāo)識(shí)別中,生成了易于區(qū)分的綜合了紋理特征及不變性特征的新特征;提出了分類器的多中心表達(dá)方法;提出了兩級(jí)糾錯(cuò)的分類器訓(xùn)練模式。在
3、目標(biāo)識(shí)別應(yīng)用中表現(xiàn)出了很好的穩(wěn)健性。關(guān)鍵詞:聚類,數(shù)值歸約,投票法,子空間,目標(biāo)識(shí)別,模式分類II上海交通大學(xué)碩士學(xué)位論文AbstractSTUDYONCLUSTERINGALGORITHMANDIT’SAPPLICATIONSABSTRACTWiththerapiddevelopmentofdatacollectionandstoragetechnologyrecently,lotsofapplicationfieldsaccumulatedlargeamountofdata.Dataminingtechnology,combiningwithdataba
4、se,statisticsandmachinelearningmethods,isutilizedtofindthevaluableknowledgeandrulesfromthesedata.Clusteringanalysistechnologyistheclassicalpartindataminingandisanimportanttoolinmanyresearchareas.Basedonsurveyofrelativepapersandfurtherstudyofclusteringalgorithm,thefollowingworkhasbe
5、endoneinclusteringimprovementandapplication.1)Anautomatedclusteringalgorithmisproposedtoavoidthedisadvantagesofclassicalclusteringalgorithm,suchasshapedependence,reasonablyselectionofclassparametersandsensitivitytonoise.Theproposedalgorithmmakesuseofdatareduction,improvedK-meansIII
6、上海交通大學(xué)碩士學(xué)位論文Abstractalgorithmbasedoncompresseddata,validationofRMSSTD&RSandweightedvotingalgorithm.2)Theconventionaldensity-basedalgorithmandCLIQUEsubspaceclusteringalgorithmstartwithfindingthedenseregiontosolveclusteringproblems.Whiletheproposedmethodstartswiththesparseregionandus
7、escompetition-basedpruneandthesearchingstrategywhichisformedprojectedpursuittogetsuitablesubspaceandclass.Theexperimentresultsshowtheefficiencyofcomputingcomplexity,accuracyofthealgorithmandrobusttoinputparameters.3)Theproposedalgorithmaimstothespecificobjectrecognitionproblem.Afte
8、rsimplefusionofseveralfeat