資源描述:
《基于最優(yōu)劃分的多密度梯度網(wǎng)格聚類算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、AMulti-densityGradientGridClusteringAlgorithmbasedontheOptimalDivisionDissertationSubmittedtotheGraduateSchoolofHenanUniversityinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofScienceByZhangZhendongSupervisor:ZhengFengbinMay2012關(guān)于學(xué)位論文獨(dú)創(chuàng)聲明和學(xué)術(shù)誠(chéng)信承諾本人向河南大學(xué)提出碩士學(xué)位申請(qǐng).本人鄭
2、重聲明:所呈交的學(xué)位論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立完成的,對(duì)所研究的課題有新的見(jiàn)解.據(jù)我所知,除文中特別加以說(shuō)明、標(biāo)注和致謝的地方外,論文中不包括其他人已經(jīng)發(fā)表或撰寫過(guò)的研究成果,也不包括其他人為獲得任何教育、科研機(jī)構(gòu)的學(xué)位或證書而使用過(guò)的材料.與我一同工作的同事對(duì)本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說(shuō)明并表示了謝意。在此本人鄭重承諾:所呈交的學(xué)位論文不存在舞弊作偽行為,文責(zé)自負(fù).學(xué)位申請(qǐng)人(學(xué)位論文作者)簽名:羽幽∑201Z,年占月f8日關(guān)于學(xué)位論文著作權(quán)使用授權(quán)書本人經(jīng)河南大學(xué)審核批準(zhǔn)授予碩士學(xué)位.作為學(xué)位論文的作者,本人完全了解并同
3、意河南大學(xué)有關(guān)保留、使用學(xué)位論文的要求,即河南大學(xué)有權(quán)向國(guó)家圖書館、科研信息機(jī)構(gòu)、數(shù)據(jù)收集機(jī)構(gòu)和本校圖書館等提供學(xué)位論文(紙質(zhì)文本和電子文本)以供公眾檢索、查閱。本人授權(quán)河南大學(xué)出于宣揚(yáng)、展覽學(xué)校學(xué)術(shù)發(fā)展和進(jìn)行學(xué)術(shù)交流等目的,可以采取影印、縮印、掃描和拷貝等復(fù)制手段保存、匯編學(xué)位論文(紙質(zhì)文本和電子文本).(涉及保密內(nèi)容的學(xué)位論文在解密后適用本授權(quán)書)學(xué)位獲得者(學(xué)位論文作者)簽名:201≯年S月f彥日學(xué)位論文指導(dǎo)教師簽名:201摘要數(shù)據(jù)挖掘是從數(shù)量龐大的、隨機(jī)出現(xiàn)的、客觀存在的、不完全的并充滿噪聲的數(shù)據(jù)中提取和發(fā)現(xiàn)有價(jià)值的信息,從而為商務(wù)分
4、析與決策、自然科學(xué)理論、人文地理等提供有效的技術(shù)支持和可靠的數(shù)據(jù)依據(jù)。其中,聚類分析是數(shù)據(jù)挖掘中一項(xiàng)十分重要而有趣的研究課題,并且因?yàn)槠鋸?qiáng)大的應(yīng)用和研究?jī)r(jià)值而受到越來(lái)越廣泛的關(guān)注。為解決網(wǎng)格聚類算法中對(duì)參數(shù)過(guò)于敏感、無(wú)法自動(dòng)識(shí)別不同密度梯度類以及不同梯度類間劃分不夠精確等問(wèn)題,提出了基于最優(yōu)劃分的多密度梯度網(wǎng)格聚類算法(OPMDG)。該算法只需用戶輸入一個(gè)大致的密度閾值范圍,網(wǎng)格邊長(zhǎng)自動(dòng)計(jì)算并可自動(dòng)調(diào)節(jié)適應(yīng),減少了算法對(duì)參數(shù)的敏感性;提出了二重劃分技術(shù),可挖掘不同密度梯度的類;對(duì)于處于不同類上的交界點(diǎn),引入了電荷間吸引力的概念,能有效解決類間
5、聚類精度不高等問(wèn)題。實(shí)驗(yàn)結(jié)果表明,OPMDG算法能識(shí)別各種不同形狀、大小的簇,挖掘具有不同密度梯度類,并能有效地劃分邊界和去除離群點(diǎn)與噪聲點(diǎn)。在通過(guò)和GCOD算法的對(duì)比中,可以顯著發(fā)現(xiàn)OPMDG算法的精度和準(zhǔn)確度更高,且時(shí)間復(fù)雜度是一個(gè)不大的線性函數(shù)。關(guān)鍵詞:網(wǎng)格聚類,參數(shù)半自動(dòng)化,最優(yōu)劃分,多密度梯度,算法ABSTRACTDataminingisamethod,which,fromahugenumberofrandomlyoccurring,objectiveexistence,incompleteandnoisydatawereextra
6、ctedandfindvaluableinformationforbusinessanalysisanddecision,thus,thetheoryofnaturalscience,humangeographyandprovideeffectivetechnicalsupportandreliabledatabasis.Amongthem,clusteringanalysisindataminingisaveryimportantandinterestingresearchtopics,andbecauseofitsgreatapplica
7、tionandresearchvalueandhasattractedmoreandmoreattention.InordertosolvethegridclusteringalgorithmtoparametertOOsensitive,Canautomaticallyidentifythedifferentdensitygradientanddifferentgradientdifferentiatesbetweenpreciseenoughtowaitforaproblem,putforwardAMulti·densityGradien
8、tGridClusteringAlgorithmbasedontheOptimalDivision(OPMDG).Thisalgorithmonlyneedstoi