基于偶對(duì)約束的半監(jiān)督模糊聚類算法研究

基于偶對(duì)約束的半監(jiān)督模糊聚類算法研究

ID:33146777

大?。?.20 MB

頁(yè)數(shù):70頁(yè)

時(shí)間:2019-02-21

基于偶對(duì)約束的半監(jiān)督模糊聚類算法研究_第1頁(yè)
基于偶對(duì)約束的半監(jiān)督模糊聚類算法研究_第2頁(yè)
基于偶對(duì)約束的半監(jiān)督模糊聚類算法研究_第3頁(yè)
基于偶對(duì)約束的半監(jiān)督模糊聚類算法研究_第4頁(yè)
基于偶對(duì)約束的半監(jiān)督模糊聚類算法研究_第5頁(yè)
資源描述:

《基于偶對(duì)約束的半監(jiān)督模糊聚類算法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、HEBEIUNIVERSITY密級(jí):分類號(hào):學(xué)校代碼:10075學(xué)號(hào):20111504碩士學(xué)位論文基于偶對(duì)約束的半監(jiān)督模糊聚類算法研究學(xué)位申請(qǐng)人:周宇飛指導(dǎo)教師:李凱教授企業(yè)導(dǎo)師:李海雁高級(jí)工程師學(xué)位類別:工程碩士授予單位:河北大學(xué)完成日期:二〇一四年五月ClassifiedIndex:CODE:10075U.D.C:NO:20111504ADissertationfortheDegreeofMasterStudyofSemi-SupervisedFuzzyClusteringAlgorithmBased

2、onPairwiseconstraintsCandidate:ZhouYufeiSupervisor:Prof.LiKaiAdvisorinEnterprise:SE.LiHaiyanAcademicDegreeAppliedfor:MasterofEngineeringUniversity:HebeiUniversityDateofAccomplishment:May,2014摘要摘要半監(jiān)督聚類是一種通過(guò)引入部分監(jiān)督信息來(lái)提高聚類性能的方法,它在實(shí)際中也有很廣泛的應(yīng)用比如:生物領(lǐng)域,醫(yī)學(xué)領(lǐng)域,模式識(shí)別領(lǐng)

3、域等等,對(duì)于常見(jiàn)的半監(jiān)督聚類來(lái)說(shuō),度量函數(shù)有很多,比如歐式度量,高斯核函數(shù)等等,其中最常用的度量函數(shù)就是歐式度量,但是對(duì)于歐式度量也有它的缺點(diǎn):1僅對(duì)球形數(shù)據(jù)有比較好的效果,2在處理樣本相關(guān)性比較大的數(shù)據(jù)集時(shí)聚類效果一般,3對(duì)于高維數(shù)據(jù)樣本的計(jì)算量很大,容易由此導(dǎo)致計(jì)算時(shí)間過(guò)長(zhǎng)問(wèn)題。針對(duì)以上幾個(gè)問(wèn)題,本文將不同的度量函數(shù)與半監(jiān)督算法相結(jié)合,研究了基于不同度量函數(shù)和偶對(duì)約束的半監(jiān)督模糊聚類算法F-SCAPC。具體的研究?jī)?nèi)容如下:(1)解決數(shù)據(jù)樣本相關(guān)性的問(wèn)題歐氏距離對(duì)給定的球形數(shù)據(jù)集有比較好的聚類效果,但是

4、如果是橢圓形數(shù)據(jù),聚類效果就不太理想,另一方面如果所給定的數(shù)據(jù)集的樣本相關(guān)性比較大,也無(wú)法獲得好的聚類效果。而馬氏距離善于處理樣本相關(guān)性比較大的數(shù)據(jù)。通過(guò)將馬氏距離引入到算法中,修改目標(biāo)函數(shù),可以很好地解決這類問(wèn)題。(2)解決高維數(shù)據(jù)聚類產(chǎn)生數(shù)據(jù)計(jì)算量過(guò)大的問(wèn)題歐式度量在聚類過(guò)程中可能會(huì)由于數(shù)據(jù)維數(shù)過(guò)高,運(yùn)算量太大而出現(xiàn)計(jì)算崩潰問(wèn)題,而核函數(shù)可以通過(guò)產(chǎn)生的高維特征空間映射來(lái)解決這個(gè)問(wèn)題,本文通過(guò)將高斯核函數(shù)引入到算法中,將樣本點(diǎn)由輸入空間映射到新的高維特征空間,在進(jìn)行聚類,也有比較好的聚類效果。本文研究了

5、基于偶對(duì)約束的半監(jiān)督模糊聚類,將馬氏度量和高斯核函數(shù)引入到半監(jiān)督模糊聚類中,獲得了一種新的半監(jiān)督模糊聚類目標(biāo)函數(shù),通過(guò)求解優(yōu)化問(wèn)題,提出了基于偶對(duì)約束和不同度量函數(shù)的半監(jiān)督模糊聚類算法F-SCAPC。針對(duì)選擇的標(biāo)準(zhǔn)數(shù)據(jù)集和人工數(shù)據(jù)集,對(duì)提出的算法F-SCAPC進(jìn)行了實(shí)驗(yàn)研究,并與FCM、CA、KCA、AFCC、KFCM-F和SCAPC算法的聚類性能進(jìn)行了比較,結(jié)果表明了提出的算法F-SCAPC在收斂速度和正確率兩方面都是有效的。關(guān)鍵詞半監(jiān)督聚類偶對(duì)約束馬氏度量高斯核函數(shù)IAbstractAbstractS

6、emi-supervisedclusteringisanimportantmethodwhichcanimproveclusteringperformancebyintroducingpartialsupervisedinformation;italsohasbeenwidelyusedinareassuchasbiologyfield,medicalfieldandpatternrecognition.Generallyspeakingthereisalotofmetricfunctionforsemi

7、-supervisedclusteringalgorithm.Forexample:Euclideanmetric,Kernelmetricandsoon.Euclideanmetricisthemostcommonlyusedmetricfunction.ButitalsohasdisadvantagesforEuclideanmetric:1.Itonlyhasbettereffectonsphericaldata,2Theclusterresultisnotgoodduringprocessingl

8、argecorrelationdata,3Ifthedataishighdimensional,thecomputationmaybeveryhigh,anditmaycausethecurseofdimensionality.Specifictothoseproblems,weproposeasemi-supervisedfuzzyclusteringalgorithmF-SCAPCwhichbasedonmetriclea

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。