混合屬性數(shù)據(jù)聚類算法及其應(yīng)用

混合屬性數(shù)據(jù)聚類算法及其應(yīng)用

ID:37380912

大小:9.49 MB

頁數(shù):56頁

時間:2019-05-22

混合屬性數(shù)據(jù)聚類算法及其應(yīng)用_第1頁
混合屬性數(shù)據(jù)聚類算法及其應(yīng)用_第2頁
混合屬性數(shù)據(jù)聚類算法及其應(yīng)用_第3頁
混合屬性數(shù)據(jù)聚類算法及其應(yīng)用_第4頁
混合屬性數(shù)據(jù)聚類算法及其應(yīng)用_第5頁
資源描述:

《混合屬性數(shù)據(jù)聚類算法及其應(yīng)用》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫

1、專業(yè)學(xué)位碩士學(xué)位論文混合屬性數(shù)據(jù)聚類算法及其應(yīng)用ClusteringAlgorithmforMixedTypeDataandItsApplication作者姓名:工程領(lǐng)域:學(xué)號:指導(dǎo)教師:完成日期:』亙增查2013-3-28大連理工大學(xué)DalianUniversityofTechnology大連理工大學(xué)學(xué)位論文獨創(chuàng)性聲明作者鄭重聲明:所呈交的學(xué)位論文,是本人在導(dǎo)師的指導(dǎo)下進行研究工作所取得的成果。盡我所知,除文中已經(jīng)注明引用內(nèi)容和致謝的地方外,本論文不包含其他個人或集體已經(jīng)發(fā)表的研究成果,也不包含其他已申請學(xué)位或其他用途使用過的成果。與我一同工

2、作的同志對本研究所做的貢獻均已在論文中做了明確的說明并表示了謝意。若有不實之處,本人愿意承擔(dān)相關(guān)法律責(zé)任。學(xué)位論文題目:i邑僉屬!睦數(shù)量鐾婁箕法及墓廑趣作者簽名:獨查杰日期:絲f圣年—£月塵日大連理工大學(xué)專業(yè)學(xué)位碩士學(xué)位論文摘要目前已有的聚類算法大部分局限于處理連續(xù)屬性或是分類屬性的數(shù)據(jù),然而在實際應(yīng)用中,許多數(shù)據(jù)集是由連續(xù)屬性數(shù)據(jù)和分類屬性數(shù)據(jù)共同組成的,僅適用于單種數(shù)據(jù)類型的聚類算法就不能滿足需求。因此,對混合了分類屬性數(shù)據(jù)和連續(xù)屬性數(shù)據(jù)的聚類算法的研究,具有重要的理論意義和實際價值。本文的主要研究工作包括以下幾個方面:(1)首先介紹無監(jiān)督

3、離散化算法和k-ANMI聚類算法,然后提出基于一種無監(jiān)督離散化的混合數(shù)據(jù)聚類算法,在UCI數(shù)據(jù)集上的實驗結(jié)果表明,提出的無監(jiān)督離散化的混合數(shù)據(jù)聚類算法聚類混合類型數(shù)據(jù)是非常有效的。(2)有監(jiān)督離散化算法CAIM的介紹,然后提出基于有監(jiān)督離散化的混合數(shù)據(jù)聚類算法,在UCI混合數(shù)據(jù)集上的實驗結(jié)果表明,提出的算法優(yōu)于k-prototypes算法,UCI連續(xù)數(shù)據(jù)集上的實驗證明,提出的基于有監(jiān)督離散化的連續(xù)數(shù)據(jù)聚類算法對比k-means算法具有更好聚類效果。(3)介紹基于質(zhì)譜技術(shù)的蛋白質(zhì)鑒定以及蛋白質(zhì)推斷問題,然后提出如何應(yīng)用本文的聚類算法解決蛋白質(zhì)推斷

4、問題,并給出解決方案,通過真實的蛋白質(zhì)數(shù)據(jù)驗證算法在蛋白質(zhì)推斷應(yīng)用中的可行性和有效性。關(guān)鍵詞:混合數(shù)據(jù);聚類;離散化;蛋白質(zhì)推斷混合屬性數(shù)據(jù)聚類算法及其應(yīng)用ClusteringAlgorithmforMixedTypeDataandItsApplicationAbstractUntilnow,mostoftheexistingclusteringalgorithmshavebeenlimitedtodealwiththedatawhichcontainseithernumericalattributesorcategoricalattribut

5、es.However,alotofthepracticaldatabasesandlargedatasetscontainnotonlynumericaldatabutalsocategoricalones.It’Snecessarytohandlebothofthematthesametime.Thus.itisofgreattheoreticalandpracticalsignificancetodevelopaclusteringalgorithmwhichCandealwitllnumericaldataandcategoricalda

6、tasimultaneously.ThemainresearchworkofthisPapercanbesummarizedasfollows:(1)Itfirstlyintroducestheunsuperviseddiscretizationalgorithmsandthenproposesanewclusteringalgorithmformixedtypedatawhichisbasedonunsuperviseddiscretizationalgorithms.TheexperimentalresultsonUCIdatasetind

7、icatethatthisnewclusteringalgorithmisveryeffectiveforthemixedtypedata.(”Introducethesuperviseddiscretizationalgorithm,CAIM,andonthebasisofCAIM.thepaperproposessuperviseddiscretizationclusteringalgorithm.TheexperimentalresultsonUCImixeddatasetshowthattheproposedalgorithmissup

8、eriortok-prototypesalgorithm.Moreover,forUCInumericaldataset,thisalgorithmo

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。