資源描述:
《聚類算法dbscan和fcm算法實現(xiàn)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、西南交通大學(xué)本科畢業(yè)設(shè)計(論文)I-MINER環(huán)境下聚類分析算法研究與實現(xiàn)年級:2004學(xué)號:20041892姓名:徐德專業(yè):計算機科學(xué)與技術(shù)指導(dǎo)老師:楊燕二零零八年六月西南交通大學(xué)本科畢業(yè)設(shè)計(論文)第60頁院系信息科學(xué)與技術(shù)學(xué)院專業(yè)計算機科學(xué)與技術(shù)年級2004級姓名徐德題目I-Miner環(huán)境下聚類分析算法研究與實現(xiàn)指導(dǎo)教師評語指導(dǎo)教師(簽章)評閱人評語評閱人(簽章)成績答辯委員會主任(簽章)年月日西南交通大學(xué)本科畢業(yè)設(shè)計(論文)第60頁畢業(yè)設(shè)計任務(wù)書班級計算機3班學(xué)生姓名徐德學(xué)號20041892專業(yè)計算機科學(xué)與技術(shù)發(fā)題日期:2008年1月10日完成日
2、期:2008年6月12日題目I-Miner環(huán)境下聚類分析算法研究與實現(xiàn)題目類型:工程設(shè)計*技術(shù)專題研究理論研究軟硬件產(chǎn)品開發(fā)一、設(shè)計任務(wù)及要求1.學(xué)習(xí)數(shù)據(jù)挖掘原理,了解當前聚類分析算法的研究現(xiàn)狀。2.熟練掌握數(shù)據(jù)挖掘工具I-Miner的使用。3.分析各種聚類算法的特點,用I-Miner中S語言實現(xiàn)2-3種聚類算法,擴展I-Miner功能。4.在I-Miner環(huán)境下用大量實例(包括Web文檔)進行聚類算法性能對比。二、應(yīng)完成的硬件或軟件實驗用S語言實現(xiàn)2-3種聚類算法,對實例進行處理,觀察聚類結(jié)果,對比各種算法優(yōu)劣。三、應(yīng)交出的設(shè)計文件及實物(包括設(shè)計論文
3、、程序清單或磁盤、實驗裝置或產(chǎn)品等)1.畢業(yè)設(shè)計論文2.源程序清單3.已擴展功能的I-Miner西南交通大學(xué)本科畢業(yè)設(shè)計(論文)第60頁四、指導(dǎo)教師提供的設(shè)計資料1.Jiaweihan,MichelineKamber,數(shù)據(jù)挖掘概念與技術(shù)(第2版),機械工業(yè)出版社,20072.邵峰晶,于忠清,數(shù)據(jù)挖掘原理與算法,中國水利水電出版社,2003,83.S+Miner入門手冊,北京宏能暢然數(shù)據(jù)應(yīng)用有限公司編譯,2007,4五、要求學(xué)生搜集的技術(shù)資料(指出搜集資料的技術(shù)領(lǐng)域)查找與聚類分析算法相關(guān)的文章10篇(中英文各5篇)六、設(shè)計進度安排第一部分學(xué)習(xí)數(shù)據(jù)挖掘原理
4、和聚類算法(2周)第二部分學(xué)習(xí)掌握數(shù)據(jù)挖掘工具I-Miner的使用(1周)第三部分用S語言實現(xiàn)2-3種聚類算法(7周)第四部分用實例(包括Web文檔)進行聚類算法性能對比(5周)第五部分撰寫論文(2周)評閱及答辯(1周)指導(dǎo)教師:年月日學(xué)院審查意見:審批人:年月日西南交通大學(xué)信息科學(xué)與技術(shù)學(xué)院2008年西南交通大學(xué)本科畢業(yè)設(shè)計(論文)第60頁摘要由于計算機和數(shù)據(jù)采集技術(shù)的進步,數(shù)據(jù)挖掘獲得了非常廣泛的應(yīng)用。數(shù)據(jù)挖掘幫助用戶發(fā)現(xiàn)隱藏在大型數(shù)據(jù)庫種的規(guī)律和模式,它融合了人工智能、統(tǒng)計、機器學(xué)習(xí)、模式識別和數(shù)據(jù)庫等多種學(xué)科的理論、方法與技術(shù)。數(shù)據(jù)挖掘模型包括決
5、策樹、關(guān)聯(lián)規(guī)則、聚類、神經(jīng)網(wǎng)絡(luò)、粗糙集、概念格、遺傳算法、序列模式、貝葉斯、支持向量機、模糊集和基于案例的推理。其中,聚類是數(shù)據(jù)挖掘領(lǐng)域的核心技術(shù),被廣泛應(yīng)用于相似搜索、顧客劃分、趨勢分析、金融投資和信息檢索等領(lǐng)域。I-Miner是一個企業(yè)級的數(shù)據(jù)挖掘工具。在I-Miner的環(huán)境下可以方便的建立數(shù)據(jù)挖掘模型,并且能夠嵌入其它數(shù)據(jù)挖掘模型。對于一個數(shù)據(jù)挖掘的非專業(yè)用戶,都能夠用I-Miner實現(xiàn)知識的發(fā)現(xiàn)。聚類分析是一種非監(jiān)督型知識發(fā)現(xiàn)的方法,能有效的處理大量的、繁雜的、屬性眾多的且沒有類標志的數(shù)據(jù)。聚類的目標是在沒有任何經(jīng)驗知識的前提下,將數(shù)據(jù)聚集成不同
6、的簇,使得相同簇中的元素盡可能相似,不同簇中的元素差別盡可能大。通過聚類,人們能夠識別密集的和稀疏的區(qū)域,因而發(fā)現(xiàn)全局的分布模式,以及數(shù)據(jù)屬性之間有趣的相互關(guān)系。DBSCAN算法能實現(xiàn)任意形狀的數(shù)據(jù)集的聚類,模糊C均值適合于那些在簇中心周圍呈均勻分布的數(shù)據(jù)集,CABOSFV算法對于高維稀疏數(shù)據(jù)集(如WEB數(shù)據(jù))能很好地聚類。本文在I-Miner中嵌入DBSCAN、CABOSFV和模糊C均值三種聚類分析算法,能夠極大地滿足用戶的需要,建立數(shù)據(jù)挖掘模型,支持生產(chǎn)決策。關(guān)鍵詞:數(shù)據(jù)挖掘;聚類分析;DBSCAN算法;模糊C均值;CABOSFV算法西南交通大學(xué)本科
7、畢業(yè)設(shè)計(論文)第60頁AbstractAsthedevelopmentofcomputeranddatagatheringtechnology,thedataminingiswidelyused.Dataminingwhichfusedthetheories,methodandtechnologyofmanykindsofdisciplinessuchasartificialintelligence,statistics,machinelearning,patternrecognitionanddatabasehelpuserfindtherulesa
8、ndpatternwhichplantinthelarge-scaledatab