資源描述:
《基于模擬退火算法的聚類分析在數(shù)據(jù)挖掘中的應(yīng)用》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、重慶大學(xué)碩士學(xué)位論文基于模擬退火算法的聚類分析在數(shù)據(jù)挖掘中的應(yīng)用姓名:涂進(jìn)申請學(xué)位級別:碩士專業(yè):控制理論與控制工程指導(dǎo)教師:曹長修20030508重慶大學(xué)碩士學(xué)位論文中文摘要摘要數(shù)據(jù)挖掘是近年來發(fā)展起來的新技術(shù),通過數(shù)據(jù)挖掘,人們可以將知識發(fā)現(xiàn)的研究成果應(yīng)用于實(shí)際數(shù)據(jù)處理中,為科學(xué)決策提供支持。目前數(shù)據(jù)挖掘逐漸發(fā)展成為一個多學(xué)科領(lǐng)域,涉及到多方面的技術(shù),特別是和計(jì)算智能方法的結(jié)合越來越緊密。聚類算法是數(shù)據(jù)挖掘中的核心技術(shù)之~,在整個數(shù)據(jù)挖掘過程中有著非常重要的作用。聚類算法的選擇取決于聚類的數(shù)據(jù)、聚類的目的和應(yīng)用。本文通過對數(shù)據(jù)挖掘技術(shù)中的常用聚類分析方法進(jìn)行了詳細(xì)的對比
2、,并從綜合評價聚類算法的5個方面對常用的聚類方法作了比較分析。在對聚類算法進(jìn)行比較分析的基礎(chǔ)上,從聚類的本質(zhì)特點(diǎn)出發(fā),將計(jì)算智能中的模擬退火算法應(yīng)用到數(shù)據(jù)聚類中。模擬退火算法是模擬物理退火過程的一種隨機(jī)優(yōu)化搜索算法。算法以優(yōu)化過程的求解與物理退火過程的相似性為基礎(chǔ),通過接受準(zhǔn)則和對下降溫度的控制,能夠有效的克服優(yōu)化過程陷入局部極小從而獲得全局最優(yōu)解。因此,在解決多維,非線性的復(fù)雜組合優(yōu)化問題中得到了廣泛的應(yīng)用。本文針對標(biāo)準(zhǔn)的模擬退火算法的局限性,提出一種綜合改進(jìn)的模擬退火算法。算法對標(biāo)準(zhǔn)模擬退火算法的退火過程和抽樣過程進(jìn)行了修改。目的在于設(shè)計(jì)高效的退火歷程,避免狀態(tài)的迂回搜
3、索。并將修改后的算法應(yīng)用到聚類分析中進(jìn)行驗(yàn)證。本文以中國股票市場從1992至2002年7月以來發(fā)行的一千多只股票在上市首日發(fā)行的各項(xiàng)相關(guān)數(shù)據(jù)為基礎(chǔ),利用綜合改進(jìn)后的模擬退火算法對其中的新股上市首日收益率進(jìn)行聚類分析。分析結(jié)果表明大多新股在上市的首日便會有一個巨大的漲幅,由此產(chǎn)生遠(yuǎn)遠(yuǎn)高于市場平均回報(bào)的超額收益,同時結(jié)果表明改進(jìn)的算法在保證聚類效果的前提下提高了算法的效率,整個過程算法的響應(yīng)時間提高了近50%,具有較好的適用性。關(guān)鍵詞:數(shù)據(jù)挖掘,聚類分析,模擬退火,全局最優(yōu)重慶大學(xué)碩士學(xué)位論文英文摘要AbstractDataMiningisanewtechnique,which
4、havebecomeincreasinglypopularinrecentyears.PeopleCallapplytheresearchresultofknowledgediscoverytothedataprocessthatcansupportthesciencedecision.Nowdatamininghasbecomeasubject,whichinvolvedlotsofsciencedomainandtechnologyespeciallyincombiningwithComputationalIntelligence(CI).Clusteringmetho
5、disoneofthecoretechniquesindatamining.ItWasveryimportantindataminingprocess.Howtochooseaclusteringalgorithmwasdecidedbytheclusteringdata,aimandapplication.AdetailedcomparisonwhichinvolvedusualclusteringalgorithmindatamineWas百VeIl,andacomparinganalysisofusualclusteringalgorithmincludingfive
6、syntheticevaluatingcriterionWasalsogiven.Basedonthecomparinganalysisandcharacterofclusteringalgorithmthesimulatedannealing(SA)algorithmsWas印pliedtothedataclustering.Simulatedannealing(SA)algorithmsarerandomsearchtechniquesbasedonphysicalannealingprocess,whichCanpreventtheoptimizingprocessi
7、ntolocaloptimizationandgettheglobaloptimization.Soitiswidelyusedinsolvingcomplexoptimizingproblemsandfindingoptimalsolutionsrapidlyfordifficulthigh-dimensionalproblems.InordertoovercomethelocalizationofstandardSAalgorithm,asyntheticimprovedSAalgorithmwasintrod