資源描述:
《基于kohonen和bp神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘方法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、中南大學(xué)碩士學(xué)位論文基于Kohonen和BP神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘方法研究姓名:莫禮平申請學(xué)位級別:碩士專業(yè):計算機使用技術(shù)指導(dǎo)教師:樊曉平20060522摘要數(shù)據(jù)挖掘足從結(jié)構(gòu)化或非結(jié)構(gòu)化的原始數(shù)據(jù)中自動獲取知識的過程,數(shù)據(jù)挖掘效率依賴于所使用的挖掘方法。根據(jù)所涉及的科學(xué)領(lǐng)域,數(shù)據(jù)挖掘方法可粗略分為基于統(tǒng)計學(xué)的方法、基于機器學(xué)習(xí)的方法、基于神經(jīng)網(wǎng)絡(luò)的方法和基于數(shù)據(jù)倉庫的方法四大類?;谏窠?jīng)網(wǎng)絡(luò)的方法可以對大量復(fù)雜的非線性數(shù)據(jù)進(jìn)行分析,并能完成極為復(fù)雜的模式識別及趨勢分析,適用于構(gòu)造多種數(shù)據(jù)挖掘模型。然而,由于神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果的可解釋性較差,而且神經(jīng)網(wǎng)絡(luò)需要較長的學(xué)習(xí)時間
2、,當(dāng)需要分析的數(shù)據(jù)量很大時,有可能導(dǎo)致該類挖掘方法的性能下降。通過改進(jìn)算法來優(yōu)化網(wǎng)絡(luò)是目前提高神經(jīng)網(wǎng)絡(luò)的可理解性和學(xué)習(xí)速度的主要途徑。本文結(jié)合SOM算法和BP算法的改進(jìn),研究了基于Kohonen和BP神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘方法。在對Kohonen網(wǎng)絡(luò)和BP網(wǎng)絡(luò)的拓樸結(jié)構(gòu)、用于數(shù)據(jù)挖掘的基本原理及算法進(jìn)行分析的基礎(chǔ)上,本文提出了兩種改進(jìn)算法。一種是由鄰域函數(shù)決定權(quán)重調(diào)整程度的改進(jìn)SOM算法,該算法避免了基本SOM算法調(diào)整權(quán)重前的鄰域判斷過程,有利于提高Kohonen網(wǎng)絡(luò)的學(xué)習(xí)速度和自適應(yīng)性;另一種是基于局部權(quán)重及閾值調(diào)整的改進(jìn)BP算法,該算法動態(tài)地將網(wǎng)絡(luò)權(quán)重及閾值的全局調(diào)整
3、改變?yōu)榫植空{(diào)整,提高TBP網(wǎng)絡(luò)的收斂速度。仿真實驗證明了兩種改進(jìn)算法的優(yōu)越性。本文重點研究]'Kobonen網(wǎng)絡(luò)聚類和BP網(wǎng)絡(luò)分類挖掘方法的組合使用。在前述兩種改進(jìn)算法的基礎(chǔ)上,提出了組合使用的基本思想,并據(jù)此設(shè)計了先利用Kohonen子網(wǎng)聚類結(jié)果將原始數(shù)據(jù)進(jìn)行初步分類,再由BP子網(wǎng)根據(jù)初步分類結(jié)果完成精確分類的組合神經(jīng)網(wǎng)絡(luò)分類模型;討論了如何在故障診斷中使用該模型的過程;并通過電力變壓器故障診斷的仿真實驗,比較了組合網(wǎng)絡(luò)分類模型和單一BP網(wǎng)絡(luò)分類模型的故障診斷效果。實驗結(jié)果表明組合模型不但克服了單一Kohonen網(wǎng)絡(luò)輸出結(jié)果不易理解,單--BP網(wǎng)絡(luò)泛化性能差、難以實
4、現(xiàn)精確分類的缺點;而且在實現(xiàn)精確分類的正確性方面優(yōu)于單一的BP網(wǎng)絡(luò)分類模型,能夠?qū)﹄娏ψ儔浩鞴收系默F(xiàn)場分析診斷起到一定的指導(dǎo)作用。關(guān)鍵詞神經(jīng)網(wǎng)絡(luò),數(shù)據(jù)挖掘,聚類分析,分類,故障診斷ABSTRACTDataMining(DM)isaprocessofacquiringknowledgeautomaticallyfromthestructuralornon-structuralOri}ginaldata.TheefficiencyofDMdependsonadpotedmethod.Accordingtosciencefieldsinvolved,theDMmethods
5、areroughlydiviedintofourtypeswhichareseparatelybasedonStatistics,MachineLearning,ArtificialNeutralNetwork(aNN)andDataWarehouse.Amongthem,themethodbasedonANNcarlanalyzeagreatdealofcomplicatednon.1ineardam,andcancompletetheextremelycomplicatedpaaemrecognitionandtrendanalysis.Thismethodcan
6、beapplicabletoconstructmanifolddataminingmodel.However,itisratherdifficulttoexplaintheoutputofANNFuthermore,ANNneedlongerlearningtime。SOwhentherearelotsofdatatobeanaly?,,ed,theperformanceofthismethodprobably。becomeworse,Atmepresent。time,algorithmimprovingisthemainapproachtoincreasethein
7、telligibilityandlearningspeedofANN.Combiningwithalgorithmimproving,thispaperstudiestheDMmethodsbasedonKohonenandBPneutralnetwork.Onthebasisofanalyzingthetopologicalstructure,rationaleandalgorithmofKohonenandBPneutralnetwork,twoimprovedalgorithmsareputforward.Oneofthemisaimprove