資源描述:
《基于kohonen神經(jīng)網(wǎng)絡(luò)的用戶訪問模式挖掘模型的研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、摘要摘要Kohone神經(jīng)網(wǎng)絡(luò)是一個無監(jiān)督、自組織特征映射網(wǎng)絡(luò)。由于它通過競爭學(xué)習(xí)訓(xùn)練權(quán)系數(shù),并自動得出各聚類的中心,因此在模式識別、模式控制等領(lǐng)域得到廣泛應(yīng)用。本文基于其在模式聚類中的優(yōu)點(diǎn),將其應(yīng)用于用戶訪問模式挖掘。用戶訪問模式代表了用戶訪問網(wǎng)站的興趣。通過挖掘用戶訪問模式,可以改進(jìn)Web服務(wù)器的性能、改善網(wǎng)站結(jié)構(gòu)、識別電子商務(wù)中潛在的客戶,提高對用戶服務(wù)的質(zhì)量。然而,Kohonen神經(jīng)網(wǎng)絡(luò)用于用戶訪問模式挖掘時還存在一些不足。由于Kohonen神經(jīng)網(wǎng)絡(luò)只輸出輸入樣本和輸出神經(jīng)元之間歐氏距離最小的神經(jīng)元,即最優(yōu)匹配的輸出神經(jīng)元,將
2、其應(yīng)用到用戶訪問模式挖掘中,也就是僅反映出了用戶的一個興趣,而將用戶其他的興趣忽略了,因此它不適合用戶多種興趣的挖掘。鑒于此,本文引入三角形隸屬函數(shù)對KOhonen神經(jīng)網(wǎng)絡(luò)算法進(jìn)行改進(jìn),輸出若干個隸屬度大于閉值的神經(jīng)元,從而解決了該問題。應(yīng)用改進(jìn)的算法,本文設(shè)計(jì)和實(shí)現(xiàn)了用戶訪問模式挖掘模型。在設(shè)計(jì)過程中,如何將網(wǎng)絡(luò)日志數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò)輸入數(shù)據(jù)這兩種格式完全不同的數(shù)據(jù)聯(lián)系起來是一個難點(diǎn)。本文采取以數(shù)據(jù)庫為數(shù)據(jù)中轉(zhuǎn)緩存區(qū)的方法,實(shí)現(xiàn)了這兩種不同格式數(shù)據(jù)之間的轉(zhuǎn)換。本文最后用江西省新華書店用戶訪問日志對該模型的性能進(jìn)行測試,并和其它用戶訪問
3、模式挖掘方法進(jìn)行比較。實(shí)驗(yàn)表明,本模型能較好的挖掘用戶訪問模式。關(guān)鍵詞:W七b挖掘;用戶訪問模式:聚類;Kohone神經(jīng)網(wǎng)絡(luò):隸屬函數(shù)AbstraCtABSTRACTKohoneneuralnetwork(KNN)isaself-organizingfeaturem叩誡thoutsuPervisionKNNfeatilrestrainingweightsthroughcompetitiveleaming,andobtainingcenterPointsofclustersinanautomaticmaner.Duetothesetw
4、ocharacteristics,itiswidelyusedinPatemreco,itio氏pattemcontrol,andetc.Bythesametoken,itisen1Ployedintheuser即cessPaternmining·UseraccessPatternrePresents瞇rs,interestsinwebsitesRelyingonana1ysisanddiscoveryofthePatem1I1roughuserlogfiles,itcanimProvethePerfonllanceoftheweb
5、server,reconstnIctthewebsite,findthepotentialcustomersofe一c0Inlnerceandell】1田Icetheqllalityofwebservices·However,KNNisnotgoodenoughwhendirectlyusedinuseraccessPattemmining.KNNProducesonlythebestmatchingnode,whoseEuclideandistancefiomeachweightvectortothechosensamP1evec
6、torisminimalal11ongalloutPutnodes.Thatistosay,oulyoneinterest誠llbefoundifitisaPP1iedinuseraCcessPatiern·0bvious1ythisresuhma11yotherusers,interestsbeingneglected.APossiblesolutionaroundthisProb1emistousetriang1emembershiP九Ilctioninsteadofchoosingoniy山ebestmatchingnodeW
7、iththeimProvedalgoril腸m,auseraccesspattemmini雌modelwasdesi,edalld油Plemenied.Onedificultis:howcanthelogfilesbeconvertedtosamPlevectorsastl1eyaretwodiferenidatafonnat?ThisProblemcanbeaddressedbyintroducingadatabaseasbufer’Finall蘇someexPerimentsare往山entochecktheefectivens
8、softheProPosedmodelandcon1P而sonswithothermodelsaremade.TheexPenmentsshowthatourmodelisefectiveinmininguseraccessPatem