資源描述:
《web用戶瀏覽模式模糊聚類算法的研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、.墮璽鎏:;堡盔蘭鎏土蘭垡笙鑾摘要Web使用挖掘是從Web151志中挖掘用戶訪問模式和知識。分析和探索丌志中的規(guī)律能夠確認(rèn)電子商務(wù)中的潛在用戶、提高信息服務(wù)的質(zhì)量和提高Web服務(wù)系統(tǒng)的性能。Web使用挖掘,尤其Web用戶聚類和頁面聚類,有著明顯的模糊特征,所以模糊聚類有時(shí)比傳統(tǒng)聚類方法更適合Web聚類。本文提出一種基于模糊聚類最大樹的方法對Web事務(wù)進(jìn)行聚類。首先,本文介紹了數(shù)據(jù)挖掘以及其中的Web挖掘技術(shù),重點(diǎn)闡述了Web挖掘技術(shù)研究內(nèi)容和發(fā)展方向。然后,分析了已有聚類算法的不足,提出將模糊聚類技術(shù)應(yīng)用到Web聚類中,給出基于模糊聚類最大樹方法的具體算法描述,并用實(shí)例進(jìn)行分析說明。最后,從
2、理論上證明此算法的正確性,并通過性能分析說明此算法比已有的算法準(zhǔn)確性高,運(yùn)行時(shí)間少,擴(kuò)展性好??梢詫⒋怂惴☉?yīng)用于電子商務(wù)領(lǐng)域,如個(gè)性化Web和Web推薦系統(tǒng)等。關(guān)鍵詞:數(shù)據(jù)挖掘;Web使用挖掘;模糊聚類:最大樹哈爾濱工程大學(xué)碩士學(xué)位論文AbstractWebusingminingtriestodiscoverinterestingwebuseraccesspatternsorknowledgefromtheweblogrecords.Analyzingandexploringregularitiesinweblogrecordscallidentifypotentialcustomersfo
3、relectroniccommerce,enhancethequalityanddeliveryofIntemetinformmionservicestotheendwebuser,andimprovewebserversystemperformance.Webmining,especiallywebusersclusteringofwebusagemining,hasobviousfuzzycharacteristic,SOfuzzyclusteringissometimesbettersuitforthewebminingincomparisonwithtraditionalcluste
4、ring.Amothedbasedonmaximumtreealgorithmforfuzzycluseringisbroughtoutinthisthesistoclusterthewebsession.First,asurveyofdataminingandwebdataminingtechniqueisgiven.Thecontentofstudyanddevelopmentofwebminingisemphasized.Second,thisthesisanalysesthedisadvantagesofalgorithminexistence.Theideathatappliesf
5、ruzzyclusteringtowebminingisaffirmed.Afterward,thedescribingmaterialalgorithmbasedmaximumtreealgorithmforfuzzycluseringisgiven,Andaninstanceofalgorithmisbroughtforwardtoexpoundthisalgorithm.Finally,correctnessofthisalgorithmisprovedintheory.AndthisalgorithmisprovedtohavebeReraccurary,fewerCPUtimean
6、dbetteracalabilitythanothersbytheanalysisofperformance.ItcanbeusedinthefieldofE-business,suchaspersonalized{‘e6and%6recommendation.Keyword:datamining,webusagemining,fuzzyclustering,maximumtree哈爾濱工程大學(xué)學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:本論文的所有工作,是在導(dǎo)師的指導(dǎo)下,由作者本人獨(dú)立完成的。有關(guān)觀點(diǎn)、方法、數(shù)據(jù)和文獻(xiàn)的引用已在文中指出,并與參考文獻(xiàn)相對應(yīng)。除文中已注明引用的內(nèi)容外,本論文不包含任何其
7、他個(gè)人或集體已經(jīng)公開發(fā)表的作品成果。對本文的研究做出重要貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。本人完全意識到本聲明的法律結(jié)果由本人承擔(dān)。作者(簽字):硝墮匙日期:Ⅵ籮年3。月J日墮璽鎏苫堡盔主鎏圭主堡笙塞.1.1課題背景第1章緒論互聯(lián)網(wǎng)的迅速發(fā)展使之已經(jīng)成為商業(yè)活動(dòng)和信息傳播的主要介質(zhì)。隨著電子商務(wù)的蓬勃發(fā)展,迫切需要在線業(yè)務(wù)能夠提供更加人性化、更加安全的服務(wù);而對于決策人員來說,面對海量的商業(yè)數(shù)據(jù),更