web用戶訪問聚類模式研究

web用戶訪問聚類模式研究

ID:33799971

大小:4.10 MB

頁數(shù):60頁

時(shí)間:2019-03-01

web用戶訪問聚類模式研究_第1頁
web用戶訪問聚類模式研究_第2頁
web用戶訪問聚類模式研究_第3頁
web用戶訪問聚類模式研究_第4頁
web用戶訪問聚類模式研究_第5頁
資源描述:

《web用戶訪問聚類模式研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫

1、西安電子科技大學(xué)碩士學(xué)位論文Web用戶訪問聚類模式研究姓名:杜立平申請學(xué)位級別:碩士專業(yè):計(jì)算機(jī)技術(shù)指導(dǎo)教師:劉志鏡;趙耿20100408摘要摘要隨著因特網(wǎng)的快速發(fā)展,海量的Web數(shù)據(jù)資源已經(jīng)成為人們獲取信息的重要來源。但是,由于Web資源所具有的一些特性,用戶很難快速而準(zhǔn)確地獲取真正有價(jià)值的信息,由此產(chǎn)生了數(shù)據(jù)挖掘的概念。這種用于決策支持的新技術(shù),能夠利用已有的數(shù)據(jù)對未來的活動(dòng)進(jìn)行預(yù)測,并最終為用戶提供方便的定制信息服務(wù)?,F(xiàn)已成為一個(gè)新的重要的研究方向。本文系統(tǒng)、完整地論述了Web事務(wù)聚類分析的兩個(gè)階段,即數(shù)據(jù)預(yù)處理和

2、聚類分析階段。其中數(shù)據(jù)預(yù)處理階段又包括日志解析、數(shù)據(jù)清洗、用戶識(shí)別和事務(wù)識(shí)別四個(gè)過程;同時(shí),論文在此階段引入了“概念URL”,以獲得容易理解的聚類結(jié)果。在聚類分析階段,本文結(jié)合蟻群優(yōu)化的原理,建立了人工螞蟻模型,并基于該模型實(shí)現(xiàn)了蟻群聚類分析算法。另外,本文還在聚類分析過程中使用了K均值算法,并比較了蟻群算法和K均值算法在Web事務(wù)聚類分析上的優(yōu)劣。采用某學(xué)院Web服務(wù)器日志作為數(shù)據(jù)集的試驗(yàn)表明,本文的技術(shù)和方法能夠獲得質(zhì)量良好的聚類結(jié)果。關(guān)鍵詞:數(shù)據(jù)挖掘Web挖掘概念URLK均值蟻群算法AbstractAbstract

3、AlongwithInternet'srapiddevelopment,theenormousWebdataresourceshavealreadybecomeanimportantoriginforpeopletoobtaininformation.But,itisveryhardforuserstogainthetrueandvaluableinformationrapidlyandaccuratelyduetotheWebresources’traits,sotheconceptofdataminingispres

4、ented.Asanewtechnology,dataMiningisappliedtoDecisionSupportSystem,andevencanmakepredictionbasedonhistoricdata.Itcanfinallyprovidetheconvenientcustom-madeservicestotheusers.Nowithasalreadybecomeanewandimportantresearchdirection.Thispaperdiscussesthetwophases,which

5、aredatapreprocessingandclusteringanalysis,inWebtransactionsclusteringanalysisinasystematicandcompleteview.Thedatapreprocessingphasealsocontainstheproceduresoflogfileinterpretation,datawashing,useridentificationandtransactionidentification;atthesametime,inordertog

6、ainaneasilyinterpretedresult,thepaperintroducesthe“ConceptURL”inthisphase.Inclusteringphase,amodelofartificialantissetup.Basedonthismodel,thepaperimplementsanantcolonyclusteringalgorithm.What’smore,k-meansalgorithmisalsoimplementedinclusteringanalysisphase.Theres

7、ultiscomparedwiththatofantcolonyalgorithm.Experimentresultsarepresentedonweblogsofacertaincollegetoillustratethetechniquesandmethods.Thequalityofresultsisgood.Keyword:Data-miningWeb-miningConceptURLk-meansAntColonyAlgorithm西安電子科技大學(xué)學(xué)位論文獨(dú)創(chuàng)性(或創(chuàng)新性)聲明秉承學(xué)校嚴(yán)謹(jǐn)?shù)膶W(xué)風(fēng)和優(yōu)良的科學(xué)道德

8、,本人聲明所呈交的論文是我個(gè)人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝中所羅列的內(nèi)容以外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果;也不包含為獲得西安電子科技大學(xué)或其它教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻(xiàn)均已在論文中做了明確的說明并表

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。