基于用戶興趣的web日志挖掘算法

基于用戶興趣的web日志挖掘算法

ID:4124933

大小:553.12 KB

頁數(shù):9頁

時(shí)間:2017-11-29

基于用戶興趣的web日志挖掘算法_第1頁
基于用戶興趣的web日志挖掘算法_第2頁
基于用戶興趣的web日志挖掘算法_第3頁
基于用戶興趣的web日志挖掘算法_第4頁
基于用戶興趣的web日志挖掘算法_第5頁
資源描述:

《基于用戶興趣的web日志挖掘算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、萬方數(shù)據(jù)第15卷第11期計(jì)算機(jī)集成制造系統(tǒng)V01.15No.11209年11月ComputerIntegratedManufacturingSystemsNov.209文奄編號(hào):1006--5911(2009)11—2209一07基于用戶興趣的Web口士口J斷挖掘算法劉慧君,朱慶生,張程,周明強(qiáng)(重慶大學(xué)計(jì)算機(jī)學(xué)院,重慶400044)摘要:為有效地從Web日志中挖掘出用戶訪問模式,在分析用戶訪問行為的基礎(chǔ)上。充分考慮用戶在路徑選擇及在頁面瀏覽中表現(xiàn)出的興趣,提出了路徑選擇興趣度以及頁面瀏覽興趣度的概念。設(shè)計(jì)了路徑選擇

2、興趣矩陣和頁面瀏覽興趣矩陣。并基于兩個(gè)矩陣,設(shè)計(jì)了瀏覽興趣路徑挖掘算法。該算法先通過對(duì)兩個(gè)矩陣進(jìn)行路徑興趣度計(jì)算得到所有的瀏覽興趣子路徑,然后進(jìn)行子路徑合并生成瀏覽興趣路徑。實(shí)驗(yàn)表明r該算法的有效性。關(guān)鍵詞:web日志;瀏覽興趣路徑;興趣度;挖掘算法;電子商務(wù)中圖分類號(hào):TP393文獻(xiàn)標(biāo)識(shí)碼:AWeblogminingalgorithmbasedonuserinterestLJUHui—jun,ZHUQing—sheng,ZHANGCheng,ZHOUMing—qiang(CollegeofComputerScien

3、ce,ChongqingUniversity。Chongqing400044,China)Abstract:Tomineusers’accesspatternfromWeblogseffectively,basedonanalyzingusers’accessactivities,thepath·-selectioninterestmeasureandthepage-browsinginterestmeasurewereproposedbyconsideringinterestsre—-vealedbothinpat

4、hselectionandpagebrowse.AfterthedefinitionofthesetWOconcepts,abrowsinginterestpathsminingalgorithmwasdevisedaccordingtothepath-selectioninterestmatrixandthepage-browsinginterestmatrix.ThesetwomatriceswerefirstlysetupfromWeblogsinthelightofusers’path—selectionan

5、dpage-browsinginter—est,andthenbrowsinginterestsub-pathswerecomputedbythematrices.Finally,browsinginterestpathswereob—rainedbycombinationofallthesub-paths.Effctivenessofthisproposedalgorithmwasprovedbyexperiments.Keywords:Weblog;browsinginterestpaths;interestme

6、asure;miningalgorithm;e-business0引言隨著Internet的迅速發(fā)展,Web服務(wù)器得到廣泛應(yīng)用,而每個(gè)Web站點(diǎn)都收集了海量的Web日志數(shù)據(jù)。Web日志中隱藏著大量有用的信息,研究這些信息可以發(fā)現(xiàn)用戶的瀏覽訪問模式,揭示用戶瀏覽興趣路徑[1屯],從而改進(jìn)網(wǎng)站結(jié)構(gòu),實(shí)現(xiàn)在線推薦訪問口],為客戶提供個(gè)性化服務(wù),為企業(yè)決策提供有價(jià)值的信息。目前,Web使用信息挖掘的研究主要集中在通過分析頁面使用頻度或頁面停留時(shí)間作為用戶的興趣度,從而挖掘用戶瀏覽興趣模式。最大向前序列收稿日期:2008一10

7、一10;修訂日期:2009—03一Ol。Received10Oct.2008;accepted01Mar.2009.基金項(xiàng)目:國家科技攻關(guān)計(jì)劃重點(diǎn)資助項(xiàng)目(2007BAH088040);教育部博士點(diǎn)基金資助項(xiàng)目(20050611027);重慶市科技計(jì)劃資助項(xiàng)目(CsTC2008AC2084);重慶市自然科學(xué)基金資助項(xiàng)目(CSTC2008BB2042)。Foundationitems:ProjectsupportedbytheNationalKeyTechnologiesR&DProgramme,China(No.20

8、07BAH088040).theResearchFundforDoctoralProgramofHigherEducation,China(No.20050611027),theChongqingScienceandTechnologyProgram,China(No.CSTC2008AC2084),andtheChongqingMunicip

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。