資源描述:
《基于用戶興趣的web日志挖掘算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、萬方數(shù)據(jù)第15卷第11期計(jì)算機(jī)集成制造系統(tǒng)V01.15No.11209年11月ComputerIntegratedManufacturingSystemsNov.209文奄編號(hào):1006--5911(2009)11—2209一07基于用戶興趣的Web口士口J斷挖掘算法劉慧君,朱慶生,張程,周明強(qiáng)(重慶大學(xué)計(jì)算機(jī)學(xué)院,重慶400044)摘要:為有效地從Web日志中挖掘出用戶訪問模式,在分析用戶訪問行為的基礎(chǔ)上。充分考慮用戶在路徑選擇及在頁面瀏覽中表現(xiàn)出的興趣,提出了路徑選擇興趣度以及頁面瀏覽興趣度的概念。設(shè)計(jì)了路徑選擇
2、興趣矩陣和頁面瀏覽興趣矩陣。并基于兩個(gè)矩陣,設(shè)計(jì)了瀏覽興趣路徑挖掘算法。該算法先通過對(duì)兩個(gè)矩陣進(jìn)行路徑興趣度計(jì)算得到所有的瀏覽興趣子路徑,然后進(jìn)行子路徑合并生成瀏覽興趣路徑。實(shí)驗(yàn)表明r該算法的有效性。關(guān)鍵詞:web日志;瀏覽興趣路徑;興趣度;挖掘算法;電子商務(wù)中圖分類號(hào):TP393文獻(xiàn)標(biāo)識(shí)碼:AWeblogminingalgorithmbasedonuserinterestLJUHui—jun,ZHUQing—sheng,ZHANGCheng,ZHOUMing—qiang(CollegeofComputerScien
3、ce,ChongqingUniversity。Chongqing400044,China)Abstract:Tomineusers’accesspatternfromWeblogseffectively,basedonanalyzingusers’accessactivities,thepath·-selectioninterestmeasureandthepage-browsinginterestmeasurewereproposedbyconsideringinterestsre—-vealedbothinpat
4、hselectionandpagebrowse.AfterthedefinitionofthesetWOconcepts,abrowsinginterestpathsminingalgorithmwasdevisedaccordingtothepath-selectioninterestmatrixandthepage-browsinginterestmatrix.ThesetwomatriceswerefirstlysetupfromWeblogsinthelightofusers’path—selectionan
5、dpage-browsinginter—est,andthenbrowsinginterestsub-pathswerecomputedbythematrices.Finally,browsinginterestpathswereob—rainedbycombinationofallthesub-paths.Effctivenessofthisproposedalgorithmwasprovedbyexperiments.Keywords:Weblog;browsinginterestpaths;interestme
6、asure;miningalgorithm;e-business0引言隨著Internet的迅速發(fā)展,Web服務(wù)器得到廣泛應(yīng)用,而每個(gè)Web站點(diǎn)都收集了海量的Web日志數(shù)據(jù)。Web日志中隱藏著大量有用的信息,研究這些信息可以發(fā)現(xiàn)用戶的瀏覽訪問模式,揭示用戶瀏覽興趣路徑[1屯],從而改進(jìn)網(wǎng)站結(jié)構(gòu),實(shí)現(xiàn)在線推薦訪問口],為客戶提供個(gè)性化服務(wù),為企業(yè)決策提供有價(jià)值的信息。目前,Web使用信息挖掘的研究主要集中在通過分析頁面使用頻度或頁面停留時(shí)間作為用戶的興趣度,從而挖掘用戶瀏覽興趣模式。最大向前序列收稿日期:2008一10
7、一10;修訂日期:2009—03一Ol。Received10Oct.2008;accepted01Mar.2009.基金項(xiàng)目:國家科技攻關(guān)計(jì)劃重點(diǎn)資助項(xiàng)目(2007BAH088040);教育部博士點(diǎn)基金資助項(xiàng)目(20050611027);重慶市科技計(jì)劃資助項(xiàng)目(CsTC2008AC2084);重慶市自然科學(xué)基金資助項(xiàng)目(CSTC2008BB2042)。Foundationitems:ProjectsupportedbytheNationalKeyTechnologiesR&DProgramme,China(No.20
8、07BAH088040).theResearchFundforDoctoralProgramofHigherEducation,China(No.20050611027),theChongqingScienceandTechnologyProgram,China(No.CSTC2008AC2084),andtheChongqingMunicip