資源描述:
《【論文】基于Web日志的實時推薦模型研究.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、工程碩士學(xué)位論文基于Web日志的實時推薦模型研究AReal-TimeRecommendationModelBasedonWebLog摘要隨著WWW的廣泛應(yīng)用,在WWW服務(wù)器上聚集了大量的Web日志,這些數(shù)據(jù)在很多領(lǐng)域中都至關(guān)重要,如Web站點的系統(tǒng)設(shè)計、商業(yè)市場策略和網(wǎng)站個性化等等。實時推薦就是數(shù)據(jù)挖掘在Web日志數(shù)據(jù)中的一個應(yīng)用,其目的是方便用戶對網(wǎng)站的訪問,可以預(yù)測用戶的喜好,并為電子商務(wù)提供決策依據(jù)。本文在概述Web挖掘以及Web日志挖掘的相關(guān)領(lǐng)域的發(fā)展和技術(shù)及其理論基礎(chǔ)上,詳細(xì)研究了Web日志挖掘的預(yù)處理技術(shù),使用一個基于頁面訪問時間閾
2、值與會話重組的會話識別算法,并通過實際的Web日志數(shù)據(jù)加以驗證;在數(shù)據(jù)預(yù)處理的基礎(chǔ)上,利用模糊聚類技術(shù),根據(jù)用戶對Web頁面的瀏覽情況分別建立Web用戶和Web頁面的模糊集,然后用最大-最小法的模糊相似性度量構(gòu)造模糊相似矩陣,并由此構(gòu)造了模糊動態(tài)聚類算法;在上述工作的基礎(chǔ)上,設(shè)計了一個基于Web日志挖掘的實時推薦模型系統(tǒng)RTRS(real-timerecommendationsystem)。它分為離線部件和在線部件兩部分,其中,前者進(jìn)行數(shù)據(jù)收集、預(yù)處理、用戶和頁面的模糊聚類;后者根據(jù)用戶當(dāng)前訪問行為生成推薦集,它采用的推薦算法是通過用戶的訪問記
3、錄構(gòu)造BP樹(BrowsPatternTree),產(chǎn)生頻繁訪問集,從而生成推薦集,該算法只需掃描數(shù)據(jù)庫一次,得到的頻繁序列模式可以滿足實時推薦的快速需求。該論文有圖10幅,表7個,參考文獻(xiàn)52篇。關(guān)鍵詞:數(shù)據(jù)挖掘;數(shù)據(jù)預(yù)處理;會話識別;模糊聚類;實時推薦AbstractWiththeextensiveuseofWWW,theWWWserverhasassembledalargenumberofWeblogs,thesedataarecrucialinmanyfields,suchastheWebsite,systemdesign,busines
4、smarketingstrategiesandWebsitepersonalizationandsoon.Real-timerecommendationisaWebapplicationofdatamininginlogdatainwhichaimstofacilitateuserstoaccessthesite,youcanpredicttheuser'spreferences,andofferbasis.formakinge-commercedecision.Onthebasisofanoverviewofrelatedareasofdev
5、elopmentandtechnologyaswellastheoreticalbasisofWebminingandWeblogmining,thispapermadeadetailedstudyoftheWeblogminingpreprocessingtechniques,usingathresholdbasedonpageaccesstimeofthesessionwithasessionre-recognitionalgorithm,inspectingandverifyingthroughtheactualWeblogdata,on
6、thebasisofthedatapreprocessing,usingfuzzyclusteringtechnique,establishingWebusersandWebpagesofthefuzzysetbasedonuserbrowsingofWebpages,thenusingthemaximum-minimizationoffuzzysimilaritymeasuretoconstructfuzzysimilarmatrixsoastoconstructfuzzydynamicclusteringalgorithm.Basedont
7、heabove-mentionedwork,thepaperdesignedareal-timerecommendationmodelsystemRTRS(real-timerecommendationsystem)basedonWeb-logminingthatisdividedintotwoparts,offlinepartandonlinepart,inwhichtheformerisfordatacollection,preprocessing,userandpageofthefuzzyclustering;andthelatteris
8、formedintorecommendationset,accordingtousercurrentaccessbehavior,forthereco