資源描述:
《基于用戶瀏覽興趣的web使用模式挖掘》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、華中科技大學(xué)碩士學(xué)位論文基于用戶瀏覽興趣的Web使用模式挖掘姓名:卿青申請學(xué)位級別:碩士專業(yè):計算機(jī)技術(shù)指導(dǎo)教師:李玉華20061105華中科技大學(xué)碩士學(xué)位論文摘要由于Web上的信息具有數(shù)量龐大、無序性強(qiáng),重復(fù)性大的特點(diǎn),人們現(xiàn)在還不能迅速、方便地從Web所包含的大量信息中獲取所需要的信息。Web挖掘是傳統(tǒng)數(shù)據(jù)挖掘技術(shù)在Web環(huán)境下的應(yīng)用,試圖從大量的Web文檔集合和用戶瀏覽Web的數(shù)據(jù)信息中發(fā)現(xiàn)蘊(yùn)涵的、未知的、有潛在應(yīng)用價值的、非平凡的模式。Web挖掘分為Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘和Web使用模式挖掘。Web使用模式挖掘是從用戶瀏覽網(wǎng)站的數(shù)據(jù)中抽取感興趣的模式,理
2、解用戶的瀏覽興趣行為,以便進(jìn)~步改善網(wǎng)站結(jié)構(gòu)或?yàn)橛脩籼峁﹤€性化的服務(wù)。對Web使用模式挖掘的數(shù)據(jù)采集、用戶瀏覽興趣的度量和表達(dá)兩個方面進(jìn)行了研究,主要的工作有:分析了現(xiàn)有Web使用模式挖掘的數(shù)據(jù)采集方式,指出了當(dāng)前數(shù)據(jù)采集方式的不足,如由于Ir兀甲協(xié)議的無狀態(tài)連接而難以在Web日志中得到準(zhǔn)確的用戶瀏覽信息。采用了一種綜合利用服務(wù)器日志文件和客戶端數(shù)據(jù)獲取用戶瀏覽信息的方法。興趣是指個人對客觀事物的選擇性態(tài)度,有效地度量用戶瀏覽興趣是Web使用模式挖掘的基礎(chǔ)。針對Web使用模式挖掘領(lǐng)域,首先分析了已有的度量用戶瀏覽興趣方式的不足之處,如度量方式過于簡單而導(dǎo)致不能更好地區(qū)分
3、用戶感興趣類與不感興趣類;沒有考慮頁面信息量對用戶瀏覽時長的影響等。在此基礎(chǔ)上,采用了一種基于用戶瀏覽行為度量用戶瀏覽興趣的方法。如何有效地表達(dá)用戶瀏覽興趣是Web使用模式挖掘研究的方向之一。在分析了現(xiàn)有的表達(dá)用戶瀏覽興趣方式的基礎(chǔ)上,采用了一種基于樹形結(jié)構(gòu)表達(dá)用戶瀏覽興趣的方式。關(guān)鍵詞:數(shù)據(jù)挖掘,Web挖掘,瀏覽興趣,個性化推薦華中科技大學(xué)碩士學(xué)位論文AsWebinformationisofgreatamount,strongorderlessness,hJ【ghrepeatability,peoplecannotgettheinformationtheyneedfr
4、omWebquicklyandconveniently.WebminingisthetraditionaldataminingtechnologyusedinWeb,attemptingtofindimplicative,unknown,andnon·trivialschemawMchhaspotentialapplicationfromtheinnumerableWebfileassemblyandthedatainformationwhichCallbegottenwhentheuserbrowseWeb.Webusingschemamininggetstheint
5、erestingschemafromthedatatheuserbrowsed,andapprehendtheuserVsbrowseinterestbehavior,inordertoimprovetheWebsite'sstructureorprovideindividualservicefortheuser,ThispaperisdedicatedtoWebschemamining’sdataacquisitionmode,themeasurementandexpressingofuser'sbrowseinterest,andthemaintasksareasf
6、ollows:AnalysingthepresentdataacquisitionfashionofWebschemamining,pointingouttheshortageofthepresentdataacquisitionfashion,Forexample,be4盟usethenon—statelinkofHmitisdifficulttogetexactinformationofuser’sbrowsefromWeblog:proposingamethodwhichcomprehensivelyusetheservicelogfileandtheclient
7、enddatatogettheuser’sbrowseinformation.Theinterestistheselectivityattitudeofobjectivematterofaperson,andmeasuringuser’SbrowseinterestexactlyisthebaseofWebschemamining.AccordingtothefiledofWebusageschemamining,thispaperanalysesthepresenttheshortageofthestyleofmeasureandexp