web日志挖掘應(yīng)用研究

web日志挖掘應(yīng)用研究

ID:32978369

大小:4.10 MB

頁(yè)數(shù):55頁(yè)

時(shí)間:2019-02-18

web日志挖掘應(yīng)用研究_第1頁(yè)
web日志挖掘應(yīng)用研究_第2頁(yè)
web日志挖掘應(yīng)用研究_第3頁(yè)
web日志挖掘應(yīng)用研究_第4頁(yè)
web日志挖掘應(yīng)用研究_第5頁(yè)
資源描述:

《web日志挖掘應(yīng)用研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)

1、桂林理工大學(xué)碩士學(xué)位論文Web日志挖掘應(yīng)用研究姓名:金驊申請(qǐng)學(xué)位級(jí)別:碩士專(zhuān)業(yè):計(jì)算機(jī)應(yīng)用技術(shù)指導(dǎo)教師:陳基漓20090401桂林理工大學(xué)碩士學(xué)位論文摘要伴隨著Internet技術(shù)的發(fā)展,www的應(yīng)用也越來(lái)越多,Web站點(diǎn)越來(lái)越普及。在當(dāng)前競(jìng)爭(zhēng)激烈的網(wǎng)絡(luò)經(jīng)濟(jì)中,只有贏得用戶才能獲得競(jìng)爭(zhēng)中的優(yōu)勢(shì)??蛻魹g覽行為的數(shù)字化,使得通過(guò)收集大量用戶瀏覽行為數(shù)據(jù)來(lái)深入研究客戶行為變?yōu)榭赡堋H绾卫眠@個(gè)機(jī)會(huì),從這些“無(wú)意義’’并且繁瑣的數(shù)據(jù)中得到有價(jià)值知識(shí)和信息成為目前面臨的最緊要的問(wèn)題之一。為了解決這個(gè)問(wèn)題Web數(shù)據(jù)挖掘技

2、術(shù)誕生了。本文介紹了Internet的發(fā)展?fàn)顩r及Web數(shù)據(jù)挖掘的產(chǎn)生背景,系統(tǒng)地闡述了數(shù)據(jù)挖掘技術(shù)與Web數(shù)據(jù)挖掘的思想、理論、技術(shù)、方法和策略,對(duì)Web日志數(shù)據(jù)挖掘過(guò)程及其中各環(huán)節(jié)的關(guān)鍵技術(shù)進(jìn)行了深入的探討,重點(diǎn)研究了Web日志挖掘的數(shù)據(jù)預(yù)處理技術(shù)和關(guān)聯(lián)規(guī)則及基于關(guān)聯(lián)規(guī)則的算法。Web日志數(shù)據(jù)預(yù)處理方面,在分析比較各種方法基礎(chǔ)上,設(shè)計(jì)出相關(guān)數(shù)據(jù)庫(kù)表,并給出了簡(jiǎn)明清晰的算法實(shí)現(xiàn)。在關(guān)聯(lián)規(guī)則及基于關(guān)聯(lián)規(guī)則算法研究方面,本文分析了經(jīng)典的基于關(guān)聯(lián)規(guī)則的挖掘算法Apriori的特點(diǎn),找出算法存在的不足,并對(duì)其進(jìn)行了改

3、進(jìn)和優(yōu)化,使其具有更高的效率。最后對(duì)Web服務(wù)器的日志記錄進(jìn)行挖掘?qū)嶒?yàn),得到較為理想的結(jié)果。關(guān)鍵詞:Web數(shù)據(jù)挖掘,關(guān)聯(lián)規(guī)則,Web日志預(yù)處理,Apriori算法桂林理工大學(xué)碩士學(xué)位論文AbstractWiththedevelopmentofthetechnologyinthefieldofinternet,1j

4、n唧becomesmoreandmorepopular.Asaresult,manywebsitesarebeingbuilt。Astheviolentcompetitionintheinterne

5、teconomy,onlytheonewhoattractsthecustomerscan.survive.Thebehaviorsofthecustomersbecomedigital,whichmakesitpossibletocollectalotofdatainordertofurtherinvestigatethebehaviorofthecustomers.OneofthemostimportantproblemswhichweconfrontiShowtofindthevaluableandun

6、derstandableinformationfromthe“nosense”andboringdata.ThetechnologyofWebdataminingisamethodtosolvethisproblem.Thispaperintroducesthestatusofthedevelopmentofinternetandthebackgroundofwebdataminingandsystematicallyexpatiatethetechnique,theoryandstrategy,making

7、adeeperdiscussiononthekeytechniqueoftheprocessinwebdatamining,mainlyfocusedonthepreprocessandassociationrulealgorithIIr—Apriori.Fortheaspectofweblogpreprocessing,designthedatabasetableandrealizetheprocessofthealgorithmbycomparingallkindsofmethodsexisted.For

8、theassociationrule,thispaperanalyzestheclassicalcharacterofApriorialgorithm,findingoutthedisadvantageofthealgorithmandraisetheimprovementplan.Atlast,puttheimprovedalgorithminuseofanalyzingtheWeblogandgetabetterresult.KeyWords:WebMining,AssociationRule,DataP

9、reprocessing,ApriorilI研究生學(xué)位論文獨(dú)創(chuàng)性聲明和版權(quán)使用授權(quán)書(shū)獨(dú)創(chuàng)性聲明本人聲明:所呈交的論文是本人在陳基漓導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。據(jù)我所知,除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含他人已經(jīng)發(fā)表或撰寫(xiě)過(guò)的研究成果,也不包含為獲得其它教育機(jī)構(gòu)的學(xué)位或證書(shū)而使用過(guò)的材料。對(duì)論文的完成提供過(guò)幫助的有關(guān)人員已在論文中作了明確的說(shuō)明并表示謝意。學(xué)位論文作者(簽字

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。