基于web日志的若干挖掘算法及其應(yīng)用研究

基于web日志的若干挖掘算法及其應(yīng)用研究

ID:33299742

大?。?.50 MB

頁(yè)數(shù):53頁(yè)

時(shí)間:2019-02-23

基于web日志的若干挖掘算法及其應(yīng)用研究_第1頁(yè)
基于web日志的若干挖掘算法及其應(yīng)用研究_第2頁(yè)
基于web日志的若干挖掘算法及其應(yīng)用研究_第3頁(yè)
基于web日志的若干挖掘算法及其應(yīng)用研究_第4頁(yè)
基于web日志的若干挖掘算法及其應(yīng)用研究_第5頁(yè)
資源描述:

《基于web日志的若干挖掘算法及其應(yīng)用研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)

1、東南大學(xué)碩士學(xué)位論文基于Web日志的若干挖掘算法及其應(yīng)用研究姓名:顧海花申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):計(jì)算機(jī)應(yīng)用技術(shù)指導(dǎo)教師:孫志揮20080818摘要Web日志挖掘是Web挖掘領(lǐng)域中的一個(gè)重要應(yīng)用研究方向。為用戶提供一個(gè)不僅內(nèi)容豐富而且方便實(shí)用的網(wǎng)站,以更有效地進(jìn)行網(wǎng)上瀏覽,這是每個(gè)網(wǎng)站所追求的目標(biāo)。此外,Web站點(diǎn)能否實(shí)現(xiàn)個(gè)性化,為用戶提供個(gè)性化的服務(wù),亦已成為衡量站點(diǎn)能否成功的重要因素。通過(guò)挖掘Web日志,可以發(fā)現(xiàn)用戶的訪問(wèn)模式,對(duì)優(yōu)化站點(diǎn)結(jié)構(gòu)和為用戶提供個(gè)性化服務(wù)具有重要的意義。本文介紹了Web數(shù)據(jù)挖掘的產(chǎn)生背景,簡(jiǎn)要地闡述了數(shù)據(jù)挖掘技術(shù)與Web數(shù)據(jù)挖掘的一般技術(shù)、方法和

2、策略,對(duì)Web日志數(shù)據(jù)挖掘過(guò)程及其中各環(huán)節(jié)的關(guān)鍵技術(shù)進(jìn)行了比較深入的探討。在分析Web日志記錄結(jié)構(gòu)及含義的基礎(chǔ)上,結(jié)合相關(guān)課題的研究任務(wù),并以南京信息職業(yè)技術(shù)學(xué)院WWw站點(diǎn)的需求為背景,對(duì)Web日志的若干算法及研究進(jìn)行了研究,并結(jié)合挖掘結(jié)果給出了優(yōu)化設(shè)計(jì)建議,主要工作如下:1)介紹了Web日志挖掘的相關(guān)基本概念,著重研究了Web日志挖掘中的數(shù)據(jù)預(yù)處理過(guò)程,將Frame頁(yè)面過(guò)濾技術(shù)運(yùn)用到預(yù)處理過(guò)程中;2)對(duì)Web日志若干挖掘算法進(jìn)行了研究,介紹了將數(shù)據(jù)挖掘領(lǐng)域的關(guān)聯(lián)規(guī)則挖掘、序列型式挖掘、聚類等挖掘方法應(yīng)用于Web日志的具體方法和過(guò)程,研究了利用路徑遍歷模式挖掘方法來(lái)發(fā)現(xiàn)用戶

3、瀏覽模式的過(guò)程;3)介紹了Web日志挖掘結(jié)果的應(yīng)用,利用挖掘出的規(guī)則和模式,對(duì)Web站點(diǎn)的結(jié)構(gòu)和站點(diǎn)內(nèi)頁(yè)面進(jìn)行調(diào)整的改善,并根據(jù)用戶的瀏覽情況.自動(dòng)生成導(dǎo)航提示。關(guān)鍵詞:數(shù)據(jù)挖掘Web日志頁(yè)面過(guò)濾路徑遍歷模式訪問(wèn)模式ABSTRACTDataminingbasedonWebLogisamainaspectofWebmining.HowtomakethetlesrsfindtheinformationtheyareinterestedinmorequicklyandexpedientlyistheaimofeveryWebsite.Ifthesite’Scapabilityis

4、improved,itwillattractmoreuserstovisitit.AndwhetherthesiteCanprovidetheindividuationserviceisanimportantfactortoestimateit.Throughdatamining011Weblog,wecanfindtheuserstraversalmode.Itwillhelp惦toimprovethesite’Sstructureandprovidethebetterseivicetotheusers.Thispaperintroduce‘thebackgroundof

5、Webdatamining,systematicallyexpands,thetechnique,theoryandstrategy,makingadeeperdiscussiononthekeytechniqueoftheprocessinWeblogmining.BasedondataminingontheWebLogofthewebsiteofNanjingCollegeofInformationTechnology,someoptimizationdesigningsuggestionsaleproposed.Theworksalefollowing:1)There

6、levanceclassicalconceptofWebLogminingaleintroduced.IntheWeblogpreprocessingaspect,haveproposedonekindimprovesresultmethodofpreprocessed--framepagefilterstechnology.2)SomealgorithmsofWebLogminingaleintroduced.Transactionmodelesarcconstructedfortheapplicationofvariousdataminingtaskssuchasthe

7、discoveryofassociatonrules,sequentialpatternsandsoon,andtheconcretemethodsandcoursesduringtheirapplicationaregiven.Amethodcalledpathtraversalpatternsisalsoreferencedtodiscoveruseraccesspatterms.3)Finally,therulesandpattermsacquiredastheresultofWeblogmingingare

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。