資源描述:
《基于web日志的若干挖掘算法及其應(yīng)用研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、東南大學(xué)碩士學(xué)位論文基于Web日志的若干挖掘算法及其應(yīng)用研究姓名:顧海花申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):計(jì)算機(jī)應(yīng)用技術(shù)指導(dǎo)教師:孫志揮20080818摘要Web日志挖掘是Web挖掘領(lǐng)域中的一個(gè)重要應(yīng)用研究方向。為用戶提供一個(gè)不僅內(nèi)容豐富而且方便實(shí)用的網(wǎng)站,以更有效地進(jìn)行網(wǎng)上瀏覽,這是每個(gè)網(wǎng)站所追求的目標(biāo)。此外,Web站點(diǎn)能否實(shí)現(xiàn)個(gè)性化,為用戶提供個(gè)性化的服務(wù),亦已成為衡量站點(diǎn)能否成功的重要因素。通過(guò)挖掘Web日志,可以發(fā)現(xiàn)用戶的訪問(wèn)模式,對(duì)優(yōu)化站點(diǎn)結(jié)構(gòu)和為用戶提供個(gè)性化服務(wù)具有重要的意義。本文介紹了Web數(shù)據(jù)挖掘的產(chǎn)生背景,簡(jiǎn)要地闡述了數(shù)據(jù)挖掘技術(shù)與Web數(shù)據(jù)挖掘的一般技術(shù)、方法和
2、策略,對(duì)Web日志數(shù)據(jù)挖掘過(guò)程及其中各環(huán)節(jié)的關(guān)鍵技術(shù)進(jìn)行了比較深入的探討。在分析Web日志記錄結(jié)構(gòu)及含義的基礎(chǔ)上,結(jié)合相關(guān)課題的研究任務(wù),并以南京信息職業(yè)技術(shù)學(xué)院WWw站點(diǎn)的需求為背景,對(duì)Web日志的若干算法及研究進(jìn)行了研究,并結(jié)合挖掘結(jié)果給出了優(yōu)化設(shè)計(jì)建議,主要工作如下:1)介紹了Web日志挖掘的相關(guān)基本概念,著重研究了Web日志挖掘中的數(shù)據(jù)預(yù)處理過(guò)程,將Frame頁(yè)面過(guò)濾技術(shù)運(yùn)用到預(yù)處理過(guò)程中;2)對(duì)Web日志若干挖掘算法進(jìn)行了研究,介紹了將數(shù)據(jù)挖掘領(lǐng)域的關(guān)聯(lián)規(guī)則挖掘、序列型式挖掘、聚類等挖掘方法應(yīng)用于Web日志的具體方法和過(guò)程,研究了利用路徑遍歷模式挖掘方法來(lái)發(fā)現(xiàn)用戶
3、瀏覽模式的過(guò)程;3)介紹了Web日志挖掘結(jié)果的應(yīng)用,利用挖掘出的規(guī)則和模式,對(duì)Web站點(diǎn)的結(jié)構(gòu)和站點(diǎn)內(nèi)頁(yè)面進(jìn)行調(diào)整的改善,并根據(jù)用戶的瀏覽情況.自動(dòng)生成導(dǎo)航提示。關(guān)鍵詞:數(shù)據(jù)挖掘Web日志頁(yè)面過(guò)濾路徑遍歷模式訪問(wèn)模式ABSTRACTDataminingbasedonWebLogisamainaspectofWebmining.HowtomakethetlesrsfindtheinformationtheyareinterestedinmorequicklyandexpedientlyistheaimofeveryWebsite.Ifthesite’Scapabilityis
4、improved,itwillattractmoreuserstovisitit.AndwhetherthesiteCanprovidetheindividuationserviceisanimportantfactortoestimateit.Throughdatamining011Weblog,wecanfindtheuserstraversalmode.Itwillhelp惦toimprovethesite’Sstructureandprovidethebetterseivicetotheusers.Thispaperintroduce‘thebackgroundof
5、Webdatamining,systematicallyexpands,thetechnique,theoryandstrategy,makingadeeperdiscussiononthekeytechniqueoftheprocessinWeblogmining.BasedondataminingontheWebLogofthewebsiteofNanjingCollegeofInformationTechnology,someoptimizationdesigningsuggestionsaleproposed.Theworksalefollowing:1)There
6、levanceclassicalconceptofWebLogminingaleintroduced.IntheWeblogpreprocessingaspect,haveproposedonekindimprovesresultmethodofpreprocessed--framepagefilterstechnology.2)SomealgorithmsofWebLogminingaleintroduced.Transactionmodelesarcconstructedfortheapplicationofvariousdataminingtaskssuchasthe
7、discoveryofassociatonrules,sequentialpatternsandsoon,andtheconcretemethodsandcoursesduringtheirapplicationaregiven.Amethodcalledpathtraversalpatternsisalsoreferencedtodiscoveruseraccesspatterms.3)Finally,therulesandpattermsacquiredastheresultofWeblogmingingare