資源描述:
《WEB用戶訪問序列模式挖掘》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、天津大學(xué)碩士學(xué)位論文WEB用戶訪問序列模式挖掘姓名:祝效普申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):計(jì)算機(jī)應(yīng)用技術(shù)指導(dǎo)教師:梁洪峻20050101ABSTRACTWebDataMining,includingwebstructuremining,webcontentminingandwebusagemining,isaimportresearchfieldofdatamining.Thewebusagemininggetsthewebuseraccesspatternsbyanalyzingtheaccessinfo
2、rmationrecordedbytheclienttheproxyandthewebserver.TheresultofwebusageminingCallbeusedtoreformthestructureofthewebsite,facilitateusers’browsingandhelptoconfigthewebserver’Sresource.DataWarehouseisaformofdatadecision,whichissubjected-oriented.integrated.
3、stable.a(chǎn)ndtimevariantcollectionofdatainsupportofmanagementdecision.Weanalysistheconcept,structure.designmodelanddesignmethodsol、DataWarehouseinthispaper.Sequentialpatternminingisimportfieldofdatamining.Inthispaperweintroducethemainsequentialpatternmini
4、ngalgorithmandgiveaimpovedPreefixspanalgorithm.WeuseafactconstellationschematOestablishaDataWarehouseandthentOapplyOLAPonit.FinallyweimplementthesequentialpatternminingalgorithmontheDataWarehouseandanalysisthedataminingresults.KEYWORDS:DataMining,DataW
5、arehouse,SequentialPatternMining-WebMining獨(dú)創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作和取得的研究成果,除了文中特別加以標(biāo)注和致謝之處外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得鑫鲞盤鱟或其他教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對(duì)本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說明并表示了謝意。學(xué)位論文作者簽名:裁私汽簽字日期:冊(cè)?月)。同學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解叁凄態(tài)鱟有關(guān)保留、使用
6、學(xué)位論文的規(guī)定。特授權(quán)墨壅盤莖可以將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,并采用影印、縮印或掃描等復(fù)制手段保存、匯編以供查閱和借閱。同意學(xué)校向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和磁盤。(保密的學(xué)位論文在解密后適用本授權(quán)晚明)學(xué)位論文作者簽名:和敬騫導(dǎo)師簽名擎秀竣簽字日期:、孵2月w日簽字日期:彬年2月1一日天津大學(xué)碩士學(xué)位論文第一章蘸著第一章前言近十幾年,隨著科學(xué)技術(shù)飛速的發(fā)展,經(jīng)濟(jì)和社會(huì)都取得了極大的進(jìn)步,與此同時(shí),在各個(gè)領(lǐng)域產(chǎn)生了大贊的數(shù)據(jù),壹霹人類對(duì)太空的探索,銀行每天的巨額交易數(shù)據(jù)
7、。顯然在這些數(shù)據(jù)中豐富的信息,如何姣理這些數(shù)據(jù)得到有益的信息,人們進(jìn)行了有益的探索。計(jì)算機(jī)技術(shù)的迅速發(fā)展使得處理數(shù)據(jù)成為可能,這就推動(dòng)了數(shù)據(jù)庫技術(shù)的極大發(fā)展,但是面對(duì)不斷增加如潮水般的數(shù)據(jù),人們不再滿足于數(shù)據(jù)露的查詢功能,提出了深層次翊題:能不熊從數(shù)據(jù)中提取信息或者知識(shí)為決策服務(wù)。就數(shù)據(jù)庫技術(shù)而言已經(jīng)顯得無能為力了,同樣,傳統(tǒng)的統(tǒng)計(jì)技術(shù)也面臨了極大的挑戰(zhàn)。這就急需有新的方法柬處理這些海量般的數(shù)豁。予是,人們結(jié)合統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫、機(jī)器學(xué)習(xí)等技術(shù),提出數(shù)據(jù)挖掘來解決這一一J難題。1.1數(shù)據(jù)挖掘1.1.1數(shù)
8、據(jù)挖掘概述隨羞數(shù)攄庫技術(shù)的不斷發(fā)展及數(shù)據(jù)庫管理系統(tǒng)的廣泛應(yīng)用,數(shù)據(jù)庫中存儲(chǔ)的數(shù)據(jù)量急劇增大,在大量的數(shù)據(jù)背后隱藏著許多熏要的信息,如果能把這些信息從數(shù)據(jù)庫中描取出來,將為公司創(chuàng)造很多潛在的利潤,而這平孛從海量數(shù)據(jù)庫中挖掇信息的技術(shù),就稱之為數(shù)據(jù)挖掘。數(shù)據(jù)挖掘工具能夠?qū)淼内厔莺托袨檫M(jìn)行預(yù)測,從而很好地支持人們的決策,比如,經(jīng)過對(duì)公司整個(gè)數(shù)據(jù)庫系統(tǒng)的分析,數(shù)據(jù)挖掘工具可以回答諸如“哪個(gè)客戶對(duì)我們公司的郵件接銷活渤最有可能作出反應(yīng),為骨么”等類似的問題。有些數(shù)據(jù)挖掘工具