web日志聚類分析及應(yīng)用

web日志聚類分析及應(yīng)用

ID:33179568

大?。?.18 MB

頁數(shù):57頁

時(shí)間:2019-02-21

web日志聚類分析及應(yīng)用_第1頁
web日志聚類分析及應(yīng)用_第2頁
web日志聚類分析及應(yīng)用_第3頁
web日志聚類分析及應(yīng)用_第4頁
web日志聚類分析及應(yīng)用_第5頁
資源描述:

《web日志聚類分析及應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、分類號(hào)單位代碼學(xué)號(hào)功縈六了碩士學(xué)位論文論文題目日志聚類分析及應(yīng)用作者姓名湯國(guó)行專業(yè)計(jì)算機(jī)軟件與理論指導(dǎo)教師姓名專業(yè)技術(shù)職務(wù)趙合計(jì)副教授年月日山東大學(xué)碩士學(xué)位論文旦旦魚魚旦里魚魚旦旦魚旦旦魚魚魚旦魚魚旦坦魚魚魚旦旦魚魚旦魚魚魚里魚魚魚旦魚魚魚旦魚魚魚旦魚魚魚旦魚魚魚旦旦魚魚旦旦魚旦旦魚魚夕旦魚魚甲魚魚魚魚魚魚坦魚魚魚旦魚魚魚里魚魚魚里魚魚魚旦旦魚魚旦旦魚魚旦旦魚魚旦目錄摘……,……,……要……,…‘,二、……、………第……、‘,…、、……一章緒論課題背景……國(guó)內(nèi)外研究現(xiàn)狀‘……論文組織結(jié)構(gòu)…………第二章數(shù)據(jù)挖掘概述……數(shù)據(jù)挖掘的必要性數(shù)……,……據(jù)挖掘定義……數(shù)據(jù)挖掘的分析方

2、法神……,經(jīng)網(wǎng)絡(luò)聚類分析……,…、……、…、二、……決策樹……,…………遺傳算法……支持向量機(jī)模糊集和粗糙集……數(shù)據(jù)挖掘的對(duì)象……基于切的數(shù)據(jù)挖掘……匕數(shù)據(jù)挖掘的模型……己數(shù)據(jù)挖掘的分類……己數(shù)……,……據(jù)挖掘的應(yīng)用日志的數(shù)據(jù)挖掘……、二、二,、、……、…、、…………第三章聚類分析聚類概念……,……聚類……,……的數(shù)學(xué)模型常見的聚類算法……聚類方法的分類………聚類的有效性衡量…聚類的比較…………數(shù)據(jù)挖掘?qū)垲惖囊蟮谒恼卵杏|日志挖掘……匕日志……日志挖掘中的數(shù)據(jù)抽象……、…、…、,…、、……日志挖掘的通用模型……日志的預(yù)處理……場(chǎng)日志中的數(shù)據(jù)清洗……爬日志中的噪聲數(shù)據(jù)的處理

3、……用戶識(shí)別……會(huì)話識(shí)別……日志的聚類……,……日志聚類的分類……會(huì)話以及會(huì)話矩陣的表示……會(huì)話的相似度的定義……山東大學(xué)碩士學(xué)位論文,日志聚類特殊要求…………第五章日志挖掘模型……,日志挖掘模型的體系結(jié)構(gòu)…………日志挖掘模型的具體的實(shí)現(xiàn)……日志的預(yù)處理…………,網(wǎng)頁的聚類……,聚類分析的算法……,網(wǎng)頁的推薦…………日志挖掘模型的試驗(yàn)結(jié)果……,……,第六章論文總結(jié)…………、……,參考文獻(xiàn)………………致謝……在校期間發(fā)表的論文山東大學(xué)碩士學(xué)位論文摘要,,網(wǎng)絡(luò)技術(shù)的發(fā)展特別是惻姍技術(shù)的興起使得人們對(duì)于信息的獲取更加的快捷和方便。但是這些新技術(shù)的使用同時(shí)也帶來不少弊端,比如大家在

4、瀏覽網(wǎng)頁,,時(shí)發(fā)現(xiàn)很難直接找到自己需要的信息而是相反的好像淹沒在這海量的信息之中。數(shù)據(jù)挖掘的提出在很大程度上解決此問題。本文對(duì)于數(shù)據(jù)挖掘的定義、數(shù)據(jù)挖掘的任務(wù)、數(shù)據(jù)挖掘中的對(duì)象、數(shù)據(jù)挖掘的分析方法都做了很詳盡的論述。數(shù)據(jù)挖掘最初主要使用在數(shù)據(jù)庫上。但數(shù)據(jù)挖掘的對(duì)象并不局限于數(shù)據(jù)庫,現(xiàn)在人,用來從們已經(jīng)將數(shù)據(jù)挖掘的知識(shí)應(yīng)用到了領(lǐng)域上網(wǎng)絡(luò)信息當(dāng)中挖掘出潛在的、有用的模式來?;诘耐诰蛴址譃槿悾瑢?duì)日志的挖掘是屬于其中的使用挖掘。作為記錄了人們?cè)L問情況的網(wǎng)絡(luò)日志特別是服務(wù)器日志,因?yàn)槠溆兄蹋?,。定的結(jié)構(gòu)更容易進(jìn)行挖掘而受到研究者的青睞本文就是在基于聚類的基礎(chǔ)上探討了日志挖掘中的

5、各種問題。首先從理論的,,角度對(duì)聚類領(lǐng)域進(jìn)行了較為全面的探討分析了聚類的基本模型聚類中常見算,,然后結(jié)合,法聚類的有效性衡量的方法了日志的具體的特點(diǎn)闡述了在日志挖掘?qū)τ诰垲惙治龅奶厥獾囊?。根?jù)文獻(xiàn)中己有的知識(shí)總結(jié)了日志挖掘的基本模型,詳細(xì)的闡述了日志挖掘中的每一個(gè)階段的內(nèi)容及在日志挖掘中的地位。特別,“”“”,對(duì)于日志的預(yù)處理中的問題提出了日志的臟數(shù)據(jù)和噪聲數(shù)據(jù)兩個(gè)概念并且對(duì)這兩個(gè)概念進(jìn)行了詳細(xì)的闡述并做了比較。這兩個(gè)概念的提出使得日志挖掘模型的步驟更加的清晰可行。,。我們知道任何理論的最終目的都是應(yīng)用于實(shí)踐日志挖掘也不例外我們將日志挖掘得到的知識(shí)應(yīng)用在了。,網(wǎng)頁推薦上在

6、這一環(huán)節(jié)中我們提出了自己的打。新的打分,分函數(shù)函數(shù)綜合考慮了多種因素對(duì)于用戶未來訪問的影響充分利用了我們上一階段。,日志挖掘中得到的知識(shí)最后我們提出了具體日志挖掘的模型,將我們提出的這些理論應(yīng)用在具體的模型中。通過,特別在真實(shí)日志中的表現(xiàn)是得出的各種數(shù)據(jù)進(jìn)一步的證明了我們提出的各種想法的可行性和有效性。關(guān)鍵詞日志挖掘聚類分析日志挖掘模型數(shù)據(jù)預(yù)處理網(wǎng)頁推薦山東大學(xué)碩士學(xué)位論文,即羅汕,,,,而已,盡認(rèn)乞,己,,已電而,己,如而,擬,而而山東大學(xué)碩士學(xué)位論文第一章緒論課題背景,、在當(dāng)今互聯(lián)網(wǎng)絡(luò)的迅猛發(fā)展的背景下互聯(lián)網(wǎng)已經(jīng)成為了人們生產(chǎn)生活中不可缺少的一部分。而作為互聯(lián)網(wǎng)技術(shù)中應(yīng)

7、用最為成功的技術(shù)更是越來越同人們生活息息相關(guān)。技術(shù)已經(jīng)從當(dāng)初的簡(jiǎn)單提供文本信息發(fā)展成為今天的各種商業(yè)應(yīng)用。諸如電子商務(wù)、網(wǎng)上教育、遠(yuǎn)程醫(yī)療等等的具體應(yīng)用都發(fā)展的如火如茶。如,此迅速發(fā)展的網(wǎng)絡(luò)對(duì)互聯(lián)網(wǎng)技術(shù)的發(fā)展提出了更高的要求特別是使技術(shù)的改進(jìn)和提高更加的迫切。如何合理的組織網(wǎng)站建設(shè),如何更加人性化的給用戶提供服務(wù),如何從海量的網(wǎng)絡(luò)信息中迅速的找到用戶最為關(guān),心的信息成為學(xué)者們?cè)絹碓疥P(guān)心的課題。但是本身的無集中控制、無統(tǒng)一結(jié)構(gòu)、無完整性約束、無事務(wù)管理、無標(biāo)準(zhǔn)查詢語言和數(shù)據(jù)模型、可無限擴(kuò)展松散的分布式特點(diǎn),使得基于的

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。