資源描述:
《試析基于web數(shù)據(jù)挖掘分類算法的個(gè)性化信息服務(wù)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、太原理工大學(xué)碩士學(xué)位論文基于Web數(shù)據(jù)挖掘分類算法的個(gè)性化信息服務(wù)姓名:郭鵬申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):計(jì)算機(jī)應(yīng)用技術(shù)指導(dǎo)教師:史應(yīng)文;陳俊杰2003.4.1———磐娑磐鯊而彳基于Web數(shù)據(jù)挖掘分類算法的個(gè)性化信息服務(wù)摘要隨著Intemet技術(shù)的發(fā)展,繼數(shù)據(jù)挖掘技術(shù)成功地應(yīng)用于傳統(tǒng)數(shù)據(jù)庫(kù)領(lǐng)域后,人fLT.開(kāi)始嘗試將其應(yīng)用于其他類型的數(shù)據(jù)庫(kù)?;赪eb的數(shù)據(jù)挖掘技術(shù)(簡(jiǎn)稱Web挖掘)就是在這種背景之下發(fā)展起來(lái)的。本論文介紹了數(shù)據(jù)挖掘、Web挖掘技術(shù)和OLAP技術(shù)的理論發(fā)展及實(shí)際應(yīng)用,并重點(diǎn)研究了數(shù)據(jù)挖掘中
2、分類算法在Web挖掘中的應(yīng)用,從而實(shí)現(xiàn)各類用戶的個(gè)性化信息服務(wù)。論文主要內(nèi)容有以下幾部分組成:1.介紹數(shù)據(jù)挖掘技術(shù)的發(fā)展,挖掘過(guò)程及分類算法的實(shí)際應(yīng)用情況.2.詳細(xì)討論web挖掘技術(shù).包括w曲挖掘產(chǎn)生的背景,技術(shù)特點(diǎn),Web訪問(wèn)挖掘的用戶訪問(wèn)事務(wù)確定方法等.3.詳細(xì)介紹了一種基于Web數(shù)據(jù)挖掘的分類算法.4.為了實(shí)現(xiàn)用戶個(gè)性化信息服務(wù),作者將上面提到的算法應(yīng)用到了Web數(shù)據(jù)挖掘上,并對(duì)其中的決策樹(shù)建樹(shù)算法進(jìn)行了改進(jìn)。這一部分是本論文的重點(diǎn).5.最后作者建立了在線個(gè)性化信息服務(wù)工具模型,提出下一步要做
3、的工作并展望了Web挖掘技術(shù)未來(lái)發(fā)展方向。關(guān)鍵詞:數(shù)據(jù)挖掘WEB挖掘分類規(guī)則0LAP概念歸納INDIⅥDUALINFORMATIONSERⅥCEBASEDoNWEBDATAMININGCLASSIFICATIONALGORITHMABSTRACTWiththedevelopmentofIntemettechnology,peoplebegintoattempttoapplydataminingtechnology,whichhasbeenappliedintraditionaldatabasesuc
4、cess向lly,intothecaseofusingothertypesofdatabase.ThedataminingtechnologybasedonWeb,whichiscalledWebminingsimply,Occursinthiscase.Weintroducesthedevelopmentandapplicationofdatamining,WebminingandOALPtechnologiesandfocusesontheresearchofWebminingapplicati
5、onusingclassificationalgorithmofdataminingforindividualinformationservice.Thispaperconsistsofthefollowingparts:1.introductionofdevelopmentofdatamining,mimngprocedureandapplicationOnclassificationalgorithm.2.detaileddiscussionofWebminingtechnology,inclu
6、dingthehistoryandthecharacteristicofWebminingandmethodsofdetermininguseraccesssession,etc.3.detailedintroductionofanonlineclassificationalgorithmbasedonconceptualinduction.4.thecoreofthepaperistheimprovementofthedecisiontreealgorithm,whichisappliedinth
7、eW曲dataminingforthepurposeofindividualinformationservice.5.finallythetoolmodelfortheonlineindividualinformationserviceisoffered,SOdothenextworkandprospectthefutureofwebdataminingtechnology.Keywords:DataMining,WebMining,ClassificationRules,OLAP,conceptu
8、alInduction.第一章緒論1.1.選題目的和意義進(jìn)入2l世紀(jì),隨著Internet迅猛的發(fā)展,可利用信息資源越來(lái)越多,人們面對(duì)著海量無(wú)組織的信息,越來(lái)越難以從中發(fā)現(xiàn)對(duì)自己有價(jià)值的信息,這種現(xiàn)象被稱為信息過(guò)載。還有隨著Internet上信息類型的不多擴(kuò)大,人們?cè)诰W(wǎng)上找到自己感興趣的信息變的越來(lái)越困難,這就是所謂的資源迷向。而面對(duì)以上的問(wèn)題,現(xiàn)有的信息發(fā)布出現(xiàn)以下三個(gè)缺點(diǎn)[1]:≯受網(wǎng)絡(luò)的限制:在Internet上,信息是分布到各個(gè)站點(diǎn)上的,而搜索引擎檢索信息完全