關(guān)聯(lián)規(guī)則挖掘算法及其在web挖掘上應(yīng)用的研究

ID：33535187

大?。?.09 MB

頁(yè)數(shù)：78頁(yè)

時(shí)間：2019-02-26

關(guān)聯(lián)規(guī)則挖掘算法及其在web挖掘上應(yīng)用的研究_第1頁(yè)

關(guān)聯(lián)規(guī)則挖掘算法及其在web挖掘上應(yīng)用的研究_第2頁(yè)

關(guān)聯(lián)規(guī)則挖掘算法及其在web挖掘上應(yīng)用的研究_第3頁(yè)

關(guān)聯(lián)規(guī)則挖掘算法及其在web挖掘上應(yīng)用的研究_第4頁(yè)

關(guān)聯(lián)規(guī)則挖掘算法及其在web挖掘上應(yīng)用的研究_第5頁(yè)

資源描述：

《關(guān)聯(lián)規(guī)則挖掘算法及其在web挖掘上應(yīng)用的研究》由會(huì)員上傳分享，免費(fèi)在線(xiàn)閱讀，更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、哈爾濱工程火學(xué)碩士學(xué)位論文摘要由于應(yīng)用性的數(shù)據(jù)的爆炸式增長(zhǎng)(如商業(yè)分析)，及計(jì)算機(jī)的軟硬件技術(shù)的發(fā)展完備，數(shù)據(jù)挖掘已經(jīng)成為近幾年來(lái)應(yīng)用最廣泛的分析數(shù)據(jù)的工具。挖掘重要數(shù)據(jù)仍然需要配合許多其他領(lǐng)域的技術(shù)才能得到完善有效的結(jié)果，其中包括機(jī)器學(xué)習(xí)，人工智能，統(tǒng)計(jì)學(xué)原理，數(shù)據(jù)庫(kù)系統(tǒng)，數(shù)據(jù)可視化等。然而目前大多數(shù)挖掘關(guān)聯(lián)規(guī)則的算法往往必需多次掃描事務(wù)數(shù)據(jù)庫(kù)才能達(dá)到要求的目標(biāo)，這樣重復(fù)性的數(shù)據(jù)庫(kù)存取動(dòng)作將會(huì)導(dǎo)致過(guò)多的執(zhí)行時(shí)間浪費(fèi)在I／O動(dòng)作上另外在頻繁集生成規(guī)則時(shí)現(xiàn)有的算法沒(méi)有考慮到規(guī)則的大量冗余，為了解決這個(gè)問(wèn)題本文提出了一

2、個(gè)不需要生成候選集同時(shí)有效的去除生成規(guī)則時(shí)產(chǎn)生大量冗余的算法QAIS，來(lái)提高關(guān)聯(lián)規(guī)則生成的速度，并且在此算法基礎(chǔ)上提出了新穎的關(guān)聯(lián)規(guī)則增量更新算法AIU，通過(guò)應(yīng)用合成數(shù)掘驗(yàn)證了QAIS／AIU算法的有效性，由試驗(yàn)結(jié)果來(lái)看這個(gè)方法確實(shí)能更有效且準(zhǔn)確地獲得事務(wù)數(shù)據(jù)庫(kù)的關(guān)聯(lián)規(guī)則，尤其適合挖掘超大數(shù)據(jù)庫(kù)中高支持度下長(zhǎng)模式的挖掘。然后論文介紹了關(guān)聯(lián)規(guī)則的一種擴(kuò)展一時(shí)間序列模式挖掘方面的算法，給出了Web同志文件挖掘的高效、新穎的改進(jìn)算法，并用實(shí)驗(yàn)驗(yàn)證了此種方法的有效性。論文的最后討論了關(guān)聯(lián)規(guī)則挖掘領(lǐng)域面臨的幾個(gè)問(wèn)題。關(guān)鍵詞：

3、數(shù)據(jù)挖掘：知識(shí)發(fā)現(xiàn)；關(guān)聯(lián)規(guī)則；增量更新；時(shí)間序列模式；Web挖掘哈爾濱工群人學(xué)碩士學(xué)位論文ABSTRACTDatamininghasbeenbecomingmoreandmorepopularinthepastfewyearsduetOthegrowingdemandsofdatabaseapplicationandtheadvancesincomputertechnology．DataMiningmergesmanyimportantresearchfieldsincludingmachinelearning，a

4、rtificialintelligent，statistics，knowledge—basesystemsanddatavisualization，etc．However，currentalgorithmsproposedfordatAminingofassociationrulesrequireseveralpassesovertheanalyzeddatabaseTheI／0overheadinscanningthelargedatabasecanbeextremelyhigh。Anef蠡cientalgori

5、thmQAISiSproposedthatusestheef五cientmethodtoreducedatabaseaccessactivity,andpresentanovelalgorithmAIUbasedonthisalgorithm．itiSfitforminingassociationrulesandincrementalupdating．ItiSespeciallyeffectiveinVLDB，mininglongpatterns，andhighsupport．ThePerformanceofQAI

6、S／AIUiSverifiedonthebasisofsyntheticdatajexperimentsshowthattheproposedalgorithmcanmineassociationrulesmoreefficientlybynotgeneratingcandidateitemsetsandreducingtheredundancyol、fi'equentitemsetswhilegeneratingassociationrules．Andthen，aextentofassociationrules—

7、TimeSeriesPatterniSdiscussed，andanefficientimprovedalgorithmofwebminingispresented．ThePerformanceofalgorithmsiSverifledonthebasisofsyntheticdatatoo．Atlast，theproblemsfacedintheminingassociationrulesfieldarediscussedinthepaper．Keywords：DataMining，KDD，Associatio

8、nRules，IncrementUpdating，TimeSeriesPattern，WebMining+哈爾濱T程大學(xué)碩士學(xué)位論文1．1知識(shí)發(fā)現(xiàn)概述第1章緒論近年來(lái)由于計(jì)算機(jī)科學(xué)與技術(shù)的快速發(fā)展，加速了信息化的進(jìn)程。數(shù)據(jù)庫(kù)的蓬勃發(fā)展，使得數(shù)據(jù)(Data)大量累積，久而久之，造成數(shù)據(jù)過(guò)多而信息(Information)不足的嚴(yán)重問(wèn)題。因此數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)(

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 78



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件，查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常，文件下載后無(wú)此問(wèn)題，請(qǐng)放心下載。
2. 本文檔由用戶(hù)上傳，版權(quán)歸屬用戶(hù)，天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤，付費(fèi)完成后未能成功下載的用戶(hù)請(qǐng)聯(lián)系客服處理。

關(guān)聯(lián)規(guī)則挖掘算法及其在web挖掘上應(yīng)用的研究

關(guān)聯(lián)規(guī)則挖掘算法及其在web挖掘上應(yīng)用的研究

相關(guān)文章

相關(guān)標(biāo)簽