apriori算法及其改進(jìn)算法

apriori算法及其改進(jìn)算法

ID:36680737

大小:663.01 KB

頁數(shù):27頁

時(shí)間:2019-05-13

apriori算法及其改進(jìn)算法_第1頁
apriori算法及其改進(jìn)算法_第2頁
apriori算法及其改進(jìn)算法_第3頁
apriori算法及其改進(jìn)算法_第4頁
apriori算法及其改進(jìn)算法_第5頁
資源描述:

《apriori算法及其改進(jìn)算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、陜西理工學(xué)院開放性實(shí)驗(yàn)結(jié)題論文學(xué)生姓名丁侃所在班級(jí)專業(yè)01級(jí)計(jì)算機(jī)本科乙班所在系別數(shù)學(xué)與計(jì)算機(jī)科學(xué)系指導(dǎo)教師姓名周濤陜西理工學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)系制2005年6月1日Apriori算法改進(jìn)及其實(shí)現(xiàn)內(nèi)容摘要信息技術(shù)的不斷推廣應(yīng)用,將企業(yè)帶入了一個(gè)信息爆炸的時(shí)代。如何充分利用這些數(shù)據(jù)信息為企業(yè)決策者提供決策支持成為一個(gè)十分迫切的又棘手的問題,人們除了利用現(xiàn)有的關(guān)系數(shù)據(jù)庫標(biāo)準(zhǔn)查詢語句得到一般的直觀的信息以外,必須挖掘其內(nèi)含的、未知的卻又實(shí)際存在的數(shù)據(jù)關(guān)系。著名的Apriori算法是一種挖掘關(guān)聯(lián)規(guī)則的算法。本文通過對(duì)參與候選集的元素計(jì)數(shù)的方

2、法來減少產(chǎn)生候選集的組合和減少數(shù)據(jù)庫的掃描次數(shù)來達(dá)到要求。這有利于提高挖掘的速度和減少數(shù)據(jù)庫的I/O操作時(shí)間的開銷。關(guān)鍵字:數(shù)據(jù)挖掘,關(guān)聯(lián)規(guī)則,Apriori算法AprioriAlgorithmAndImprovedAprioriAlgorithmAbstract:AninformationburstageiscomingwiththevariousapplicationofInformationtechnology.Howtomaximizetheinformationisaveryimportantproblemforthede

3、cision-makerofthecompanies.BesidesgettingtheregularinformationfromtheDatabasebySQL-query,peoplestillneedtominethedatarelationwhichisunclearbutreallyexists.Associationrulesisoneofthedataminingmethods,thefamousalgorithmAprioriisamethod,whichcanbeusedtosolutethoseproblems

4、.ThisarticleanalyzesandstudiestheimprovedalgorithmAprioribasedonthealgorithmofminingassociationrulesApriori.ThemainideaistodecreasethenumberofcandidateitemsandtodecreasethetimesofDatabasescanning.Thesolutionisavailable.Itupgradesthespeedofdatamininganddecreasescomputer

5、'sI/Ooperation.It'sprovedtobemoreefficientthanthetraditionalKeywords:Datamining,associationrules,Apriorialgorithm,目錄1數(shù)據(jù)挖掘-1-1.1技術(shù)上的定義及含義-1-1.2商業(yè)角度的定義-2-1.3數(shù)據(jù)挖掘與傳統(tǒng)分析方法的區(qū)別-2-1.4數(shù)據(jù)挖掘不能干什么-3-2數(shù)據(jù)挖掘的幾種主要形式:-3-2.1:規(guī)則挖掘:-3-2.2聚類分析:-4-3關(guān)于關(guān)聯(lián)規(guī)則的討論-4-3.1購物籃分析-4-3.2關(guān)聯(lián)規(guī)則基本問題描述-4-3.3

6、關(guān)聯(lián)規(guī)則挖掘舉例-6-3.4關(guān)聯(lián)規(guī)則問題的分解-8-4Apriori算法的描述-8-4.1Apriori算法的說明-8-4.2Apriori算法的描述-9-4.3Apriori算法的舉例-11-5一種Apriori的改進(jìn)算法-14-5.1算法產(chǎn)生的思路-14-5.2算法的圖例說明-15-5.3本算法的評(píng)價(jià):-15-附錄1程序運(yùn)行圖示-18-附錄2程序代碼-20-陜西理工學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)系開放性實(shí)驗(yàn)結(jié)題報(bào)告1數(shù)據(jù)挖掘1.1技術(shù)上的定義及含義數(shù)據(jù)挖掘(DataMining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)

7、中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。與數(shù)據(jù)挖掘相近的同義詞有數(shù)據(jù)融合、數(shù)據(jù)分析和決策支持等。這個(gè)定義包括好幾層含義:數(shù)據(jù)源必須是真實(shí)的、大量的、含噪聲的;發(fā)現(xiàn)的是用戶感興趣的知識(shí);發(fā)現(xiàn)的知識(shí)要可接受、可理解、可運(yùn)用;并不要求發(fā)現(xiàn)放之四海皆準(zhǔn)的知識(shí),僅支持特定的發(fā)現(xiàn)問題。----何為知識(shí)?從廣義上理解,數(shù)據(jù)、信息也是知識(shí)的表現(xiàn)形式,但是人們更把概念、規(guī)則、模式、規(guī)律和約束等看作知識(shí)。人們把數(shù)據(jù)看作是形成知識(shí)的源泉,好像從礦石中采礦或淘金一樣。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系數(shù)據(jù)庫中的數(shù)據(jù);也可以是半

8、結(jié)構(gòu)化的,如文本、圖形和圖像數(shù)據(jù);甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識(shí)的方法可以是數(shù)學(xué)的,也可以是非數(shù)學(xué)的;可以是演繹的,也可以是歸納的。發(fā)現(xiàn)的知識(shí)可以被用于信息管理,查詢優(yōu)化,決策支持和過程控制等,還可以用于數(shù)據(jù)自身的維護(hù)。因此

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。