數(shù)據(jù)挖掘技術(shù)及其應(yīng)用分析

數(shù)據(jù)挖掘技術(shù)及其應(yīng)用分析

ID:30656010

大?。?8.59 KB

頁數(shù):6頁

時(shí)間:2019-01-02

數(shù)據(jù)挖掘技術(shù)及其應(yīng)用分析_第1頁
數(shù)據(jù)挖掘技術(shù)及其應(yīng)用分析_第2頁
數(shù)據(jù)挖掘技術(shù)及其應(yīng)用分析_第3頁
數(shù)據(jù)挖掘技術(shù)及其應(yīng)用分析_第4頁
數(shù)據(jù)挖掘技術(shù)及其應(yīng)用分析_第5頁
資源描述:

《數(shù)據(jù)挖掘技術(shù)及其應(yīng)用分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。

1、從本學(xué)科出發(fā),應(yīng)著重選對(duì)國民經(jīng)濟(jì)具有一定實(shí)用價(jià)值和理論意義的課題。課題具有先進(jìn)性,便于研究生提出新見解,特別是博士生必須有創(chuàng)新性的成果數(shù)據(jù)挖掘技術(shù)及其應(yīng)用分析中國編輯?! ≌簲?shù)據(jù)挖掘是一門新興的數(shù)據(jù)處理技術(shù),是當(dāng)前一個(gè)熱門的研究領(lǐng)域。數(shù)據(jù)挖掘中應(yīng)用的技術(shù)包括經(jīng)典的統(tǒng)計(jì)、聚類,也包括最新發(fā)展起來的決策樹、神經(jīng)網(wǎng)絡(luò)和關(guān)聯(lián)規(guī)則等一些較新的方法。簡要介紹了數(shù)據(jù)挖掘的概念和過程·論述了數(shù)據(jù)挖掘的主要方法,最后對(duì)數(shù)據(jù)挖掘的應(yīng)用作了簡要介紹?! £P(guān)鍵詞:數(shù)據(jù)挖掘;過程;應(yīng)用    1 數(shù)據(jù)挖掘概念    數(shù)據(jù)挖掘(DataMining,DM),是隨

2、著數(shù)據(jù)庫和人工智能發(fā)展起來的新興的信息處理技術(shù)。數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程,其主要特點(diǎn)是對(duì)數(shù)據(jù)庫中的大量數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,并從中提取輔助決策的關(guān)鍵性數(shù)據(jù)。它可幫助決策者分析歷史數(shù)據(jù)及當(dāng)前數(shù)據(jù),并從中發(fā)現(xiàn)隱藏的關(guān)系和模式,進(jìn)而預(yù)測未來可能發(fā)生的行為。數(shù)據(jù)挖掘是一門涉及面很廣的交叉性新興學(xué)科,涉及到數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計(jì)、可視化、并行計(jì)算等領(lǐng)域?! ≌n題份量和難易程度要恰當(dāng),博士生能在二年內(nèi)作出結(jié)果,碩

3、士生能在一年內(nèi)作出結(jié)果,特別是對(duì)實(shí)驗(yàn)條件等要有恰當(dāng)?shù)墓烙?jì)。從本學(xué)科出發(fā),應(yīng)著重選對(duì)國民經(jīng)濟(jì)具有一定實(shí)用價(jià)值和理論意義的課題。課題具有先進(jìn)性,便于研究生提出新見解,特別是博士生必須有創(chuàng)新性的成果  2 數(shù)據(jù)挖掘技術(shù)    關(guān)聯(lián)規(guī)則方法  關(guān)聯(lián)規(guī)則是一種簡單,實(shí)用的分析規(guī)則,描述了一個(gè)事物中某些屬性同時(shí)出現(xiàn)的規(guī)律和模式,是數(shù)據(jù)挖掘中最成熟的主要技術(shù)之一。大多數(shù)關(guān)聯(lián)規(guī)則挖掘算法能夠無遺漏發(fā)現(xiàn)隱藏在所挖掘數(shù)據(jù)中的所有關(guān)聯(lián)關(guān)系,所挖掘出的關(guān)聯(lián)規(guī)則量往往非常巨大,但是。并不是所有通過關(guān)聯(lián)得到的屬性之間的關(guān)系都有實(shí)際應(yīng)用價(jià)值,對(duì)這些關(guān)聯(lián)規(guī)則進(jìn)行有效的評(píng)

4、價(jià)。篩選出用戶真正感興趣的。有意義的關(guān)聯(lián)規(guī)則尤為重要?!   》诸惡途垲惙椒ā 》诸惥褪羌俣〝?shù)據(jù)庫中的每個(gè)對(duì)象屬于一個(gè)預(yù)先給定的類。從而將數(shù)據(jù)庫中的數(shù)據(jù)分配到給定的類中。而聚類分析是根據(jù)所選樣本間關(guān)聯(lián)的標(biāo)準(zhǔn)將其劃分成幾個(gè)組,同組內(nèi)的樣本具有較高的相似度,不同組的則相異。分類和聚類的區(qū)別在于分類事先知道類別數(shù)和各類的典型特征,而聚類則事先不知道。聚類方法適合于探討樣本間的內(nèi)部關(guān)系,從而對(duì)樣本結(jié)構(gòu)做出合理的評(píng)價(jià)。    數(shù)據(jù)統(tǒng)計(jì)方法課題份量和難易程度要恰當(dāng),博士生能在二年內(nèi)作出結(jié)果,碩士生能在一年內(nèi)作出結(jié)果,特別是對(duì)實(shí)驗(yàn)條件等要有恰當(dāng)?shù)墓烙?jì)。

5、從本學(xué)科出發(fā),應(yīng)著重選對(duì)國民經(jīng)濟(jì)具有一定實(shí)用價(jià)值和理論意義的課題。課題具有先進(jìn)性,便于研究生提出新見解,特別是博士生必須有創(chuàng)新性的成果  使用這些方法一般首先建立一個(gè)數(shù)據(jù)模型或統(tǒng)計(jì)模型,然后根據(jù)這種模型提取有關(guān)的知識(shí)。傳統(tǒng)的統(tǒng)計(jì)學(xué)為數(shù)據(jù)挖掘提供了許多判別和回歸分析方法。貝葉斯推理、回歸分析、方差分析等技術(shù)是許多挖掘應(yīng)用中有力的工具之一?!   ∩窠?jīng)網(wǎng)絡(luò)方法  神經(jīng)元網(wǎng)絡(luò),具有非線形映射特性、信息的分布存儲(chǔ)、并行處理和全局集體的作用、高度的自學(xué)習(xí)、自組織和自適應(yīng)能力的種種優(yōu)點(diǎn)。這些優(yōu)點(diǎn)使得神經(jīng)元網(wǎng)絡(luò)非常適合解決數(shù)據(jù)挖掘的問題。因此近年來越來

6、越受到人們的關(guān)注。典型的神經(jīng)網(wǎng)絡(luò)模型主要分3大類;用于分類、預(yù)測和模式識(shí)別的前饋式神經(jīng)網(wǎng)絡(luò)模型;用于聯(lián)想記憶和優(yōu)化計(jì)算的反饋式神經(jīng)網(wǎng)絡(luò)模型;用于聚類的自組織映射方法?!   Q策樹方法  決策樹學(xué)習(xí)是一種通過逼近離散值日標(biāo)函數(shù)的方法,把實(shí)例從根結(jié)點(diǎn)排列到某個(gè)葉子結(jié)點(diǎn)來分類實(shí)例。葉子結(jié)點(diǎn)即為實(shí)例所屬的分類,利用信息論中的互信息(信息增益)尋找數(shù)據(jù)庫中具有最大信息量的字段。建立決策樹的一個(gè)結(jié)點(diǎn),再根據(jù)字段的不同取值建立樹的分支;在每個(gè)分枝子集中,重復(fù)建立樹的下層結(jié)點(diǎn)和分支的過程,即可建立決策樹?! ≌n題份量和難易程度要恰當(dāng),博士生能在二年內(nèi)作

7、出結(jié)果,碩士生能在一年內(nèi)作出結(jié)果,特別是對(duì)實(shí)驗(yàn)條件等要有恰當(dāng)?shù)墓烙?jì)。從本學(xué)科出發(fā),應(yīng)著重選對(duì)國民經(jīng)濟(jì)具有一定實(shí)用價(jià)值和理論意義的課題。課題具有先進(jìn)性,便于研究生提出新見解,特別是博士生必須有創(chuàng)新性的成果  粗糙集  粗糙集(RoughSet)能夠在缺少關(guān)于數(shù)據(jù)先驗(yàn)知識(shí)的情況下,只以考察數(shù)據(jù)的分類能力為基礎(chǔ),解決模糊或不確定數(shù)據(jù)的分析和處理問題。粗糙集用于從數(shù)據(jù)庫中發(fā)現(xiàn)分類規(guī)則的基本思想是將數(shù)據(jù)庫中的屬性分為條件屬性和結(jié)論屬性,對(duì)數(shù)據(jù)庫中的元組根據(jù)備個(gè)屬性不同的屬性值分成相應(yīng)的子集,然后對(duì)條件屬性劃分的子集與結(jié)論屬性劃分的子集之間上下近似關(guān)

8、系生成判定規(guī)則。粗糙集理論可以應(yīng)用于數(shù)據(jù)挖掘中的分類、發(fā)現(xiàn)不準(zhǔn)確數(shù)據(jù)或噪聲數(shù)據(jù)內(nèi)在的結(jié)構(gòu)聯(lián)系。中國3 數(shù)據(jù)挖掘過程    按工作流程包括以下幾個(gè)步驟:  (1)數(shù)據(jù)準(zhǔn)備:一般存儲(chǔ)在數(shù)據(jù)庫系統(tǒng)中

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。