基于數(shù)據(jù)挖掘的決策支持系統(tǒng)

基于數(shù)據(jù)挖掘的決策支持系統(tǒng)

ID:1965894

大小:94.00 KB

頁(yè)數(shù):9頁(yè)

時(shí)間:2017-11-14

基于數(shù)據(jù)挖掘的決策支持系統(tǒng)_第1頁(yè)
基于數(shù)據(jù)挖掘的決策支持系統(tǒng)_第2頁(yè)
基于數(shù)據(jù)挖掘的決策支持系統(tǒng)_第3頁(yè)
基于數(shù)據(jù)挖掘的決策支持系統(tǒng)_第4頁(yè)
基于數(shù)據(jù)挖掘的決策支持系統(tǒng)_第5頁(yè)
資源描述:

《基于數(shù)據(jù)挖掘的決策支持系統(tǒng)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)

1、基于數(shù)據(jù)挖掘的決策支持系統(tǒng)學(xué)號(hào):2009370185姓名:吳萌摘要:近年來(lái),數(shù)據(jù)挖掘技術(shù)在市場(chǎng)分析預(yù)測(cè)、客戶分析預(yù)測(cè)方面得到了廣泛的應(yīng)用,本文首先介紹了數(shù)據(jù)挖掘的定義、目的、一般過(guò)程及與此相關(guān)的一些技術(shù)。然后論述了決策支持系統(tǒng)的定義及發(fā)展層次,最后闡述了如何搭建一個(gè)基于數(shù)據(jù)挖掘的決策支持系統(tǒng)。1、數(shù)據(jù)挖掘1.1數(shù)據(jù)挖掘概述數(shù)據(jù)挖掘是從大型數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中發(fā)現(xiàn)并提取隱藏在其中的信息或知識(shí)的過(guò)程,即從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中具有潛在利用價(jià)值的信息和知識(shí)的過(guò)程。其目的是幫助分析人員尋找數(shù)據(jù)間潛在的關(guān)聯(lián),發(fā)現(xiàn)忽略的要素,而這些信息對(duì)預(yù)測(cè)趨勢(shì)和決策行為是十分有

2、用的。所以它屬于決策支持系統(tǒng)的范疇。數(shù)據(jù)挖掘的一般過(guò)程如圖1所示。1.2數(shù)據(jù)挖掘的任務(wù)根據(jù)發(fā)現(xiàn)知識(shí)的不同,數(shù)據(jù)的任務(wù)可以分為以下幾類:①關(guān)聯(lián)規(guī)則分析:其目的是發(fā)現(xiàn)隱藏在數(shù)據(jù)間的相互關(guān)系。這就是數(shù)據(jù)挖掘中比較成熟的問(wèn)題。②特征規(guī)則分析:從數(shù)據(jù)中提取出關(guān)于這些數(shù)據(jù)的特征式,用以表達(dá)該數(shù)據(jù)集的總體特征。區(qū)分規(guī)則分析發(fā)現(xiàn)或提取數(shù)據(jù)的某些特征,使之與對(duì)比數(shù)據(jù)區(qū)分開(kāi)來(lái)。③分類分析:先為每個(gè)記錄賦予一個(gè)標(biāo)記,即按標(biāo)記分類記錄,然后檢測(cè)這些標(biāo)記的紀(jì)錄,描述出這些記錄的特征。④聚類分析:從數(shù)據(jù)中得出一組聚類規(guī)則,將數(shù)據(jù)分成若干類。⑤預(yù)測(cè):通過(guò)對(duì)數(shù)據(jù)的分析處理,估計(jì)一組數(shù)據(jù)中某些丟失數(shù)據(jù)的可能值或數(shù)據(jù)集合中某些

3、屬性值的分布情況。⑥變化和偏差分析:探測(cè)現(xiàn)有數(shù)據(jù)與歷史紀(jì)錄或標(biāo)準(zhǔn)之間的顯著變化和偏離,從而獲得有用的知識(shí)。1.3數(shù)據(jù)挖掘的特點(diǎn)及分類數(shù)據(jù)挖掘的特點(diǎn):①處理的數(shù)據(jù)規(guī)模十分巨大,一般為GB級(jí),甚至TB級(jí);②由于用戶不能形成精確的查詢要求,因此需要靠數(shù)據(jù)挖掘技術(shù)來(lái)尋找其可能感興趣的東西;③在某些應(yīng)用中,要求數(shù)據(jù)挖掘?qū)?shù)據(jù)的迅速變化做出迅速響應(yīng),以提供決策支持信息。數(shù)據(jù)挖掘既要發(fā)現(xiàn)潛在規(guī)則,還要管理和維護(hù)規(guī)則。而規(guī)則是動(dòng)態(tài)的,當(dāng)前的規(guī)則只能反映當(dāng)前狀態(tài)的數(shù)據(jù)特征,隨著數(shù)據(jù)的不斷加入,規(guī)則需要隨之更新;④數(shù)據(jù)挖掘中規(guī)則的發(fā)現(xiàn)基于統(tǒng)計(jì)規(guī)律,發(fā)現(xiàn)的規(guī)則不必適合于所有數(shù)據(jù),而且當(dāng)達(dá)到某一闕值時(shí),便認(rèn)為有此規(guī)

4、則。因此,利用數(shù)據(jù)挖掘技術(shù)可能會(huì)發(fā)現(xiàn)大量規(guī)則。1.4數(shù)據(jù)挖掘的方法和常用技術(shù)數(shù)據(jù)挖掘需要其他多種技術(shù)的支持,才能挖掘出令用戶滿意的結(jié)果。具體來(lái)說(shuō),有以下幾種主要的數(shù)據(jù)挖掘方法。決策樹(shù)方法:利用樹(shù)形結(jié)構(gòu)來(lái)表示決策集合,這些決策集合通過(guò)對(duì)數(shù)據(jù)集的分類產(chǎn)生規(guī)則。規(guī)則歸類法:通過(guò)統(tǒng)計(jì)方法歸納、提取有價(jià)值的f-then規(guī)則。神經(jīng)網(wǎng)絡(luò)方法:從結(jié)構(gòu)上模擬生物神經(jīng)網(wǎng)絡(luò),以模型和學(xué)習(xí)規(guī)則為基礎(chǔ),建立三大類多種神經(jīng)網(wǎng)絡(luò)模型:前饋式網(wǎng)絡(luò)、反饋式網(wǎng)絡(luò)、自組織網(wǎng)絡(luò)。遺傳算法:模擬生物進(jìn)化過(guò)程的算法,由繁殖(選擇)、交叉(重組)、變異(突變)三個(gè)基本算子組成。為了應(yīng)用遺傳算法,需要將數(shù)據(jù)挖掘任務(wù)表達(dá)為一種搜索問(wèn)題,從而

5、發(fā)揮遺傳算法的優(yōu)化搜索能力。K最鄰近技術(shù):這種技術(shù)通過(guò)K個(gè)最與之相近的歷史記錄的組合來(lái)辨別新的紀(jì)錄。它可以作為聚類、偏差分析等挖掘任務(wù)。可視化技術(shù):將信息模式、數(shù)據(jù)的關(guān)聯(lián)或趨勢(shì)等以直觀的圖形方式表示,決策者可以通過(guò)可視化技術(shù)交互地分析數(shù)據(jù)關(guān)系可視化數(shù)據(jù)分析拓寬了傳統(tǒng)的圖表功能,使用戶對(duì)數(shù)據(jù)的剖析更清楚。2、決策支持系統(tǒng)2.1決策支持系統(tǒng)概述決策支持系統(tǒng)(DSS)就是能夠利用數(shù)據(jù)和模型來(lái)幫助決策者解決非結(jié)構(gòu)問(wèn)題的高度靈活的、人機(jī)交互的計(jì)算機(jī)信息系統(tǒng),是專門(mén)為高層管理人員服務(wù)的一種信息系統(tǒng)。2.2決策支持系統(tǒng)的體系結(jié)構(gòu)DSS的概念結(jié)構(gòu)由會(huì)話系統(tǒng)、控制系統(tǒng)、運(yùn)行及操作系統(tǒng)、數(shù)據(jù)庫(kù)系統(tǒng)、模型庫(kù)系統(tǒng)、

6、規(guī)則庫(kù)系統(tǒng)和用戶共同構(gòu)成。最簡(jiǎn)單和實(shí)用的三庫(kù)DSS邏輯結(jié)構(gòu)如圖2所示。2.3基于數(shù)據(jù)倉(cāng)庫(kù)的決策支持系統(tǒng)體系結(jié)構(gòu)將數(shù)據(jù)倉(cāng)庫(kù)和OLAP技術(shù)、DM技術(shù)引入DSS,提出基于數(shù)據(jù)倉(cāng)庫(kù)的DSS體系結(jié)構(gòu)框,系統(tǒng)主要由三部分組成,第一部分是模型庫(kù)、方法庫(kù)、知識(shí)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)及相應(yīng)的管理系統(tǒng);第二部分是OLAP和DM單元。第三部分是問(wèn)題綜合處理單元,其結(jié)構(gòu)框如圖3所示。2.4DSS的分析方法DSS應(yīng)滿足決策支持系統(tǒng)的要求和達(dá)到DSS的性能指標(biāo),由于DSS的特殊性,對(duì)DSS的系統(tǒng)分析通常采用一種基于決策過(guò)程基本活動(dòng)的方法,是決策者進(jìn)行表達(dá)(R)、操作(O)、存儲(chǔ)輔助(M)和控制(C)的方法,其基本思路是建立起的要

7、求與性能之間的關(guān)系,并力求減少它們之間的差異。ROMC分析方法正式建立在用戶目標(biāo)的基礎(chǔ)上的,它主要從以下幾點(diǎn)進(jìn)行分析。1>表達(dá)(Representation):提供表達(dá)式以幫助決策者將問(wèn)題概念化,以便于處理和交流;2>操作(Operation):提供這些表達(dá)式進(jìn)行分析和運(yùn)算的某些操作方法;3>存儲(chǔ)輔助(Memoryaid):表達(dá)與加工的存儲(chǔ)支持;4>控制機(jī)制(Controlmechanism):提供處理和使用

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。