資源描述:
《數(shù)據(jù)挖掘技術(shù)在企業(yè)決策系統(tǒng)中的應(yīng)用研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、數(shù)據(jù)挖掘技術(shù)在企業(yè)決策系統(tǒng)中的應(yīng)用研究
數(shù)據(jù)挖掘技術(shù)在企業(yè)決策系統(tǒng)中的應(yīng)用研究
關(guān)鍵詞:數(shù)據(jù)挖掘;數(shù)據(jù)倉(cāng)庫(kù);企業(yè)決策系統(tǒng)
摘要:本文首先討論了數(shù)據(jù)挖掘技術(shù),給出了一種企業(yè)決策系統(tǒng)。并就決策系統(tǒng)的構(gòu)成、流程和采用的數(shù)據(jù)挖掘技術(shù)進(jìn)行了探討。
ResearchofDataMiningTechnologyinBusinessDecision-makingSystem
ShiDongsheng
(InnerMongoliaUniversity,Information&EngineeringTechnologyCollege,I
2、nnerMongolia,Baotou014010,China)
Abstract:Thispaperdiscussesdataminingtechnology,presentsabusinessdecisionsystem.Decision-makingsystemoncomposition,processanduseofdataminingtechniquesarediscussed.
Keywords:Datamining;Datawarehouse;Businessdecision-makingsystem
隨著計(jì)算機(jī)管理信息系統(tǒng)的飛速發(fā)展和廣泛應(yīng)用,企業(yè)
3、生產(chǎn)經(jīng)營(yíng)的自動(dòng)化水平不斷提高,大大提高了工作效率。但企業(yè)業(yè)務(wù)系統(tǒng)運(yùn)行所產(chǎn)生的大量原始數(shù)據(jù)是企業(yè)生產(chǎn)經(jīng)營(yíng)活動(dòng)的真實(shí)記錄,不能為本企業(yè)加以有效的統(tǒng)計(jì)、分析及評(píng)估,無(wú)法將這些數(shù)據(jù)轉(zhuǎn)換成企業(yè)有用的信息、為企業(yè)戰(zhàn)略決策提供參考和支持。數(shù)據(jù)挖掘正是在這樣的應(yīng)用需求環(huán)境下產(chǎn)生并迅速發(fā)展起來(lái)的,它的出現(xiàn)為智能地把海量數(shù)據(jù)轉(zhuǎn)化為有用的信息和知識(shí)提供了新的思路和手段,設(shè)計(jì)開(kāi)發(fā)基于數(shù)據(jù)挖掘的企業(yè)決策系統(tǒng)是合理解決這一問(wèn)題,提升企業(yè)綜合競(jìng)爭(zhēng)力的最佳對(duì)策。
一、數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘,是指從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們不知道的、但又是潛在有用的信息和知識(shí)的
4、過(guò)程。它是數(shù)據(jù)庫(kù)研究中的一個(gè)新領(lǐng)域,融合了數(shù)據(jù)庫(kù)、人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等多個(gè)領(lǐng)域的理論和技術(shù),把人們對(duì)數(shù)據(jù)的應(yīng)用從低層次的查詢(xún),提升到從數(shù)據(jù)中挖掘知識(shí),提供決策支持的層級(jí)。
數(shù)據(jù)挖掘一般由數(shù)據(jù)準(zhǔn)備、挖掘操作、結(jié)果表達(dá)和解釋三個(gè)主要階段組成。在數(shù)據(jù)準(zhǔn)備階段應(yīng)集成多個(gè)運(yùn)作數(shù)據(jù)源中的數(shù)據(jù),解決語(yǔ)義模糊性、處理遺漏數(shù)據(jù)、清洗臟數(shù)據(jù)。挖掘階段是一個(gè)假設(shè)產(chǎn)生、合成、修正和驗(yàn)證傳播的過(guò)程,也是上述三個(gè)階段的核心。結(jié)果表達(dá)和解釋階段根據(jù)最終用戶(hù)的決策目的把提取的有用信息正確地表達(dá)出來(lái)。
數(shù)據(jù)挖掘的方法和技術(shù)可大致劃分為三類(lèi):統(tǒng)計(jì)分析、知識(shí)發(fā)現(xiàn)、可視化技術(shù)等。統(tǒng)計(jì)分析用于檢查異常形式的
5、數(shù)據(jù),然后利用統(tǒng)計(jì)模型和數(shù)學(xué)模型來(lái)解釋這些數(shù)據(jù),統(tǒng)計(jì)分析方法是目前最成熟的數(shù)據(jù)挖掘工具。而知識(shí)發(fā)現(xiàn)則著眼于發(fā)現(xiàn)大量數(shù)據(jù)記錄中潛在的有用信息或新的知識(shí),屬于所謂“發(fā)現(xiàn)驅(qū)動(dòng)”的數(shù)據(jù)挖掘技術(shù)途經(jīng)。知識(shí)發(fā)現(xiàn)常用的方法有人工神經(jīng)網(wǎng)絡(luò)、決策樹(shù)、遺傳算法、模糊計(jì)算或模糊推理等。數(shù)據(jù)質(zhì)量、可視化數(shù)據(jù)的能力、極大數(shù)據(jù)庫(kù)尺寸、數(shù)據(jù)挖掘者的技能、數(shù)據(jù)的粒度都是影響知識(shí)發(fā)現(xiàn)方法的重要因素。可視化技術(shù)則采用直觀的圖形方式將信息模式、數(shù)據(jù)的關(guān)聯(lián)或趨勢(shì)呈現(xiàn)給決策者,決策者可以通過(guò)可視化技術(shù)交互式地分析數(shù)據(jù)關(guān)系。
二、基于數(shù)據(jù)挖掘的企業(yè)決策系統(tǒng)
數(shù)據(jù)挖掘面對(duì)的是經(jīng)初步加工的數(shù)據(jù),使得數(shù)據(jù)挖掘更專(zhuān)注于知識(shí)的
6、發(fā)現(xiàn);而數(shù)據(jù)倉(cāng)庫(kù)用于完成數(shù)據(jù)的收集、集成、存儲(chǔ)、管理等工作,兩者必須有機(jī)結(jié)合起來(lái)使用。
基于數(shù)據(jù)挖掘的企業(yè)決策系統(tǒng)主要由數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)管理模塊、知識(shí)庫(kù)、知識(shí)發(fā)現(xiàn)模塊、數(shù)據(jù)挖掘工具、人機(jī)交互模塊構(gòu)成(如下圖所示)。系統(tǒng)的輸入主要源于經(jīng)過(guò)初步處理的數(shù)據(jù)庫(kù)數(shù)據(jù)以及存儲(chǔ)在知識(shí)庫(kù)中的歷史知識(shí)和經(jīng)驗(yàn);數(shù)據(jù)倉(cāng)庫(kù)管理模塊用于數(shù)據(jù)倉(cāng)庫(kù)的建立以及數(shù)據(jù)的篩選操作;知識(shí)發(fā)現(xiàn)模塊控制并管理知識(shí)發(fā)現(xiàn)過(guò)程,它將數(shù)據(jù)的輸入和知識(shí)庫(kù)中的信息用于驅(qū)動(dòng)數(shù)據(jù)選擇過(guò)程、知識(shí)發(fā)現(xiàn)引擎過(guò)程和發(fā)現(xiàn)的評(píng)價(jià)過(guò)程;人機(jī)交互模塊通過(guò)自然語(yǔ)言處理和語(yǔ)義查詢(xún)?cè)谟脩?hù)和系統(tǒng)之間提供相互聯(lián)系的集成界面。數(shù)據(jù)挖掘工具用于完成實(shí)際決策問(wèn)題所
7、需的各種查詢(xún)檢索工具、多維數(shù)據(jù)的聯(lián)機(jī)分析分析工具等,以實(shí)現(xiàn)決策支持系統(tǒng)的各種要求。
數(shù)據(jù)挖掘主要提供了以下幾種模式:
(一)分類(lèi)模式:根據(jù)數(shù)據(jù)的值從樹(shù)根開(kāi)始搜索,沿著數(shù)據(jù)滿(mǎn)足的分支往上走,直到樹(shù)葉確定類(lèi)別。
(二)回歸模式:回歸模式與分類(lèi)模式相似,區(qū)別在于分類(lèi)模式的預(yù)測(cè)值是離散的,而回歸模式的預(yù)測(cè)值是連續(xù)的。
(三)時(shí)間序列模式:根據(jù)數(shù)據(jù)隨時(shí)間變化的趨勢(shì)預(yù)測(cè)