資源描述:
《數(shù)據(jù)挖掘技術(shù)在企業(yè)決策系統(tǒng)中的應(yīng)用研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、數(shù)據(jù)挖掘技術(shù)在企業(yè)決策系統(tǒng)中的應(yīng)用研究
數(shù)據(jù)挖掘技術(shù)在企業(yè)決策系統(tǒng)中的應(yīng)用研究
關(guān)鍵詞:數(shù)據(jù)挖掘;數(shù)據(jù)倉庫;企業(yè)決策系統(tǒng)
摘要:本文首先討論了數(shù)據(jù)挖掘技術(shù),給出了一種企業(yè)決策系統(tǒng)。并就決策系統(tǒng)的構(gòu)成、流程和采用的數(shù)據(jù)挖掘技術(shù)進行了探討。
ResearchofDataMiningTechnologyinBusinessDecision-makingSystem
ShiDongsheng
(InnerMongoliaUniversity,Information&EngineeringTechnologyCollege,I
2、nnerMongolia,Baotou014010,China)
Abstract:Thispaperdiscussesdataminingtechnology,presentsabusinessdecisionsystem.Decision-makingsystemoncomposition,processanduseofdataminingtechniquesarediscussed.
Keywords:Datamining;Datawarehouse;Businessdecision-makingsystem
隨著計算機管理信息系統(tǒng)的飛速發(fā)展和廣泛應(yīng)用,企業(yè)
3、生產(chǎn)經(jīng)營的自動化水平不斷提高,大大提高了工作效率。但企業(yè)業(yè)務(wù)系統(tǒng)運行所產(chǎn)生的大量原始數(shù)據(jù)是企業(yè)生產(chǎn)經(jīng)營活動的真實記錄,不能為本企業(yè)加以有效的統(tǒng)計、分析及評估,無法將這些數(shù)據(jù)轉(zhuǎn)換成企業(yè)有用的信息、為企業(yè)戰(zhàn)略決策提供參考和支持。數(shù)據(jù)挖掘正是在這樣的應(yīng)用需求環(huán)境下產(chǎn)生并迅速發(fā)展起來的,它的出現(xiàn)為智能地把海量數(shù)據(jù)轉(zhuǎn)化為有用的信息和知識提供了新的思路和手段,設(shè)計開發(fā)基于數(shù)據(jù)挖掘的企業(yè)決策系統(tǒng)是合理解決這一問題,提升企業(yè)綜合競爭力的最佳對策。
一、數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘,是指從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們不知道的、但又是潛在有用的信息和知識的
4、過程。它是數(shù)據(jù)庫研究中的一個新領(lǐng)域,融合了數(shù)據(jù)庫、人工智能、機器學(xué)習(xí)、統(tǒng)計學(xué)等多個領(lǐng)域的理論和技術(shù),把人們對數(shù)據(jù)的應(yīng)用從低層次的查詢,提升到從數(shù)據(jù)中挖掘知識,提供決策支持的層級。
數(shù)據(jù)挖掘一般由數(shù)據(jù)準備、挖掘操作、結(jié)果表達和解釋三個主要階段組成。在數(shù)據(jù)準備階段應(yīng)集成多個運作數(shù)據(jù)源中的數(shù)據(jù),解決語義模糊性、處理遺漏數(shù)據(jù)、清洗臟數(shù)據(jù)。挖掘階段是一個假設(shè)產(chǎn)生、合成、修正和驗證傳播的過程,也是上述三個階段的核心。結(jié)果表達和解釋階段根據(jù)最終用戶的決策目的把提取的有用信息正確地表達出來。
數(shù)據(jù)挖掘的方法和技術(shù)可大致劃分為三類:統(tǒng)計分析、知識發(fā)現(xiàn)、可視化技術(shù)等。統(tǒng)計分析用于檢查異常形式的
5、數(shù)據(jù),然后利用統(tǒng)計模型和數(shù)學(xué)模型來解釋這些數(shù)據(jù),統(tǒng)計分析方法是目前最成熟的數(shù)據(jù)挖掘工具。而知識發(fā)現(xiàn)則著眼于發(fā)現(xiàn)大量數(shù)據(jù)記錄中潛在的有用信息或新的知識,屬于所謂“發(fā)現(xiàn)驅(qū)動”的數(shù)據(jù)挖掘技術(shù)途經(jīng)。知識發(fā)現(xiàn)常用的方法有人工神經(jīng)網(wǎng)絡(luò)、決策樹、遺傳算法、模糊計算或模糊推理等。數(shù)據(jù)質(zhì)量、可視化數(shù)據(jù)的能力、極大數(shù)據(jù)庫尺寸、數(shù)據(jù)挖掘者的技能、數(shù)據(jù)的粒度都是影響知識發(fā)現(xiàn)方法的重要因素??梢暬夹g(shù)則采用直觀的圖形方式將信息模式、數(shù)據(jù)的關(guān)聯(lián)或趨勢呈現(xiàn)給決策者,決策者可以通過可視化技術(shù)交互式地分析數(shù)據(jù)關(guān)系。
二、基于數(shù)據(jù)挖掘的企業(yè)決策系統(tǒng)
數(shù)據(jù)挖掘面對的是經(jīng)初步加工的數(shù)據(jù),使得數(shù)據(jù)挖掘更專注于知識的
6、發(fā)現(xiàn);而數(shù)據(jù)倉庫用于完成數(shù)據(jù)的收集、集成、存儲、管理等工作,兩者必須有機結(jié)合起來使用。
基于數(shù)據(jù)挖掘的企業(yè)決策系統(tǒng)主要由數(shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)倉庫管理模塊、知識庫、知識發(fā)現(xiàn)模塊、數(shù)據(jù)挖掘工具、人機交互模塊構(gòu)成(如下圖所示)。系統(tǒng)的輸入主要源于經(jīng)過初步處理的數(shù)據(jù)庫數(shù)據(jù)以及存儲在知識庫中的歷史知識和經(jīng)驗;數(shù)據(jù)倉庫管理模塊用于數(shù)據(jù)倉庫的建立以及數(shù)據(jù)的篩選操作;知識發(fā)現(xiàn)模塊控制并管理知識發(fā)現(xiàn)過程,它將數(shù)據(jù)的輸入和知識庫中的信息用于驅(qū)動數(shù)據(jù)選擇過程、知識發(fā)現(xiàn)引擎過程和發(fā)現(xiàn)的評價過程;人機交互模塊通過自然語言處理和語義查詢在用戶和系統(tǒng)之間提供相互聯(lián)系的集成界面。數(shù)據(jù)挖掘工具用于完成實際決策問題所
7、需的各種查詢檢索工具、多維數(shù)據(jù)的聯(lián)機分析分析工具等,以實現(xiàn)決策支持系統(tǒng)的各種要求。
數(shù)據(jù)挖掘主要提供了以下幾種模式:
(一)分類模式:根據(jù)數(shù)據(jù)的值從樹根開始搜索,沿著數(shù)據(jù)滿足的分支往上走,直到樹葉確定類別。
(二)回歸模式:回歸模式與分類模式相似,區(qū)別在于分類模式的預(yù)測值是離散的,而回歸模式的預(yù)測值是連續(xù)的。
(三)時間序列模式:根據(jù)數(shù)據(jù)隨時間變化的趨勢預(yù)測