資源描述:
《數(shù)據(jù)挖掘技術(shù)分析及其在高校管理決策中的應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、數(shù)據(jù)挖掘技術(shù)分析及其在高校管理決策中的應(yīng)用【摘要】本文通過對(duì)數(shù)據(jù)倉庫、數(shù)據(jù)挖掘技術(shù)和決策支持系統(tǒng)的研究,提出了基于數(shù)據(jù)挖掘的高校管理決策支持系統(tǒng)。該系統(tǒng)能為高校決策提供科學(xué)的依據(jù)和指導(dǎo)其發(fā)展方向。【關(guān)鍵詞】數(shù)據(jù)挖掘;決策支持系統(tǒng);數(shù)據(jù)倉庫;決策樹隨著高校招生規(guī)模逐年擴(kuò)大以及教育方式更加靈活多樣,幾乎每所高校都面臨著學(xué)生人數(shù)的急劇增加與教學(xué)資源日趨緊張的矛盾,同時(shí)高校的一些機(jī)構(gòu)也在不斷地改革變化,這些都給高校的管理帶來了前所未有的發(fā)展和挑戰(zhàn)。在這樣的形勢下,高校應(yīng)如何以最小的代價(jià)獲得最大的發(fā)展成為一個(gè)亟待解決的新課題。具體來說,現(xiàn)在要求高校領(lǐng)導(dǎo)層從整體的、宏觀的角度認(rèn)清形勢,解決問題,優(yōu)化
2、教育資源配置,提高教育資源利用率。為此,建立一個(gè)有效的高校管理決策支持系統(tǒng)(DecisionSupportingSystem,簡稱DSS)則顯得十分必要。該系統(tǒng)的各項(xiàng)功能除了滿足日常簡單的查詢、統(tǒng)計(jì)和維護(hù)、全局統(tǒng)籌規(guī)劃管理高校各種信息、協(xié)調(diào)各部門工作順利開展,還能夠?yàn)楦咝Q策者提供有關(guān)教育形勢的瞬時(shí)變化、發(fā)展趨勢以及通過高科技手段來開發(fā)歷史數(shù)據(jù),提取隱含在其中的事先未知的、潛在的、深層次的、有價(jià)值的信息,以利于管理和決策的開展和進(jìn)行。一般在建立DSS時(shí),會(huì)利用傳統(tǒng)的數(shù)據(jù)庫DB(Database)技術(shù),但傳統(tǒng)的DB技術(shù)目前無法為數(shù)據(jù)的合成、分類和綜合提供強(qiáng)大的功能支持。此外,為實(shí)施有效的分
3、析,信息應(yīng)以與決策密切相關(guān)的主題為中心組織起來,這些都是DB滿足不了的。而數(shù)據(jù)倉庫技術(shù)的出現(xiàn)給決策支持系統(tǒng)的發(fā)展注入了新的活力,它把決策者所需的信息從原始的操作數(shù)據(jù)中分離出來,把分散的、難以訪問的原始數(shù)據(jù)操作數(shù)據(jù)轉(zhuǎn)化為集中統(tǒng)一、隨時(shí)可訪問的信息,即數(shù)據(jù)倉庫對(duì)信息實(shí)現(xiàn)合理、全面而高效的管理。因此,研究數(shù)據(jù)倉庫和它的相關(guān)技術(shù)并應(yīng)用于高校決策支持系統(tǒng)中是極其有效的途徑。本文所采用的解決方案,就是一個(gè)以數(shù)據(jù)倉庫(DataWarehouse,簡稱DW)技術(shù)為基礎(chǔ),以數(shù)據(jù)挖掘(DataMining,簡稱DM)工具為手段的高校管理決策支持系統(tǒng)。該系統(tǒng)中,DW用于存儲(chǔ)和組織高校的基礎(chǔ)數(shù)據(jù),而DM則可以利
4、用該基礎(chǔ)數(shù)據(jù),通過一系列技術(shù)挖掘出有價(jià)值的知識(shí)信息,驗(yàn)證和預(yù)測高校的各項(xiàng)資源,輔助決策,以便在快速變化的競爭中把握高校的發(fā)展方向。一、數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)分析(一)數(shù)據(jù)倉庫技術(shù)分析1.?dāng)?shù)據(jù)倉庫的概念DW作為決策支持系統(tǒng)的基礎(chǔ),不同的人對(duì)數(shù)據(jù)倉庫有不同的定義。公認(rèn)的數(shù)據(jù)倉庫之父W.H.Immon將其定義為:“數(shù)據(jù)倉庫是支持管理決策過程的、面向主題的、集成的、隨時(shí)間變化的、持久的數(shù)據(jù)集合。”數(shù)據(jù)倉庫中的數(shù)據(jù)大體分為四級(jí):遠(yuǎn)期基本數(shù)據(jù)、近期基本數(shù)據(jù)、輕度綜合數(shù)據(jù)和高度綜合數(shù)據(jù)。還有一部分重要數(shù)據(jù)是元數(shù)據(jù),即關(guān)于數(shù)據(jù)的數(shù)據(jù),數(shù)據(jù)倉庫中用來與終端用戶的多維模型與前端工具間建立映射的元數(shù)據(jù),稱為決
5、策支持系統(tǒng)的元數(shù)據(jù)。一個(gè)完整的數(shù)據(jù)倉庫系統(tǒng)應(yīng)當(dāng)具備建立、管理和使用等功能。W.H.1mmon認(rèn)為,數(shù)據(jù)倉庫系統(tǒng)可以分為三個(gè)組成部分:(1)數(shù)據(jù)源:提供源數(shù)據(jù);(2)后端加工處理:包括來自數(shù)據(jù)源數(shù)據(jù)的接受、析取、匯總、變換、打包和儲(chǔ)存等;(3)前端服務(wù):面向用戶的數(shù)據(jù)需求,完成數(shù)據(jù)提取和計(jì)算分析等功能。2.開發(fā)數(shù)據(jù)倉庫的流程開發(fā)數(shù)據(jù)倉庫的流程包括以下幾步:(1)建立開發(fā)數(shù)據(jù)倉庫工程的目標(biāo)及制定工程計(jì)劃;(2)建立技術(shù)環(huán)境,選擇實(shí)現(xiàn)數(shù)據(jù)倉庫的軟硬件資源;(3)根據(jù)決策需求確定主題,進(jìn)行數(shù)據(jù)建模,選擇數(shù)據(jù)源,對(duì)數(shù)據(jù)倉庫的數(shù)據(jù)進(jìn)行邏輯結(jié)構(gòu)設(shè)計(jì);(4)設(shè)計(jì)數(shù)據(jù)倉庫中的數(shù)據(jù)庫,基于用戶的需求,著重于
6、某個(gè)主題,開發(fā)數(shù)據(jù)倉庫中數(shù)據(jù)的物理存儲(chǔ)結(jié)構(gòu),即設(shè)計(jì)多維數(shù)據(jù)結(jié)構(gòu)的事實(shí)表和維表;(5)數(shù)據(jù)轉(zhuǎn)換程序?qū)崿F(xiàn)從源系統(tǒng)中抽取數(shù)據(jù)、清理數(shù)據(jù)、一致性格式化數(shù)據(jù)、裝載數(shù)據(jù)等過程的設(shè)計(jì)和編碼;(6)定義元數(shù)據(jù),即表示、定義數(shù)據(jù)的意義及系統(tǒng)各組成部件之間的關(guān)系。元數(shù)據(jù)包括關(guān)鍵字、屬性、數(shù)據(jù)描述、物理數(shù)據(jù)結(jié)構(gòu)、源數(shù)據(jù)結(jié)構(gòu)、映射及轉(zhuǎn)換規(guī)則、綜合算法、代碼、缺省值、安全要求、變化及數(shù)據(jù)時(shí)限等;(7)開發(fā)用戶決策的數(shù)據(jù)分析工具,建立結(jié)構(gòu)化的決策支持查詢,實(shí)現(xiàn)和使用數(shù)據(jù)倉庫的數(shù)據(jù)分析工具,包括優(yōu)化查詢工具、統(tǒng)計(jì)分析工具、客戶機(jī)/gR務(wù)器工具、聯(lián)機(jī)分析處理工具及數(shù)據(jù)開采工具等,通過分析工具實(shí)現(xiàn)決策支持需求;(8)管理
7、數(shù)據(jù)倉庫環(huán)境,包括質(zhì)量檢測、管理決策支持工具及應(yīng)用程序.并定期進(jìn)行數(shù)據(jù)更新,使數(shù)據(jù)倉庫正常運(yùn)行。3.高校管理中的數(shù)據(jù)倉庫建立從上可知,DW不是業(yè)務(wù)數(shù)據(jù)的簡單堆積,而是從大量的事務(wù)型數(shù)據(jù)庫中抽取數(shù)據(jù),并將其清理、轉(zhuǎn)化為新的存儲(chǔ)格式,即為決策目標(biāo)把數(shù)據(jù)聚合在一種特殊的格式中。隨著此過程的發(fā)展和完善,這種支持決策的、特殊的數(shù)據(jù)存儲(chǔ)即被稱為DW。對(duì)高校管理來說,DSS建立數(shù)據(jù)倉庫的數(shù)據(jù)可能來自如人事處、學(xué)生處、教務(wù)處、財(cái)務(wù)處、設(shè)備處、后勤管