資源描述:
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘概述(學時2)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘(DATAWAREHOUSINGANDDATAMINING)石家莊鐵道大學課程介紹21世紀是一個以計算機技術(shù)和知識經(jīng)濟為核心的信息化時代。隨著計算機技術(shù)、網(wǎng)絡技術(shù)的飛速發(fā)展和數(shù)據(jù)庫應用的不斷深化,數(shù)據(jù)倉庫(DataWarehousing)和數(shù)據(jù)挖掘(DataMining)技術(shù)及其應用已成為計算機科學技術(shù)領(lǐng)域的熱點之一。--課程介紹數(shù)據(jù)庫技術(shù)及其應用的發(fā)展:從關(guān)系模型發(fā)展到面向?qū)ο竽P蛷膯螜C應用發(fā)展到分布式應用從局域網(wǎng)數(shù)據(jù)庫應用發(fā)展到Web數(shù)據(jù)庫應用從聯(lián)機事務處理(OLTP:On-LineTransact
2、ionProcess)發(fā)展到聯(lián)機分析處理(OLAP:On-LineAnalysisProcess)從數(shù)據(jù)庫發(fā)展到數(shù)據(jù)倉庫從數(shù)據(jù)的統(tǒng)計分析發(fā)展到數(shù)據(jù)挖掘--課程介紹(Cont.)目前,計算機科學技術(shù)界的許多專家、學者都在大力研究數(shù)據(jù)倉庫的構(gòu)筑技術(shù)和基于各種模型的數(shù)據(jù)挖掘算法,并取得了可喜的成果。國內(nèi)外一些著名計算機企業(yè)也紛紛提出了數(shù)據(jù)倉庫實施戰(zhàn)略,推出了一些OLAP和數(shù)據(jù)挖掘工具。高等院校的研究生需要掌握這方面的新知識、新技術(shù),掌握數(shù)據(jù)倉庫與數(shù)據(jù)挖掘領(lǐng)域的基本理論、基本原理和實現(xiàn)技術(shù),適應計算機科學技術(shù)新的發(fā)展趨勢。--課
3、程介紹(Cont.)本課程在數(shù)據(jù)倉庫部分全面深入地介紹數(shù)據(jù)倉庫的基本概念和體系結(jié)構(gòu),詳細闡述數(shù)據(jù)倉庫的實現(xiàn)技術(shù);在數(shù)據(jù)挖掘部分介紹數(shù)據(jù)挖掘的各類算法(包括關(guān)聯(lián)規(guī)則挖掘算法、分類規(guī)則挖掘算法、聚類分析算法、WEB數(shù)據(jù)挖掘等)。--學時及成績評定學時:32=20+12教學形式:講解、報告、實驗等考核方式:C方式C:平時(30%)+課程論文(70%)平時:出勤、課堂表現(xiàn)、作業(yè)、報告等課程論文:專題論文、實驗報告等--參考資料1.王麗珍,周麗華等.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理及應用.北京:科學出版社,20052.安淑芝等.數(shù)據(jù)倉庫與數(shù)
4、據(jù)挖掘.北京:清華大學出版社,20053.陳京民.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù).北京:電子工業(yè)出版社,20024.DataMiningConceptsandTechniques.(影印版).北京:高等教育出版社,20015.有關(guān)參考資料和文獻、學術(shù)刊物上有關(guān)論文--主要內(nèi)容數(shù)據(jù)倉庫與數(shù)據(jù)挖掘概述數(shù)據(jù)倉庫的數(shù)據(jù)模型與數(shù)據(jù)組織數(shù)據(jù)倉庫的開發(fā)方法及開發(fā)過程數(shù)據(jù)集市及開發(fā)OLAP概述、MOLAP與ROLAP數(shù)據(jù)挖掘技術(shù)與算法數(shù)據(jù)挖掘工具及其應用--第1章數(shù)據(jù)倉庫與數(shù)據(jù)挖掘概述本章要點數(shù)據(jù)倉庫的發(fā)展數(shù)據(jù)倉庫的基本概念數(shù)據(jù)挖掘的發(fā)展數(shù)據(jù)挖
5、掘的基本概念數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的集成--1.引言在最近的幾十年當中,有關(guān)數(shù)據(jù)庫新技術(shù)的研究有三件事情值得我們加以關(guān)注:面向?qū)ο髷?shù)據(jù)庫:80年代末—數(shù)據(jù)倉庫:90年代初—對象--關(guān)系數(shù)據(jù)庫:90年代中—--數(shù)據(jù)庫方式數(shù)據(jù)倉庫方式80年代以后90年代以后以支持日常業(yè)務處理過程為目的(OLTP)以支持經(jīng)營管理過程中的決策制定為目的(DSS)進入90年代以后,數(shù)據(jù)庫系統(tǒng)的應用從傳統(tǒng)的事務處理應用擴展到輔助決策等新的集成應用領(lǐng)域。--面向?qū)ο髷?shù)據(jù)庫數(shù)據(jù)倉庫對象--關(guān)系數(shù)據(jù)庫為傳統(tǒng)的RDB開拓了新的應用途徑:聯(lián)機分析處理(OLAP)
6、數(shù)據(jù)挖掘(DM)--2.從數(shù)據(jù)庫到數(shù)據(jù)倉庫基于數(shù)據(jù)庫技術(shù)的數(shù)據(jù)處理操作可以分為兩大類:操作型處理分析型處理--操作型處理分析型處理也叫事務處理,是指對數(shù)據(jù)庫的日常聯(lián)機訪問操作,所以也叫聯(lián)機事務處理(OLTP:On-LineTransactionProcess)。其訪問特點是:通常僅僅是對一個或一組記錄的查詢或修改執(zhí)行頻率高人們關(guān)心的是處理的響應時間、數(shù)據(jù)的安全性和完整性等指標。--操作型處理分析型處理也叫聯(lián)機分析處理(OLAP:On-LineAnalysesProcess).用于企業(yè)管理人員的決策分析,為制訂企業(yè)的未來經(jīng)
7、營管理計劃提供輔助決策信息,如決策支持系統(tǒng)(DSS--DecisionSupportSystem)。其訪問特點是:需要執(zhí)行大量的統(tǒng)計操作需要訪問大量的歷史數(shù)據(jù)執(zhí)行頻率和對響應時間的要求都不高。--展示模型庫數(shù)據(jù)庫方法庫圖1傳統(tǒng)的DSS決策模型決策支持系統(tǒng)是70年代興起的一種計算機應用技術(shù),用于幫助企業(yè)領(lǐng)導作輔助性決策。傳統(tǒng)的DSS系統(tǒng)由三個組成部分:數(shù)據(jù)、算法與模型、展示。其結(jié)構(gòu)模型如圖1所示:--在傳統(tǒng)的以數(shù)據(jù)庫為核心的事務處理環(huán)境中不適宜建立DSS等分析型應用的原因主要有以下五條:事務處理:用戶每次操作處理的時間短,
8、存取數(shù)據(jù)量小,但操作頻率高,并發(fā)程度大。分析處理:每次分析可能需要連續(xù)運行很長的時間,存取數(shù)據(jù)量大,但很少做這樣的分析處理,也沒有并發(fā)執(zhí)行的要求。(1)事務處理和分析處理的性能特性不同--分析處理:DSS需要集成的數(shù)據(jù),包括整個企業(yè)內(nèi)部各部門的相關(guān)數(shù)據(jù),還需要企業(yè)外部、競爭對手等處的相關(guān)數(shù)據(jù)。全面而正確的數(shù)據(jù)是有效的