數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課件ppt

數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課件ppt

ID:1507332

大小:174.50 KB

頁數(shù):58頁

時間:2017-11-12

數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課件ppt_第1頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課件ppt_第2頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課件ppt_第3頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課件ppt_第4頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課件ppt_第5頁
資源描述:

《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課件ppt》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫

1、課程安排數(shù)據(jù)倉庫:18學(xué)時 數(shù)據(jù)挖掘:18學(xué)時 考試:撰寫論文第一章數(shù)據(jù)倉庫的基本概念案例討論:下圖展示了某電信公司的市場部和計劃部對業(yè)務(wù)A是否具有市場前景的分析過程和結(jié)果。試討論為什么兩部門分析結(jié)果不同。企業(yè)級數(shù)據(jù)庫市場部分析程序1分析結(jié)果1:前景很好計劃部分析程序2分析結(jié)果2:前景不好第一章:數(shù)據(jù)倉庫的基本概念1-1數(shù)據(jù)倉庫的產(chǎn)生與發(fā)展傳統(tǒng)的數(shù)據(jù)庫技術(shù)作為數(shù)據(jù)管理手段,主要用于聯(lián)機事務(wù)處理(OLTP,On-LineTransactionProcess),數(shù)據(jù)庫中保存的是大量的日常業(yè)務(wù)數(shù)據(jù)。在數(shù)據(jù)共享、數(shù)據(jù)與應(yīng)用程序的獨立性、維護(hù)數(shù)據(jù)

2、的一致性與完整性、數(shù)據(jù)的安全保密性等方面提供了有效的手段。第一章數(shù)據(jù)倉庫的基本概念與分析型應(yīng)用結(jié)合時存在的問題:決策支持系統(tǒng)為掌握充分的信息,需要訪問大量的企業(yè)內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)。傳統(tǒng)數(shù)據(jù)庫中的大量數(shù)據(jù)是事務(wù)型數(shù)據(jù),即該數(shù)據(jù)是對每一項工作、管理對象的具體的、細(xì)節(jié)性的描述。事務(wù)處理型應(yīng)用與分析決策型應(yīng)用對數(shù)據(jù)庫系統(tǒng)的性能要求不同。傳統(tǒng)數(shù)據(jù)庫中保存和管理的一般是當(dāng)前數(shù)據(jù),而決策支持系統(tǒng)不僅需要當(dāng)前的數(shù)據(jù),而且還要求有大量的歷史數(shù)據(jù)。第一章數(shù)據(jù)倉庫的基本概念結(jié)論:在事務(wù)處理型應(yīng)用環(huán)境中直接構(gòu)建分析決策型應(yīng)用是不可行的。于是:面向分析決策型應(yīng)用

3、而組織和存儲數(shù)據(jù)的數(shù)據(jù)倉庫技術(shù)應(yīng)運而生。第一章數(shù)據(jù)倉庫的基本概念時間:20世紀(jì)80年代初人物:W.H.Inmon定義:數(shù)據(jù)倉庫是面向主題的、集成的、具有時間特征的、穩(wěn)定的數(shù)據(jù)集合,用以支持經(jīng)營管理中的決策制定過程。Adatawarehouseisasubject-oriented,integrated,time-variant,andnonvolatilecollectionofdatainsupportofmanagement’sdecisionmakingprocess.第一章數(shù)據(jù)倉庫的基本概念數(shù)據(jù)倉庫的四大特征:數(shù)據(jù)是面向主題的數(shù)

4、據(jù)是集成的數(shù)據(jù)是具有時間特征的數(shù)據(jù)是相對穩(wěn)定的數(shù)據(jù)倉庫的其它特點:數(shù)據(jù)量非常大(10GB---1000GB)是數(shù)據(jù)庫技術(shù)的一種新的應(yīng)用使用人員較少第一章數(shù)據(jù)倉庫的基本概念1-2數(shù)據(jù)倉庫與數(shù)據(jù)庫操作型數(shù)據(jù)庫分析型數(shù)據(jù)倉庫系統(tǒng)目的支持日常操作支持管理需求,獲取信息使用人員辦事員、DBA、數(shù)據(jù)庫專家經(jīng)理、管理人員、分析專家數(shù)據(jù)內(nèi)容當(dāng)前數(shù)據(jù)歷史數(shù)據(jù)、派生數(shù)據(jù)數(shù)據(jù)特點細(xì)節(jié)的綜合的或提煉的數(shù)據(jù)組織面向應(yīng)用面向主題存取類型添加、修改、查詢、刪除查詢、聚集數(shù)據(jù)穩(wěn)定性動態(tài)的相對穩(wěn)定第一章數(shù)據(jù)倉庫的基本概念續(xù)上表:操作型數(shù)據(jù)庫分析型數(shù)據(jù)倉庫需求特點需求事先

5、可知道需求事先不知道操作特點一個時刻操作一單元一個時刻操作一集合數(shù)據(jù)庫設(shè)計基于E-R圖基于星型模式、雪花模式一次操作數(shù)據(jù)量一次操作數(shù)據(jù)量小一次操作數(shù)據(jù)量大存取頻率較高較低響應(yīng)時間小于3秒幾秒—幾十分鐘第一章數(shù)據(jù)倉庫的基本概念1-3數(shù)據(jù)倉庫技術(shù)的術(shù)語主題:(Subject)主題是一個在較高層次上將數(shù)據(jù)歸類的標(biāo)準(zhǔn),每一個主題基本對應(yīng)一個宏觀的分析領(lǐng)域。例:面向主題:產(chǎn)品訂貨分析,貨物發(fā)運分析,新產(chǎn)品開發(fā)分析;面向應(yīng)用:財務(wù),銷售,供應(yīng),人力資源,生產(chǎn)調(diào)度…….主題域的特征:獨立性,完備性第一章數(shù)據(jù)倉庫的基本概念粒度:(Granularity

6、)粒度是指數(shù)據(jù)倉庫中數(shù)據(jù)單元的詳細(xì)程度和級別。數(shù)據(jù)越詳細(xì),粒度越小,級別越低,回答查詢的種類就越多。(數(shù)據(jù)堆積,回答綜合問題效率低)數(shù)據(jù)越綜合,粒度越大,級別越高,回答查詢的種類就越少。第一章數(shù)據(jù)倉庫的基本概念維度:(Dimension)維度是指人們觀察事物的角度。例如:當(dāng)人們關(guān)注產(chǎn)品銷售情況時,有如下維度:時間維:隨時間變化的銷售數(shù)據(jù);地區(qū)維:不同地區(qū)的銷售數(shù)據(jù);客戶維:不同客戶的銷售;……根據(jù)觀察事物角度的細(xì)節(jié)程度不同,維又具有維層次。數(shù)據(jù);渠道維:不同銷售渠道的銷售數(shù)據(jù);產(chǎn)品維:不同產(chǎn)品的銷售數(shù)據(jù)例:時間維:日期、周、月份、季度、

7、年等;地區(qū)維:城市、地區(qū)、國家等。第一章數(shù)據(jù)倉庫的基本概念數(shù)據(jù)立方體:數(shù)據(jù)立方體是指由兩個或更多個屬性即兩個或更多個維來描述或者分類的數(shù)據(jù)。在三維的情況下可以用圖形來表示,一般稱為數(shù)據(jù)立方體。實際的數(shù)據(jù)倉庫的應(yīng)用中,數(shù)據(jù)是多維的。第一章數(shù)據(jù)倉庫的基本概念聯(lián)機分析處理:(OLAP)聯(lián)機分析處理是快速、靈活的多維數(shù)據(jù)分析工具。OLAP的目的是支持分析決策,滿足多維環(huán)境的查詢和報表需求。數(shù)據(jù)倉庫的多維數(shù)據(jù)存儲結(jié)構(gòu)為OLAP的實施提供了理想的多維數(shù)據(jù)環(huán)境。第一章數(shù)據(jù)倉庫的基本概念數(shù)據(jù)集市:(DataMart)數(shù)據(jù)集市是完整的數(shù)據(jù)倉庫的一個邏輯子

8、集,而數(shù)據(jù)倉庫正是由其所有的數(shù)據(jù)集市有機組合而成的。一般在某個業(yè)務(wù)部門建立數(shù)據(jù)集市,或稱為部門級數(shù)據(jù)倉庫。建立數(shù)據(jù)集市與數(shù)據(jù)倉庫,一般是采用“自頂向下”和“自下而上”相結(jié)合的設(shè)計思想。第一章數(shù)據(jù)倉庫的基本概

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。