青大《數(shù)據(jù)倉庫數(shù)據(jù)挖掘》作業(yè)

青大《數(shù)據(jù)倉庫數(shù)據(jù)挖掘》作業(yè)

ID:34845276

大?。?13.50 KB

頁數(shù):5頁

時(shí)間:2019-03-12

青大《數(shù)據(jù)倉庫數(shù)據(jù)挖掘》作業(yè)_第1頁
青大《數(shù)據(jù)倉庫數(shù)據(jù)挖掘》作業(yè)_第2頁
青大《數(shù)據(jù)倉庫數(shù)據(jù)挖掘》作業(yè)_第3頁
青大《數(shù)據(jù)倉庫數(shù)據(jù)挖掘》作業(yè)_第4頁
青大《數(shù)據(jù)倉庫數(shù)據(jù)挖掘》作業(yè)_第5頁
資源描述:

《青大《數(shù)據(jù)倉庫數(shù)據(jù)挖掘》作業(yè)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、2012春《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》復(fù)習(xí)提綱1、商務(wù)智能【參考:BI是一種解決方案,它的目的是把用戶積累下來的、大量的數(shù)據(jù)轉(zhuǎn)化為業(yè)務(wù)容易理解的信息,進(jìn)而輔助決策?!?、Kimball對數(shù)據(jù)倉庫的定義【參考:DW僅僅是構(gòu)成它的數(shù)據(jù)集市的聯(lián)合?!?、Inmon對數(shù)據(jù)倉庫的定義【參考:一個(gè)面向主題的、集成的、隨時(shí)間變化的、非易逝的用于支持管理的決策過程的數(shù)據(jù)集合?!?、ETL【參考:數(shù)據(jù)的提取、轉(zhuǎn)換和裝載,預(yù)處理數(shù)據(jù)并裝在DW中?!?、數(shù)據(jù)倉庫總線矩陣【參考:該矩陣將公司業(yè)務(wù)過程映射到參與這些過程的實(shí)體或?qū)ο?。矩陣的每一行對?yīng)一個(gè)業(yè)務(wù)過程,每一列描述對象,它們參與了各種業(yè)務(wù)過程?!坎殤Z潤厲釤瘞睞櫪廡賴。

2、6、事實(shí)【參考:對一些事件發(fā)生結(jié)果的度量?!?、維度【參考:維度是維度模型的基礎(chǔ),用來描述業(yè)務(wù)的對象?!?、粒度【參考:事實(shí)表中包含信息的詳盡程度?!?、維度模型【參考:由一個(gè)中心事實(shí)表(或者多個(gè)事實(shí)表)和與其相關(guān)的維度構(gòu)成。事實(shí)表位于中心,而所有維度表環(huán)繞在其周圍,類似于星形結(jié)構(gòu),因此又把維度模型稱為星形模式?!?0、業(yè)務(wù)過程維度模型【參考:關(guān)于一個(gè)業(yè)務(wù)過程所有的維度模型的集合。】11、多維數(shù)據(jù)集(又稱為數(shù)據(jù)立方體)由維度和一個(gè)或多個(gè)度量組構(gòu)成的多維分析結(jié)構(gòu),用于OLAP12、部署【參考:將多維數(shù)據(jù)集的定義發(fā)布到OLAP服務(wù)器上的過程。】13、OLAP聯(lián)機(jī)分析處理采用多維數(shù)據(jù)結(jié)構(gòu)和層次結(jié)構(gòu)作

3、為導(dǎo)航,探查匯總數(shù)據(jù),輔助決策。14、代理鍵【參考:對于DW/BI系統(tǒng),需要在數(shù)據(jù)倉庫數(shù)據(jù)庫中建立一組與事務(wù)處理源系統(tǒng)中的鍵分離開來的全新的鍵,稱這種鍵為代理鍵?!开?dú)立于業(yè)務(wù)鍵的用于數(shù)據(jù)倉庫中的從ETL中的人工鍵15、漸變維度【參考:屬性值可以改變的維度。分為值的改變需要跟蹤和不需要跟蹤兩種?!?6、聚合【參考:經(jīng)過預(yù)先計(jì)算后形成的匯總表,主要目標(biāo)是用來改進(jìn)查詢性能。】17、星型模型【參考:由一個(gè)事實(shí)表和多個(gè)維度表構(gòu)成的模型。事實(shí)表與維度表是1對多關(guān)系。事實(shí)表位于中心,而所有維度表環(huán)繞在其周圍,類似于星形結(jié)構(gòu)。】聞創(chuàng)溝燴鐺險(xiǎn)愛氌譴凈。18、雪花模型【參考:雪花模型是將維度表中的字段和查找表相連

4、接而得到的結(jié)果?!?9、事實(shí)星座模型由多個(gè)星型模型或雪花模型通過共享維度形成的多事實(shí)表多維度表的模型20、多維數(shù)據(jù)庫【參考:采用多維數(shù)據(jù)組存儲(chǔ)數(shù)據(jù),主要應(yīng)用于OLAP服務(wù)器的數(shù)據(jù)存5/5儲(chǔ)結(jié)構(gòu)。】1、SQLServer2005的維度層次2、SQLServer2005的屬性層次SQLServerAnalysisService默認(rèn)為每個(gè)維度每個(gè)屬性構(gòu)成的單層結(jié)構(gòu)殘騖樓諍錈瀨濟(jì)溆塹籟。3、數(shù)據(jù)挖掘【參考答案:從海量數(shù)據(jù)中提取有趣模式或知識(shí)(有趣是指:隱含的、非平凡的、事先未知的、潛在有用的)】釅錒極額閉鎮(zhèn)檜豬訣錐。4、數(shù)據(jù)挖掘的兩大類通用功能【參考答案:描述型數(shù)據(jù)挖掘和預(yù)測型數(shù)據(jù)挖掘。前者用于刻畫數(shù)

5、據(jù)集的一般特征,后者對現(xiàn)有數(shù)據(jù)進(jìn)行推演以用于新實(shí)例(某個(gè)屬性的取值)的預(yù)測?!繌椯Q(mào)攝爾霽斃攬磚鹵廡。5、OLAM【參考答案:On-LineAnalyticalMining,聯(lián)機(jī)分析挖掘,將OLAP與數(shù)據(jù)挖掘相互融合進(jìn)行數(shù)據(jù)探查分析,是未來基于數(shù)據(jù)倉庫的數(shù)據(jù)分析的一種趨勢】謀蕎摶篋飆鐸懟類蔣薔。6、簡單了解關(guān)聯(lián)分析(又稱為關(guān)聯(lián)規(guī)則挖掘或購物籃分析)、分類、回歸、聚類分析的功能關(guān)聯(lián)分析:發(fā)現(xiàn)交易數(shù)據(jù)庫中不同商品(項(xiàng))之間的聯(lián)系分類:預(yù)測離散屬性的取值回歸:預(yù)測連續(xù)屬性的取值聚類分析:將數(shù)據(jù)分類到不同的類或者簇7、數(shù)據(jù)倉庫各環(huán)節(jié)工具(如ETL)的市場占有率最高的公司【參考:(1)OLAP市場,微軟第

6、一;(2)ETL市場三大主流:Powercenter(美國Information公司)—ETL市場老大;DataStage(IBM公司);ETLAutomation(數(shù)據(jù)倉庫(引擎)老大美國Teradata公司)。DI(DataIntegrator(BO公司)廈礴懇蹣駢時(shí)盡繼價(jià)騷。8、數(shù)據(jù)庫和數(shù)據(jù)倉庫的區(qū)別【參考答案:(1)應(yīng)用目的不同:數(shù)據(jù)庫主要用于構(gòu)建聯(lián)機(jī)事務(wù)處理(OLTP)系統(tǒng),這種系統(tǒng)自己產(chǎn)生新數(shù)據(jù),每次事務(wù)處理涉及的記錄數(shù)較少,通常為幾條;而數(shù)據(jù)倉庫主要用于構(gòu)建分析型決策支持系統(tǒng),這種系統(tǒng)自己不產(chǎn)生新數(shù)據(jù),所使用的數(shù)據(jù)來自于OLTP系統(tǒng)或其他數(shù)據(jù)源。(2)數(shù)據(jù)的時(shí)間跨度不同:數(shù)據(jù)庫通

7、常存放較新的業(yè)務(wù)數(shù)據(jù);而數(shù)據(jù)倉庫中存放的是歷史業(yè)務(wù)數(shù)據(jù),其時(shí)間跨度為5~10年。(3)數(shù)據(jù)的業(yè)務(wù)范圍不同:數(shù)據(jù)庫系統(tǒng)通常關(guān)注局部業(yè)務(wù)范圍的事務(wù)處理;數(shù)據(jù)倉庫通常要關(guān)注整個(gè)企業(yè)的全部業(yè)務(wù)。(4)所采用的設(shè)計(jì)技術(shù)不同:數(shù)據(jù)庫面向事務(wù),采用三范式(3NF)建模;數(shù)據(jù)倉庫則面向主題,采用三范式(3NF)或維度模型建模。(5)注重的技術(shù)不同:數(shù)據(jù)庫系統(tǒng)存在大量的數(shù)據(jù)查詢和數(shù)據(jù)更新,需要重點(diǎn)考慮包括數(shù)據(jù)更新和

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。