數(shù)據(jù)倉庫的發(fā)展歷程簡述.doc

數(shù)據(jù)倉庫的發(fā)展歷程簡述.doc

ID:58535585

大?。?86.50 KB

頁數(shù):12頁

時間:2020-09-03

數(shù)據(jù)倉庫的發(fā)展歷程簡述.doc_第1頁
數(shù)據(jù)倉庫的發(fā)展歷程簡述.doc_第2頁
數(shù)據(jù)倉庫的發(fā)展歷程簡述.doc_第3頁
數(shù)據(jù)倉庫的發(fā)展歷程簡述.doc_第4頁
數(shù)據(jù)倉庫的發(fā)展歷程簡述.doc_第5頁
資源描述:

《數(shù)據(jù)倉庫的發(fā)展歷程簡述.doc》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、數(shù)據(jù)倉庫發(fā)展歷程及相關(guān)概念1.1概述數(shù)據(jù)倉庫的概念可能比一般人想像的都要早一些,中間也經(jīng)歷比較曲折的過程。其最初的目標(biāo)是為了實現(xiàn)全企業(yè)的集成(EnterpriseIntegration),但是在發(fā)展過程中卻退而求其次:建立戰(zhàn)術(shù)性的數(shù)據(jù)集市(DataMarts)。到目前為止,還有很多分歧、論爭,很多概念模棱兩可甚至是徹底的讓人迷惑。本文試圖從數(shù)據(jù)倉庫的發(fā)展歷史中看到一些發(fā)展的脈絡(luò),了解數(shù)據(jù)倉庫應(yīng)該是怎么樣的,并展望一下未來的數(shù)據(jù)倉庫發(fā)展方向。同時,由于新應(yīng)用的不斷出現(xiàn),出現(xiàn)了很多新的概念和新的應(yīng)用,這些新的應(yīng)用如何統(tǒng)一現(xiàn)成完整的企業(yè)BI應(yīng)用方案還存在很多爭論。

2、本文試圖對這些概念做一些簡要的闡述,讓大家對此有初步的了解。1.2粗略發(fā)展過程1.2.1開始階段(1978-1988)數(shù)據(jù)倉庫最早的概念可以追溯到20世紀70年代MIT的一項研究,該研究致力于開發(fā)一種優(yōu)化的技術(shù)架構(gòu)并提出這些架構(gòu)的指導(dǎo)性意見。第一次,MIT的研究員將業(yè)務(wù)系統(tǒng)和分析系統(tǒng)分開,將業(yè)務(wù)處理和分析處理分成不同的層次,并采用單獨的數(shù)據(jù)存儲和完全不同的設(shè)計準(zhǔn)則。同時,MIT的研究成果與80年代提出的信息中心(InformationCenter)相吻合:即把那些新出現(xiàn)的、不可以預(yù)測的、但是大量存在的分析型的負載從業(yè)務(wù)處理系統(tǒng)中剝離出來。但是限于當(dāng)時的信息處

3、理和數(shù)據(jù)存儲能力,該研究只是確立了一個論點:這兩種信息處理的方式差別如此之大,以至于它們只能采用完全不同的架構(gòu)和設(shè)計方法。之后,在80年代中后期,作為當(dāng)時技術(shù)最先進的公司,DEC已經(jīng)開始采用分布式網(wǎng)絡(luò)架構(gòu)來支持其業(yè)務(wù)應(yīng)用,并且DEC公司首先將業(yè)務(wù)系統(tǒng)移植到其自身的RDBMS產(chǎn)品:RdB。并且,DEC公司從工程部、銷售部、財務(wù)部以及信息技術(shù)部抽調(diào)了不同的人員組建了新的小組,不僅研究新的分析系統(tǒng)架構(gòu),并要求將其應(yīng)用到其全球的財務(wù)系統(tǒng)中。該小組結(jié)合MIT的研究結(jié)論,建立了TA2(TechnicalArchitecture2)規(guī)范,該規(guī)范定義了分析系統(tǒng)的四個組成部分

4、:¨數(shù)據(jù)獲取、數(shù)據(jù)訪問、目錄、用戶服務(wù)其中的數(shù)據(jù)獲取和數(shù)據(jù)訪問目前大家都很清楚,而目錄服務(wù)是用于幫助用戶在網(wǎng)絡(luò)中找到他們想要的信息,類似于業(yè)務(wù)元數(shù)據(jù)管理;用戶服務(wù)用以支持對數(shù)據(jù)的直接交互,包含了其他服務(wù)的所有人機交互界面,這是系統(tǒng)架構(gòu)的一個非常大的轉(zhuǎn)變,第一次將交互界面作為單獨的組件提出來。1.1.1全企業(yè)集成(EnterpriseIntergration,1988)同時,IBM也在處理信息管理不同方面的問題,其最煩人的問題是不斷增加的信息孤島,IBM的很多客戶要面對很多分立系統(tǒng)的數(shù)據(jù)集成問題,而這些系統(tǒng)有不同的編碼方式和數(shù)據(jù)格式。1988年,為解決全企業(yè)集

5、成問題,IBM愛爾蘭公司的BarryDevlin和PaulMurphy第一次提出了“信息倉庫(InformationWarehouse)”的概念,將其定義為:“一個結(jié)構(gòu)化的環(huán)境,能支持最終用戶管理其全部的業(yè)務(wù),并支持信息技術(shù)部門保證數(shù)據(jù)質(zhì)量”,并在1991年在DECTA2的基礎(chǔ)上把信息倉庫的概念包含進去,并稱之為VITAL規(guī)范(virtuallyintegratedtechnicalarchitecturelifecycle),將PC、圖形化界面、面向?qū)ο蟮慕M件以及局域網(wǎng)都包含在VITAL里,并定義了85種信息倉庫的組件,包括數(shù)據(jù)抽取、轉(zhuǎn)換、有效性驗證、加載

6、、Cube開發(fā)和圖形化查詢工具等。但是IBM只是將這種領(lǐng)先的概念用于市場宣傳,而沒有付諸實際的架構(gòu)設(shè)計。這是IBM有一個領(lǐng)域上創(chuàng)新后停止不前導(dǎo)致喪失其領(lǐng)先地位。因此,在90年代初期,數(shù)據(jù)倉庫的基本原理、框架架構(gòu),以及分析系統(tǒng)的主要原則都已經(jīng)確定,主要的技術(shù),包括關(guān)系型數(shù)據(jù)存取、網(wǎng)絡(luò)、C/S架構(gòu)和圖形化界面均已具備,只欠東風(fēng)了。同時,在1988年-1991年,一些前沿的公司已經(jīng)開始建立數(shù)據(jù)倉庫。1.1.2企業(yè)級數(shù)據(jù)倉庫(EDW,1991)1991年,BillInmon出版了其有關(guān)數(shù)據(jù)倉庫的第一本書,這本書不僅僅說明為什么要建數(shù)據(jù)倉庫、數(shù)據(jù)倉庫能給你帶來什么,更

7、重要的是,Inmon第一次提供了如何建設(shè)數(shù)據(jù)倉庫的指導(dǎo)性意見,該書定義了數(shù)據(jù)倉庫非常具體的原則,包括:¨數(shù)據(jù)倉庫是面向主題的(Subject-Oriented)、¨集成的(Integrated)、¨包含歷史的(Time-variant)、¨不可更新的(Nonvolatile)、¨面向決策支持的(DecisionSupport)¨面向全企業(yè)的(EnterpriseScope)¨最明細的數(shù)據(jù)存儲(AtomicDetail)¨數(shù)據(jù)快照式的數(shù)據(jù)獲取(SnapShotCapture)這些原則到現(xiàn)在仍然是指導(dǎo)數(shù)據(jù)倉庫建設(shè)的最基本原則,雖然中間的一些原則引發(fā)一些爭論,并導(dǎo)

8、致一些分歧和數(shù)據(jù)倉庫變體的產(chǎn)生。但是,BillInm

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。