ETL_data warehouse etl tookit.pdf

ETL_data warehouse etl tookit.pdf

ID:34747885

大小:4.20 MB

頁數(shù):308頁

時間:2019-03-10

ETL_data warehouse etl tookit.pdf_第1頁
ETL_data warehouse etl tookit.pdf_第2頁
ETL_data warehouse etl tookit.pdf_第3頁
ETL_data warehouse etl tookit.pdf_第4頁
ETL_data warehouse etl tookit.pdf_第5頁
資源描述:

《ETL_data warehouse etl tookit.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、目錄第一部分需求、現(xiàn)狀和架構(gòu)第一章一切從需求出發(fā)第二章ETL數(shù)據(jù)結(jié)構(gòu)第二部分數(shù)據(jù)流第三章抽取第四章清洗和規(guī)范化第五章提交維度表第六章提交事實表第七章開發(fā)程序第三部分開發(fā)和運行維護第八章運行維護第九章元數(shù)據(jù)第十章職責(zé)與分工第四部分實時流ETL系統(tǒng)第十一章實時ETL系統(tǒng)第十二章結(jié)論ModifiedbyEagleWang2008-5-30Chengtu致謝首先我們要感謝閱讀了數(shù)據(jù)倉庫工具箱叢書的成千上萬的讀者,感謝你們對于撰寫這本數(shù)據(jù)倉庫ETL書籍的大力支持和鼓勵。我們確信還會不斷地從你們——數(shù)據(jù)倉庫的使用者和開發(fā)者——那里學(xué)習(xí)到更多的東西。非常感謝JimStagnitto,是他鼓勵

2、Joe開始此書,并給了他足夠的信心完成該項目。Jim是事實上的第三作者,他在數(shù)據(jù)質(zhì)量和實時ETL的章節(jié)中作出了主要的創(chuàng)造性貢獻。另外還要感謝JeffCoster和KimM.Knyal,他們在前/后加載處理和ETL項目管理的討論中做出了特殊的貢獻。我們有一個特別的讀者小組,他們仔細閱讀了本書手稿的第一版本,并給出了大量有用的建議。一般來說,對于已經(jīng)“完成”的手稿再做修改是非常令人頭疼的事,但是這種深層次的校讀對于工具箱系列的書籍來說是一種傳統(tǒng),這次也不例外,并且非常成功。以字母順序,這些讀者包括:WouletaAyele,BobBecker,Jan-Willem,Beldman,

3、IvanChong,MauriceFrank,MarkHodson,PaulHoffman,QiJin,DavidLyle,MichaelMartin,JoyMundy,RostislavPortnoy,MalathiVellanki,PadminiRamanujan,MargyRoss,JackSerra-Lima,以及WarrenThornthwaite。我們還特別感謝RobinCaserta(Joe的妻子)和JulieKimball(Ralph的妻子)在整個項目期間給予的支持,還有孩子們ToriCaserta,BrianKimball,Sara(Kimball)Smith

4、以及孫子AbigailSmith(?。麄儗τ谧髡呖偸翘幱诠ぷ鳡顟B(tài)給予了充分的理解和耐心。最后,Wiley計算機圖書小組又一次成為了本書完成的主要原因。感謝你們,BobElliott,KevinKent和AdaobiObiTulton。作者簡介RalphKimball博士,Kimball集團的創(chuàng)始人,從1982年起就成為數(shù)據(jù)倉庫領(lǐng)域的領(lǐng)導(dǎo)者,也是當(dāng)今最著名的演說家、咨詢專家、教師和作家之一。他的書籍包括<<數(shù)據(jù)倉庫工具箱>>(Wiley,1996)、<<數(shù)據(jù)倉庫生命周期工具箱>>(Wiley,1998)、<>(Wiley,2000)和<<數(shù)據(jù)

5、倉庫工具箱第二版>>(Wiley,2002)。他自1995年以來一直為<<智能企業(yè)>>雜志撰寫專欄文章,并獲得了1999年度“讀者最愛獎”。Ralph在斯坦福大學(xué)獲得了電子工程學(xué)博士學(xué)位,論文題目是人-機系統(tǒng)設(shè)計。他從1972年到1982年在XeroxPARC和XeroxSystem的開發(fā)部門任研究員、系統(tǒng)開發(fā)經(jīng)理和產(chǎn)品市場經(jīng)理。由于他在XeroxStar工作站(第一個視窗、圖標和鼠標的商業(yè)產(chǎn)品)的系統(tǒng)設(shè)計工作,IEEEHumanFactorsSociety授予他AlexanderC.Williams獎。從1982年開始到1986年,Ralph是Metaphor計算機系統(tǒng)公司(

6、第一家數(shù)據(jù)倉庫公司)的應(yīng)用部副總裁。在Metaphor,Ralph發(fā)明了“膠囊”工具,這是圖形化數(shù)據(jù)流界面的第一個商業(yè)實現(xiàn),現(xiàn)在已經(jīng)應(yīng)用在所有ETL工具中。從1986年到1992年,Ralph成為RedBrick系統(tǒng)公司的創(chuàng)始人和CEO,該公司提供一種非??焖俚年P(guān)系型數(shù)據(jù)庫技術(shù)來實現(xiàn)決策支持。1992年,Ralph創(chuàng)辦了RalphKimball協(xié)會,在2004年這個協(xié)會演變成為Kimball集團。Kimball集團是一個高度專業(yè)化的數(shù)據(jù)倉庫設(shè)計專家團體,這些專家因其在咨詢、教育、演講和著作方面的成就而享有較高的聲譽。JoeCaserta是CasertaConcepts,LLC的

7、創(chuàng)始人和負責(zé)人。他是非常有影響力的數(shù)據(jù)倉庫專家,其專業(yè)技能來自于主流數(shù)據(jù)倉庫工具和數(shù)據(jù)庫的行業(yè)經(jīng)驗和實踐應(yīng)用。Joe就讀于紐約哥倫比亞大學(xué)的數(shù)據(jù)庫應(yīng)用開發(fā)和設(shè)計專業(yè)。介紹抽取-轉(zhuǎn)換-加載(Extract-Transform-Load)系統(tǒng)是數(shù)據(jù)倉庫的基礎(chǔ)。一個設(shè)計良好的ETL系統(tǒng)從源系統(tǒng)抽取數(shù)據(jù),執(zhí)行數(shù)據(jù)質(zhì)量和一致性標準,然后規(guī)格化數(shù)據(jù),從而使分散的源數(shù)據(jù)可以集中在一起使用,最終再以可以展現(xiàn)的格式提交數(shù)據(jù),以便應(yīng)用開發(fā)者可以創(chuàng)建應(yīng)用系統(tǒng),也使最終用戶可以制定決策。該書圍繞這四個步驟進行組織。

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。