資源描述:
《ETL_data warehouse etl tookit.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、目錄第一部分需求、現(xiàn)狀和架構(gòu)第一章一切從需求出發(fā)第二章ETL數(shù)據(jù)結(jié)構(gòu)第二部分數(shù)據(jù)流第三章抽取第四章清洗和規(guī)范化第五章提交維度表第六章提交事實表第七章開發(fā)程序第三部分開發(fā)和運行維護第八章運行維護第九章元數(shù)據(jù)第十章職責與分工第四部分實時流ETL系統(tǒng)第十一章實時ETL系統(tǒng)第十二章結(jié)論ModifiedbyEagleWang2008-5-30Chengtu致謝首先我們要感謝閱讀了數(shù)據(jù)倉庫工具箱叢書的成千上萬的讀者,感謝你們對于撰寫這本數(shù)據(jù)倉庫ETL書籍的大力支持和鼓勵。我們確信還會不斷地從你們——數(shù)據(jù)倉庫的使用者和開發(fā)者——那里學習到更多的東西。非常感謝JimStagnitto,是他鼓勵
2、Joe開始此書,并給了他足夠的信心完成該項目。Jim是事實上的第三作者,他在數(shù)據(jù)質(zhì)量和實時ETL的章節(jié)中作出了主要的創(chuàng)造性貢獻。另外還要感謝JeffCoster和KimM.Knyal,他們在前/后加載處理和ETL項目管理的討論中做出了特殊的貢獻。我們有一個特別的讀者小組,他們仔細閱讀了本書手稿的第一版本,并給出了大量有用的建議。一般來說,對于已經(jīng)“完成”的手稿再做修改是非常令人頭疼的事,但是這種深層次的校讀對于工具箱系列的書籍來說是一種傳統(tǒng),這次也不例外,并且非常成功。以字母順序,這些讀者包括:WouletaAyele,BobBecker,Jan-Willem,Beldman,
3、IvanChong,MauriceFrank,MarkHodson,PaulHoffman,QiJin,DavidLyle,MichaelMartin,JoyMundy,RostislavPortnoy,MalathiVellanki,PadminiRamanujan,MargyRoss,JackSerra-Lima,以及WarrenThornthwaite。我們還特別感謝RobinCaserta(Joe的妻子)和JulieKimball(Ralph的妻子)在整個項目期間給予的支持,還有孩子們ToriCaserta,BrianKimball,Sara(Kimball)Smith
4、以及孫子AbigailSmith(?。?,他們對于作者總是處于工作狀態(tài)給予了充分的理解和耐心。最后,Wiley計算機圖書小組又一次成為了本書完成的主要原因。感謝你們,BobElliott,KevinKent和AdaobiObiTulton。作者簡介RalphKimball博士,Kimball集團的創(chuàng)始人,從1982年起就成為數(shù)據(jù)倉庫領(lǐng)域的領(lǐng)導者,也是當今最著名的演說家、咨詢專家、教師和作家之一。他的書籍包括<<數(shù)據(jù)倉庫工具箱>>(Wiley,1996)、<<數(shù)據(jù)倉庫生命周期工具箱>>(Wiley,1998)、<>(Wiley,2000)和<<數(shù)據(jù)
5、倉庫工具箱第二版>>(Wiley,2002)。他自1995年以來一直為<<智能企業(yè)>>雜志撰寫專欄文章,并獲得了1999年度“讀者最愛獎”。Ralph在斯坦福大學獲得了電子工程學博士學位,論文題目是人-機系統(tǒng)設計。他從1972年到1982年在XeroxPARC和XeroxSystem的開發(fā)部門任研究員、系統(tǒng)開發(fā)經(jīng)理和產(chǎn)品市場經(jīng)理。由于他在XeroxStar工作站(第一個視窗、圖標和鼠標的商業(yè)產(chǎn)品)的系統(tǒng)設計工作,IEEEHumanFactorsSociety授予他AlexanderC.Williams獎。從1982年開始到1986年,Ralph是Metaphor計算機系統(tǒng)公司(
6、第一家數(shù)據(jù)倉庫公司)的應用部副總裁。在Metaphor,Ralph發(fā)明了“膠囊”工具,這是圖形化數(shù)據(jù)流界面的第一個商業(yè)實現(xiàn),現(xiàn)在已經(jīng)應用在所有ETL工具中。從1986年到1992年,Ralph成為RedBrick系統(tǒng)公司的創(chuàng)始人和CEO,該公司提供一種非常快速的關(guān)系型數(shù)據(jù)庫技術(shù)來實現(xiàn)決策支持。1992年,Ralph創(chuàng)辦了RalphKimball協(xié)會,在2004年這個協(xié)會演變成為Kimball集團。Kimball集團是一個高度專業(yè)化的數(shù)據(jù)倉庫設計專家團體,這些專家因其在咨詢、教育、演講和著作方面的成就而享有較高的聲譽。JoeCaserta是CasertaConcepts,LLC的
7、創(chuàng)始人和負責人。他是非常有影響力的數(shù)據(jù)倉庫專家,其專業(yè)技能來自于主流數(shù)據(jù)倉庫工具和數(shù)據(jù)庫的行業(yè)經(jīng)驗和實踐應用。Joe就讀于紐約哥倫比亞大學的數(shù)據(jù)庫應用開發(fā)和設計專業(yè)。介紹抽取-轉(zhuǎn)換-加載(Extract-Transform-Load)系統(tǒng)是數(shù)據(jù)倉庫的基礎。一個設計良好的ETL系統(tǒng)從源系統(tǒng)抽取數(shù)據(jù),執(zhí)行數(shù)據(jù)質(zhì)量和一致性標準,然后規(guī)格化數(shù)據(jù),從而使分散的源數(shù)據(jù)可以集中在一起使用,最終再以可以展現(xiàn)的格式提交數(shù)據(jù),以便應用開發(fā)者可以創(chuàng)建應用系統(tǒng),也使最終用戶可以制定決策。該書圍繞這四個步驟進行組織。