常用ETL工具對比

常用ETL工具對比

ID:40114941

大?。?9.29 KB

頁數(shù):3頁

時(shí)間:2019-07-21

常用ETL工具對比_第1頁
常用ETL工具對比_第2頁
常用ETL工具對比_第3頁
資源描述:

《常用ETL工具對比》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、常用ETL工具對比目前市場上主流的ETL工具有,IBM公司的DataStage、Informatica公司的Powercenter、免費(fèi)ETL工具Kettle等等。1、DatastageDataStage是一套專門對多種操作數(shù)據(jù)源的數(shù)據(jù)抽取、轉(zhuǎn)換和維護(hù)過程進(jìn)行簡化和自動(dòng)化,并將其輸入數(shù)據(jù)集市或數(shù)據(jù)倉庫目標(biāo)數(shù)據(jù)庫的集成工具。他的優(yōu)點(diǎn)如下:具有多種數(shù)據(jù)源的連接能力,包括目前市場上的大部分主流數(shù)據(jù)庫,并且具有優(yōu)秀的文本文件和XML文件讀取和處理能力。特點(diǎn)使用場景或者益處說明軟件安裝和升級軟件安裝和升級的便捷程度圖形安裝,安裝步驟較

2、為復(fù)雜處理性能數(shù)據(jù)的加工效率并行運(yùn)行能力,ETLJob的控件大多數(shù)都支持并行運(yùn)行,此外DataStage企業(yè)版還可以在多臺(tái)裝有DataStageServer的機(jī)器上并行執(zhí)行,這也是傳統(tǒng)的手工編碼方式難以做到的。這樣,DataStage就可以充分利用硬件資源。而且,當(dāng)你的硬件資源升級的時(shí)候也不用修改已經(jīng)開發(fā)好的ETLJob,只需要修改一個(gè)描述硬件資源的文件即可。并行執(zhí)行能力是DataStage所能處理數(shù)據(jù)的速度可以得到趨近于線性的擴(kuò)展,輕松處理大量數(shù)據(jù)。元數(shù)據(jù)管理與業(yè)務(wù)系統(tǒng)的集成元數(shù)據(jù)信息不公開抽取的容錯(cuò)性錯(cuò)誤還原和斷點(diǎn)功能沒

3、有真正的RECOVERY機(jī)制操作便捷性開發(fā)和運(yùn)維的便捷性全圖化開發(fā),無編碼健壯的安全性用戶權(quán)限管理體系只提供兩個(gè)角色:Developer和Operator語言支持多種字符集支持datastage幾乎支持目前所有的編碼格式2、InformaticaInformaticaPowerCenter用于訪問和集成幾乎任何業(yè)務(wù)系統(tǒng)、任何格式的數(shù)據(jù),它可以按任意速度在企業(yè)內(nèi)交付數(shù)據(jù),具有高性能、高可擴(kuò)展性、高可用性的特點(diǎn)。InformaticaPowerCenter包括4個(gè)不同版本,即:標(biāo)準(zhǔn)版,實(shí)時(shí)版,高級版,云計(jì)算版。同時(shí),它還提供了多

4、個(gè)可選的組件,以擴(kuò)展InformaticaPowerCenter的核心數(shù)據(jù)集成功能,這些組件包括:數(shù)據(jù)清洗和匹配、數(shù)據(jù)屏蔽、數(shù)據(jù)驗(yàn)證、Teradata雙負(fù)載、企業(yè)網(wǎng)格、元數(shù)據(jù)交換、下推優(yōu)化(PushdownOptimization)、團(tuán)隊(duì)開發(fā)和非結(jié)構(gòu)化數(shù)據(jù)等。特點(diǎn)使用場景或者益處說明軟件安裝和升級軟件安裝和升級的便捷程度完全圖形化安裝,無需額外安裝平臺(tái)軟件,且不需修改系統(tǒng)內(nèi)核參數(shù)處理性能數(shù)據(jù)的加工效率可并行運(yùn)行多個(gè)Session提高性能可使用分區(qū)寫目標(biāo)數(shù)據(jù),速度大大提高可建立多個(gè)PowerCenterServer,并發(fā)運(yùn)行多

5、個(gè)Session和workflow,這樣充分地利用多CPU和系統(tǒng)資源結(jié)合streaming和文件交換區(qū)的技術(shù),優(yōu)化地利用硬盤和內(nèi)存的資源Session支持多線程和管道技術(shù)(piepline)元數(shù)據(jù)管理與業(yè)務(wù)系統(tǒng)的集成元數(shù)據(jù)資料庫可基于所有主流系統(tǒng)平臺(tái)的關(guān)系型數(shù)據(jù)庫(Oracle、DB2、teradata、Informix、Sqlserver等)產(chǎn)品均支持多CPU的各主流系統(tǒng)平臺(tái),以適應(yīng)不同客戶的特定需求抽取的容錯(cuò)性錯(cuò)誤還原和斷電功能抽取出錯(cuò)的恢復(fù)(RECOVERY),可實(shí)現(xiàn)斷點(diǎn)續(xù)傳的功能操作便捷性開發(fā)和運(yùn)維的便捷性全圖化開發(fā)

6、,無編碼,操作性,被TDWI連續(xù)七年評為“數(shù)據(jù)倉庫最佳實(shí)踐”獎(jiǎng)健壯的安全性用戶權(quán)限管理體系多范圍的用戶角色和操作權(quán)限(只讀、操作和設(shè)計(jì)等)權(quán)限可以分到用戶或組使用細(xì)致的鎖(Lock)語言支持多種字符集支持支持編碼格式十分豐富1、KettleKettle是一款國外開源的etl工具,純java編寫,可以在Window、Linux、Unix上運(yùn)行,綠色無需安裝,數(shù)據(jù)抽取高效穩(wěn)定,提供豐富的sdk,并開放源代碼,便于二次開發(fā)包裝。特點(diǎn)使用場景或者益處說明軟件安裝和升級軟件安裝和升級的便捷程度綠色安裝,直接使用處理性能數(shù)據(jù)的加工效率使

7、用JDBC,性能與Datastage、Informatica相比要差很多,適合于數(shù)據(jù)量較小的ETL加工使用元數(shù)據(jù)管理與業(yè)務(wù)系統(tǒng)的集成無元數(shù)據(jù)管理抽取的容錯(cuò)性錯(cuò)誤還原和斷電功能無RECOVERY功能操作便捷性開發(fā)和運(yùn)維的便捷性全圖化開發(fā),無編碼,操作簡單健壯的安全性用戶權(quán)限管理體系簡單的用戶管理功能語言支持多種字符集支持支持常見的編碼格式

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。