ETL檢視原始碼討論檢視歷史
ETL,是英文Extract-Transform-Load的縮寫,用來描述將數據從來源端經過抽取(extract)、轉換(transform)、加載(load)至目的端的過程。ETL一詞較常用在數據倉庫,但其對象並不限於數據倉庫。[1]
簡介
ETL是將業務系統的數據經過抽取、清洗轉換之後加載到數據倉庫的過程,目的是將企業中的分散、零亂、標準不統一的數據整合到一起,為企業的決策提供分析依據, ETL是BI(商業智能)項目重要的一個環節。
ETL與ELT
ETL所描述的過程,一般常見的作法包含ETL或是ELT(Extract-Load-Transform),並且混合使用。通常越大量的數據、複雜的轉換邏輯、目的端為較強運算能力的數據庫,越偏向使用ELT,以便運用目的端數據庫的平行處理能力。
工具
ETL(orELT)的流程可以用任何的編程語言去開發完成,由於ETL是極為複雜的過程,而手寫程序不易管理,有越來越多的企業採用工具協助ETL的開發,並運用其內置的metadata功能來存儲來源與目的的對應(mapping)以及轉換規則。
工具可以提供較強大的連接功能(connectivity)來連接來源端及目的端,開發人員不用去熟悉各種相異的平台及數據的結構,亦能進行開發。
當然,為了這些好處,付出的代價便是金錢。
參見
數據倉庫(DW)
決策支持系統(DSS)
在線分析處理(OLAP)
數據挖掘(DM)
商業智能(BI)
視頻
ETL 相關視頻
參考文獻
- ↑ ETL技術入門之ETL初認識, CSDN技術社區,2014-07-10