求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

ETL查看源代码讨论查看历史

跳转至: 导航搜索

ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。[1]

简介

ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据, ETL是BI(商业智能)项目重要的一个环节。

ETL与ELT

ETL所描述的过程,一般常见的作法包含ETL或是ELT(Extract-Load-Transform),并且混合使用。通常越大量的数据、复杂的转换逻辑、目的端为较强运算能力的数据库,越偏向使用ELT,以便运用目的端数据库的平行处理能力。

工具

ETL(orELT)的流程可以用任何的编程语言去开发完成,由于ETL是极为复杂的过程,而手写程序不易管理,有越来越多的企业采用工具协助ETL的开发,并运用其内置的metadata功能来存储来源与目的的对应(mapping)以及转换规则。

工具可以提供较强大的连接功能(connectivity)来连接来源端及目的端,开发人员不用去熟悉各种相异的平台及数据的结构,亦能进行开发。

当然,为了这些好处,付出的代价便是金钱。

参见

数据仓库(DW)

决策支持系统(DSS)

在线分析处理(OLAP)

数据挖掘(DM)

商业智能(BI)

视频

ETL 相关视频

ETL季前赛 GLK vs NW 第三局
ETL巅峰秀:Kun三分钟拿下暴走!NP大逆转以少胜多!

参考文献

  1. ETL技术入门之ETL初认识, CSDN技术社区,2014-07-10