kettle笔记

资源

FAQ

kettle是什么?

Kettle(PDI)Hitachi Vantara 公司的数据集成分析产品 Pentaho [pæn’tɑːhəʊ] 套件的数据集成工具 Data Integration,是一款开源的 ETL 工具,官网定义如下:

Data Integration
Pentaho’s Data Integration, also known as Kettle, delivers powerful extraction, transformation, and loading (ETL) capabilities.

Kettle 中文名称叫水壶,该项目的主程序员 MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。目前包括4个产品:Spoon、Pan、CHEF、Kitchen 。

  1. SPOON :允许你通过图形界面来设计ETL转换过程 Transformation。
  2. PAN :允许你批量运行由 Spoon 设计的 ETL 转换 (例如使用一个时间调度器)。Pan 是一个后台执行的程序,没有图形界面。
  3. CHEF :允许你创建任务 Job。 任务通过允许每个转换,任务,脚本等等,更有利于自动化更新数据仓库的复杂工作。任务通过允许每个转换,任务,脚本等等。任务将会被检查,看看是否正确地运行了。
  4. KITCHEN :允许你批量使用由 Chef 设计的任务 (例如使用一个时间调度器)。KITCHEN 也是一个后台运行的程序。