开源etl工具 kettle
v5.1.0 免费Spoon版 发表评论
- 软件类别:数据库类
- 软件大小:579.60 MB
- 更新时间:2017-08-02 11:43
- 软件版本:v5.1.0 免费Spoon版
- 软件语言:中文
- 软件等级:
- 官方网址:http://www.pentaho.com/
评分:
好评:0
差评:6

软件介绍
kettle5.1是生产环境使用的开源工具,用于文本文件,数据表,以及商业和免费的数据库引擎的输入和输出,功能非常齐全,使用面广,需要的用户欢迎来IT猫扑下载~
开源etl工具kettle简介
Pentaho Data Integration (Kettle)是Pentaho生态系统中默认的ETL工具。Kettle是一款国外开源的etl工具,纯java编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
通过非常直观的图形化编辑器(Spoon),您可以定义以XML格式储存的流程。在Kettle运行过程中,这些流程会以不同的方法编译。用到的工具包括命令行工具(Pan),小型服务器(Carte),数据库存储库(repository)(Kitchen)或者直接使用IDE(Spoon)。
一款国外开源的etl工具,纯java编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
kettle清理数据库连接的方法:
1:清理shared.xml中的不用的数据库连接。(他的保存位置一般在用户主目录下边的.kettle目录中)
2:用文本编辑软件打开kjb,ktr文件删除用户到的connection项,保存。
Kettle使用教程:
Kettle自己有三个主要组件:Spoon,Kitchen,Pan。其中Spoon是一个图形化的界面,用于windows的时候,先设置环境变量:pentaho_java_home,例如:C:Program FilesJavajdk1.7.0_25,其实就是你的java安装目录,1.6以上即可。windows下双击Spoon.bat就可以了,界面如下:

这里我建立了资源库,其实可以用文件形式存储,存储的结构都是xml,但是我还是觉得建立一个资源库比较好,以后看job等情况也比较简单,因为数据表的可读性比xml要好得多。建立资源库和文件资源库只需要把右上角的小加号点一下,就会出现如下如的界面:

选择第一个就是建立数据库版的资源库,之后:

之后:

测试通过之后点击OK就回到最开始的界面,这时候选择test数据库连接,然后出入你的工程(我是这么叫的)ID和name,这里要记住,因为以后kitchen调度的时候要输入这个参数。

在接下来弹出的框中都点“是”,然后会出现这个界面:

这步会在你的用户下建立很多表,所以最好单独给资源库建立一个用户,当然这是在oracle下,mysql下和DB2下最好也采用同样的方式,把资源库和其他库分开。检查一下:
SQL> conn wings/wings@prism
已连接。
SQL> select count(1) from
r_repository_log;
COUNT(1)
----------
0
SQL>
表已经建好了。回到最开始的界面,选择test,点击确定,然后就会出现登录对话框,用户密码默认都是admin,以后可以自己改。
接下来就可以开始用这个工具了。
其实对于简单的数据库数据的抽取,基本只需要转换和作业这两种东西。下面就是建立一个转换的步骤:
1 点击文件-->新建-->转换。
2 在左侧的树状列表中选“主对象树”,新建DB连接。步骤和上面建资源库一样。一个目标库一个源库。
3 在核心对象-->输入这个地方拖出一个表输入,在“输出”目录下拖出“表输出”,在“转换”处拖出一个字段选择来,如图:

每一个对象都可以双击修改属性,下面以抽取world数据库的city表为例。
双击表输入,选择数据库连接,选择源数据库,然后点击“获取SQL查询语句”,在弹出的对话框里进行选择即可,之后会变成这样:

下面点击表输出:

点击字段选择:

这样,一个简单的抽取数据的转换就完成了。执行之,点击上面的绿色开始按钮。
我也处在学习中,希望可以把我的经验分享给和我一样的入门者。
下面是补充部分:
在一个Job或者一个trans建立好之后,就可以建立定时任务了。如果是DS,那么DS客户端本身就支持schedule,但是Kettle因为没有服务端和客户端的概念,因此只有使用linux的crontab,其实Job本身也支持定时,但是你必须保证图形界面一直开着,这样并不如crontab那么好。在命令行里使用kettle很简单,Job用kitchen调度,trans用pan调度。
下面是一个kitchen的调度命令:
bash /home/kettle/data-integration/kitchen.sh /rep kettle_demo /user username /pass passwd /level Minimal /dir /dirname /job jobname
rep那里写自己的资源库名称。
trans和上面一样,略有不同:
bash /home/kettle/data-integration/pan.sh /rep kettle_demo /user username /pass passwd /level Minimal /dir /dirname /trans transname
Kettle项目介绍:
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。
Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。
Kettle 将 ELT 流程编译为 XML 格式,学起来十分简单,Pentaho Data Integration (Kettle) 使用 Java (Swing)开发。Kettle 作为编译器对 XML 格式书写的流程进行编译。这些功能和组件比起 Talend 在丰富性方面稍逊一些,但是您建立复杂 ETL 流程需要的一切元素。Kettle 的 JavaScript 引擎(和 Java 引擎)可以深层地控制对数据的处理。
全球数千家机构依赖于Pentaho的,作出更快,更好的业务决策产生积极影响他们的底线。
运行 Spoon.bat 开始软件。
需要jre支持,JRE(Java Runtime Environment) v6.0 Update 26 安装版
多平台下载
Pc版开源etl工具 kettle v5.1.0 免费Spoon版
提取密码: nhau
猜你喜欢
数据库管理

数据库管理
数据库管理软件是管理和维护数据库的系统,有了数据库管理软件可以很好的对数据库信息进行管理和控制,而且数据库的保护,组织都离不开它...
本类推荐
本类最新
Microsoft SQL Server 2000 Personal Edition中文个人版带sp4补丁
SQL Server 2005 SP2简体中文版
Microsoft SQL Server 2000简体中文企业版
PowerDesignerv16.5.0.3982 汉化版
数据库文件转换工具(DBConvert for JSON and SQL)v1.0 官方版
DFB数据库修复工具DataNumen DBF Repairv2.0 官方版
mysql for ubuntuv5.7.17 32位+64位官方版
MongoDB Compass可视图形化管理工具v1.26.1 官方版
Exportizer(修改编辑数据库软件)v8.4.8 官方版
SQL Server Compact 4 安装包v4.0.8876.1 官方安装版
Navicat premium数据库管理软件v15.0.19 官方最新版
Oracle Database 12c数据库软件v12.1.0.2.0 标准版
Navicat for PostgreSQL 32位+64位中文版v16.0.11.0 官方版
premiumsoft navicat for mysqlv16.0.110 简体中文版
Navicat Cracker v16.0.10 激活码注册工具
相关软件
phpMyAdmin For Linux(MySQL server数据库管理)v5.1.2 官方版phpMyAdminForLinux是一个linux系统上使用的MySQLserver数据库管理软件,可以对mysql进行在线操作,包括复制、导入导出、删除等等,不熟悉MySQL命令列指令的人使用这个工具倍棒。linuxphpmyadmin安装说明使用php和mysql开
microsoft access 2013免费完整版MicrosoftOfficeAccess是由微软发布的关联式数据库管理系统。图形化操作界面和完善的处理功能都得到了用户的认可,是MicrosoftOffice的常用套件之一。下面是小编为大家提供的access2013破解版的下载,需要的朋友快来拿走
SQLite数据库管理(Navicat for SQLite)v15.0.23 企业注册版NavicatforSQLite企业注册版是专门为用户提供专业的SQLite数据库管理工具,在这类用户可以使用数据模型在线进行可视化处理功能,软件使用方法简单,可以在线编辑文件,而且还有多线程,使用更加高效,欢迎有需要的用户来IT猫扑下
HeidiSQL(MySQL图形化管理工具)v11.2.0.6219 绿色中文版HeidiSQL是一个可以图形化的mysql数据库管理工具,可以更加直观的对本地或者远程数据库进行浏览进行操作,软件功能强大可支持以文本格式导入数据库,有需要的朋友快来IT猫扑狭隘吧。HeidiSQL介绍HeidiSQL软件允许你浏览你
下载排行
- 1解决microsoft.ace.oledb.12.0连接失败所需要的驱动
- 2sql server 2008 r2安装包中文完整版
- 3SQL Server 2014 企业版
- 4SQL Server 2005 SP2
- 5microsoft access 64位驱动
- 6SQL Server 2012
- 7Access database engine 2010
- 8S7-200库文件大全
- 9Microsoft SQL Server 2000 Personal Edition
- 10MySQL数据库服务器







Microsoft office access 2007
微型mdb数据库编辑器(TinyMDBEditor)
Oracle数据库存储开发(PL/SQL Developer)
Navicat 8 for MySQL(mysql图形化界面软件)
E树SQL2000数据库恢复工具








网友评论
查看所有0条评论