日期:2014-05-16  浏览次数:20725 次

数据对接—kettle使用之二

      这一篇开始进入kettle的一些常用插件的使用介绍,通过实例介绍不同插件的功能。这一篇说(Data Grid和文本文件输出)的使用。

文本文件输出介绍(可以略过,一般用不着):
      1、Run this as a command instead:把结果输出到命令行或者脚本
      2、文件名里包含步骤数:如果你在多个拷贝中运行步骤,拷贝的数量将包含到文件名中。
      3、Include partition nr in filename:文件名中包含数据分区数量
      4、文件名包含日期
      5、文件名包含时间
      6、追加
      7、分隔符
      8、封闭符:封闭字段的一对字符,可选
      9、强制在字段周围加上封闭符
      10、头部:如果享有一个头部行,选中
      11、尾部:如果享有一个尾部行,选中
      12、格式:DOS文件的分隔符可以是回车或换行符
      13、编码:指定编码,如果空白就是用系统缺省的编码
      14、Compression(压缩):指定压缩的类型(zip,gzip)
      15、Right pad fields:在字段最后添加空格或者删除字符,直到长度达到指定
      16、Fast data dump(no formatting):当处理大量数据到一个文本文件时,提高性能.(不包含任何格式化信息)
      17、分拆每一行:如果n比0大,用n行拆分文本文件,分割成多个部分。
      18、Add Ending line of file:指定输出文本的额结束行。

具体操作:

      首先,启动软件,新建转换作业,如下图:

       

       

      其次,就可以在空白区域拖拽插件进行数据对接了,我们先做个测试表数据输出到文本文件中,用到的插件有Data Grid文本文件输出,如下图:

       

      打开Data Grid并编辑测试数据,如下图:

       

       

       打开文本文件输出并自动获取字段和编辑输出路径,如下图:

        

       

      上面看到的只是一些最基本的操作,想要个性化的配置需要对每个插件里的配置项进行配置,弄好之后我们就可以点击运行按钮了(记得一定要先保存哦),看输出结果,如下图:

   

   

      运行后我们可以看到还有输出日志,还有每一步执行的结果显示输出,方便我们查看,最后的运行结果会在指定好的路径创建出一个文本文件,打开文件如下图所示:

       


这一篇就到这里,下篇我们继续演示其它插件的使用...

<