日期:2014-05-16  浏览次数:20304 次

pentaho DI 使用javascript对字段进行拆分转换

继续试用pentaho的DI(kettle)工具。

在发现处理oracle 的blob字段的能力特别优于Datastaev7版本之后,对这个工具越来越喜欢了,虽然有的时候还会出现OutOfMemeory... ...

今天想记录一下这样一个需求:我的数据源端有一个组合字段,如slr(受理人),他可能是多个人的人员编码,在数据整合的过程中,不同地区的编码生成规则是一样的,在系统设计初期,并没有考虑到不同地区的数据集中问题,所以如果不处理的话,数据的准确性和唯一性出现了问题。在使用pentaho的DI时,也尝试了不同widget,如字段拆分、字符处理等组合,都没能实现想要的,所以想用一下java或javascript的脚本。无奈java无法获得input fields。所以javascript成了解决问题的功臣。

我这里的整合流程设计的非常简单,主要如下示意:


源表输入----> modified java script value------> 目标表插入(或更新)主要是javascript的远端字段选择,以及中间处理(对不同的需求,此处不重要),最后是处理结果的利用。



主要看代码及说明,查看截图附件:



?