KETTLE——Weka处理大数据量内存溢出问题


现在做的一个项目ETL采用KETTLE,通过Perl脚本进行分天表、月表及年表的创建,并修改KETTLE创建的抽取任务模板。即使这样在处理天表表近百万数据量时,Kettle也会有时发生内存溢出现象,导致抽取任务失败。今天发现了一哥们BLOG中的解决办法,特分享。

以Spoon.bat为例,其他组件和.sh操作类似

用文本编辑器打开Spoon.bat找到:

REM ******************************************************************

REM ** Set java runtime options **

REM ** Change 256m to higher values in case you run out of memory. **

REM ******************************************************************

set OPT=-Xmx1444m -cp %CLASSPATH% -Djava.library.path=libswt\win32\ -DKETTLE_HOME="%KETTLE_HOME%" -DKETTLE_REPOSITORY="%KETTLE_REPOSITORY%" -DKETTLE_USER="%


KETTLE_USER%" -DKETTLE_PASSWORD="%KETTLE_PASSWORD%" -DKETTLE_PLUGIN_PACKAGES="%KETTLE_PLUGIN_PACKAGES%"

修改这里的数字...-Xmx1444m...

我装的是jdk-1_5_0_14这里的1444m是极限了.大家可以在自己的机器上试验不同的数值.

WEKA(感谢网友:comcome84)

用文本编辑器打开RunWeka.ini找到:

# placeholders ("#bla#" in command gets replaced with content of key "bla")

# Note: "#wekajar#" gets replaced by the launcher class, since that jar gets

# provided as parameter

maxheap=1444m

这里同样被我修改成1444m.


感谢本文方法来源:http://blog.csdn.net/senaku/archive/2008/07/03/2609021.aspx

优质内容筛选与推荐>>
1、BASE64转换,内含:IOS自带DES加解密
2、microchip PIC芯片使用方法
3、WPF中的Style(风格,样式)
4、【译著】Code First :使用Entity. Framework编程(5)
5、SharePoint【ECMAScript对象模型系列】-- 06. 使用ECMA操作列表项对象(list item)


长按二维码向我转账

受苹果公司新规定影响,微信 iOS 版的赞赏功能被关闭,可通过二维码转账支持公众号。

    阅读
    好看
    已推荐到看一看
    你的朋友可以在“发现”-“看一看”看到你认为好看的文章。
    已取消,“好看”想法已同步删除
    已推荐到看一看 和朋友分享想法
    最多200字,当前共 发送

    已发送

    朋友将在看一看看到

    确定
    分享你的想法...
    取消

    分享想法到看一看

    确定
    最多200字,当前共

    发送中

    网络异常,请稍后重试

    微信扫一扫
    关注该公众号