kettle工具使用教程
生活随笔
收集整理的這篇文章主要介紹了
kettle工具使用教程
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
kettle工具使用教程
Kettle簡介
Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上運行,數據抽取高效穩定。Kettle 中文名稱叫水壺,該項目的主程序員MATT 希望把各種數據放到一個壺里,然后以一種指定的格式流出。Kettle這個ETL工具集,它允許你管理來自不同數據庫的數據,通過提供一個圖形化的用戶環境來描述你想做什么,而不是你想怎么做。Kettle中有兩種腳本文件,transformation和job,transformation完成針對數據的基礎轉換,job則完成整個工作流的控制。(引用百度百科)
具體教程
原文鏈接
kettle的最新下載地址:http://community.pentaho.com/projects/data-integration/
首先解壓下載下來的壓縮包如:pdi-ce-6.1.0.1-196.zip
然后打開Spoon.bat,如圖所示:
在文件->新建裝換。
新建轉換后在左邊的主對象樹中建立DB連接用以連接數據庫。如圖所示:
建立數據庫連接的過程與其他數據庫管理軟件連接數據庫類似。
注意:在數據庫鏈接的過程中,可能會報某個數據庫連接找不到的異常。那是因為你沒有對應的數據庫鏈接驅動,請下載對應驅動后,放入kettle的lib文件夾。
ps:達夢數據庫配置截圖
(1)新建表插入新建表插入
在左邊的面板中選擇“核心對象”,在核心對象里面選擇“輸入->表輸入”,用鼠標拖動到右邊面板。如圖所示:
雙擊拖過來的表,可以編輯表輸入。
選擇數據庫連接和編輯sql語句,在這一步可以點擊預覽,查看自己是否連接正確。
(2)通過插入\更新輸出到表。
在左邊面板中選擇核心對象、選擇“輸出->插入\更新”如圖所示:
編輯插入更新:
首先:表輸入連接插入更新。
選中表輸入,按住shift鍵,拖向插入更新。
然后:雙擊插入更新,編輯它。
到這里基本上,這個轉換就要做完了,可以點擊運行查看效果,看是否有誤,這個要先保存了才能運行,可以隨意保存到任何一個地方。
使用作業可以定時或周期性的執行轉換,新建一個作業。并從左邊面板拖入start 和轉換。
雙擊start可以編輯,可以設置執行時間等等
點開裝換,可以設置需要執行的轉換任務,比如可以執行上面我們做的轉換,XXX.ktr
最后點擊運行即可。
到這里,一個簡單的通過作業調度的kettle就算做完了。
注意點
Oracle數據庫歷史數據同步需注意點:
表輸入時,注意類型轉換,不然執行同步轉換步驟時會出現無效數字的情況。
總結
以上是生活随笔為你收集整理的kettle工具使用教程的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 安装CentOS7操作系统
- 下一篇: centos是什么操作系统