第四章 Tsv文件的抽取
目錄
一.Tsv介紹
二.案例介紹
三.案例實現
????????1.建立轉換
? ? ? ??2.配置控件
四.運行結果
一.Tsv介紹
????????TSV是Tab-separated values的縮寫,即制表符分隔值。使用制表符分隔數據字段的文件被稱為制表符文件。制表符文件中的數據以表格結構儲存,每一行儲存一條記錄,每條記錄的各個字段間使用制表符分隔。大多數的操作系統和常用文本編輯器中,按一次“Tab”鍵表示默認插入一個制表符。
二.案例介紹
????????通過Kettle工具抽取TSV文件tsv_extract.tsv中的數據保存至數據庫extract中的數據表tsv中。
三.案例實現
? ? ? ? 數據準備:
????????現有一個名為tsv_extract.tsv的TSV文件,該文件的內容如圖所示。
? ? ? ? ?1.建立轉換
? ? ? ? ?2.配置控件
? ? ? ? ? 文本文件輸入控件:雙擊進入控件,點擊瀏覽選擇要處理的tsv文件,選擇好后,點擊
? 增加,具體如下。
? ? ? ? ? 單擊“內容”選項卡,清除分隔符處默認分隔符“;”并單擊【Insert TAB】按鈕,在分隔符處插
? 入一個制表符,取消勾選“頭部”復選框,具體如下。
? ? ? ? 單擊字段選項卡,點擊獲取變量快速添加字段,具體如下:
? ? ? ? 預覽記錄:
? ? ? ? ? 表輸出控件:雙擊表輸出控件,連接好數據庫后(我的數據庫連接的名字是隨便起的),選擇目標表,具體如下:
????????建表語句:
CREATE TABLE `tsv` (`id` int(11) NOT NULL,`name` varchar(20) DEFAULT NULL,`data` varchar(20) CHARACTER SET utf8 COLLATE utf8_bin DEFAULT NULL,PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8? ? ? ? 勾選指定數據庫字段,點擊右側輸入字段映射,進行映射匹配,匹配后的圖片如下:
? ? ? ? ?
四.運行結果
總結
以上是生活随笔為你收集整理的第四章 Tsv文件的抽取的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: JVM(7)内存溢出问题(工作中常用、面
- 下一篇: 南邮ctf 480小时精通C++