Hive表路径修改和分区表数据加载命令
1、對于同一張表,如果不是分區,那要變更數據來源,就只有改變其hdfs存儲路徑:
修改tmp_fjs_ftp表的location,兩種方式:
方式一:通過修改表DDL
alter table tmp_fjs_ftp set location 'hdfs://nameservice-ha/tmp/ast/ast ';
方式二:直接修改hive的meta info:
update ` tmp_fjs_ftp ` set `DB_LOCATION_URI` = replace(DB_LOCATION_URI,"oldpath","newpath");
方式二提示語法錯誤,待研究;
2、如果是帶分區的同一張表,要加載數據,命令如下:
1)分區表:
CREATE TABLE test(
? ? ……
)
PARTITIONED BY ( country STRING ); #分區鍵和字段不能重復
2)加載數據:
LOAD DATA LOCAL INPATH '/path/to/local/files'?OVERWRITE ?INTO TABLE test?PARTITION (country='CHINA')
有LOCAL表示從本地文件系統加載(文件會被拷貝到HDFS中)
無LOCAL表示從HDFS中加載數據(注意:文件直接被移動!!!而不是拷貝!!! 并且。。文件名都不帶改的。。)
OVERWRITE ?表示是否覆蓋表中數據(或指定分區的數據)(沒有OVERWRITE ?會直接APPEND,而不會濾重!)
總結
以上是生活随笔為你收集整理的Hive表路径修改和分区表数据加载命令的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Java运行时动态加载类之Class.f
- 下一篇: Java运行时动态加载类之ClassLo