hive 导出数据

1. 导出到hdfs

insert overwrite directory ‘$hdfs_dir’ select distinct concat(query,’\t’,query_hash) from table_name  where day=’$day’;

导出到hdfs ,不能指定分隔符,只能用默认的^A ,且不可见。想要以tab做分隔符,通过concat实现。

默认的分割是“CTR+A”,ASCII码排第二位的字符,是不可见字符,二进制表示:’\u0001’。

如果用sed进行替换,sed  -i “s/^A/\t/g” file

2. 导出到本地路径

可以指定分隔符

insert overwrite directory ‘/tmp/test’ row format DELIMITED FIELDS TERMINATED BY  ‘\t ‘ select * from table_name;

3. 导出到hive表

insert overwrite table  t1 select * from t2;

hive不支持 子查询结果直接建表,如 create table t1 as select * from t2; 在hive中是错误的

    原文作者:吹洞箫饮酒杏花下
    原文地址: https://www.jianshu.com/p/d98c288b11d7
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞