业务场景:
做数据分析的时候,经常会用到hive -e “sql” > result.csv,然后将结果导入到excel中,可是使用hive -e
导出后默认的分隔符是\t
,excel无法识别,所以需要将\t
转成,
方案一:使用linux管道符替换
hive -e "select * from table_name limit 100" | sed 's/\t/,/g' > result.csv
或者
hive -e "select * from table_name limit 100" | tr "\t" "," > result.csv
方案二:使用hive的insert语法导出文件
insert overwrite local directory '/home/hadoop/20180303'
row format delimited
fields terminated by ','
select * from table_name limit 100
欢迎订阅「K叔区块链」 – 专注于区块链技术学习
博客地址:
http://www.jouypub.com
简书主页:
https://www.jianshu.com/u/756c9c8ae984
segmentfault主页:
https://segmentfault.com/blog/jouypub