Hive什么情况下可以避免进行MapReduce？

2023年8月13日 270次阅读来源: 小小少年Boy

hive 0.10.0为了执行效率考虑，简单的查询，就是只是select，不带count,sum,group by这样的，都不走map/reduce，直接读取hdfs文件进行filter过滤。

1、本地模式下，hive可以简单的读取目录路径下的数据，然后输出格式化后的数据到控制台，比如有本地员工employee，当执行 select * from employee 时，直接将文件中数据格式化输出。
2、查询语句中的过滤条件只是分区字段的情况下不会进行Mapreduce。

设置：
在hive-site.xml里面有个配置参数叫

hive.fetch.task.conversion = more

将这个参数设置为more，简单查询就不走map/reduce了，设置为minimal，就任何简单select都会走map/reduce

    原文作者：小小少年Boy
    原文地址: https://www.jianshu.com/p/97b48292ed8c
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。