Hive SQL执行计划深度解析

Hive SQL执行计划深度解析 – An342647823的专栏 – 博客频道 – CSDN.NET
http://blog.csdn.net/an342647823/article/details/36385479

美团网技术陈纯大作,值得拥有。

Hive是基于Hadoop的一个数据仓库系统,在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建,每天执行近万次的Hive ETL计算流程,负责每天数百GB的数据存储和分析。Hive的稳定性和性能对我们的数据分析非常关键。

在几次升级Hive的过程中,我们遇到了一些大大小小的问题。通过向社区的咨询和自己的努力,在解决这些问题的同时我们对Hive将SQL编译为MapReduce的过程有了比较深入的理解。对这一过程的理解不仅帮助我们解决了一些Hive的bug,也有利于我们优化Hive SQL,提升我们对Hive的掌控力,同时有能力去定制一些需要的功能。

    原文作者:葡萄喃喃呓语
    原文地址: https://www.jianshu.com/p/3d940c7c6f65
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞