先说一下自己的理解:下面的col1其实是一个可以根据这个字段查出整行数据的(类似于主键),如果不能确定的话那就将所有字段都写上 如何快速确定一张表内是否有重复数据: select count(col1), count(d…
标签:hive
HIVE中常见文件存储格式比较
文件格式 在HIVE中,常见的文件存储格式有 TextFile Parquet ORC Sequence RC AVRO 建表语句 这里我们根据不同的文件格式,新建测试表。 --textfile文件格式 CREATE T…
数据库建立索引怎么利用索引查询
数据库建立索引怎么利用索引查询? 精选 1.合理使用索引 索引是数据库中重要的数据结构,它的根本目的就是为了提高查询效率。现在大多数的数据库产品都采用IBM最先提出的ISAM索引结构。 索引的使用要恰到好处,其…
hive相关基础
hive相关基础 1、进入到hive命令下;(linux下直接输入hive即可) hive 2、查看工作分区下的hive表都有哪些? show tables; 3、查看hive中某个具体表,例如要查看’abc…
优化一:hive.auto.convert.join
大表关联小表,把小表自动加载到内存中,需要确认以下配置为true,相当于写了一个mapjoin set hive.auto.convert.join = true; hive.mapjoin.smalltable.fil…
##Hive分析窗口函数(五) CUBE,ROLLUP,GROUPING SETS,GROUPING__ID,
Hive分析窗口函数(五) GROUPING SETS,GROUPING__ID,CUBE,ROLLUP – u013214671的博客 – 博客频道 – CSDN.NET http:…
[概念]Hive 基础之:分区、桶、Sort Merge Bucket Join
Hive 基础之:分区、桶、Sort Merge Bucket Join – 远方的专栏 – 博客频道 – CSDN.NET http://blog.csdn.net/u0147747…
Presto学译 | 0. 目录
因为有用到 Presto,就按照官方文档学一学,顺便记录一下,预计两个星期吧。 目录 1. 简单介绍与部署 2. 使用命令行接口进行查询 3. 配置Hive连接器以查询Hive数据
apache-hive-1.2.2安装
只需要在namenode节点中安装即可 配置环境变量 将如下内容添加到 ~/.bash_profile中 export HIVE_HOME=/root/software/apache-hive-1.2.1-bin exp…
Hive学习笔记(3)表
Hive的表在逻辑上由存储的数据和描述表中数据形式的相关元数据组成。数据通常存储在HDFS中,元数据通常保存在关系型数据库中。 数据库 Hive中也由database的概念,本质是在HDFS中的一个目录。 创建数据库 c…
[SQL]SQL on Hadoop~如何选择?
如何选择满足需求的SQL on Hadoop系统 – 文章 http://weibo.com/p/1001603864171165928729 在批处理时代,Hive一枝独秀;在实时交互式查询时代,呈现出的是…
搭建Hive数据仓库+python操作Hive
一、Hive安装及服务启动 Hive是基于Hadoop的数据仓库解决方案。由于Hadoop本身在数据存储和计算方面有很好的可扩展性和高容错性,因此使用Hive构建的数据仓库也秉承了这些特性。 简单来说,Hive就是在Ha…