配置过程如下: 1)添加jar包 add jar file:///path/to/elasticsearch-hadoop-hive-5.2.0.jar; 2)创建一个hive-es对应表 create external…
分类:Hive
数据仓库之拉链表(hive实现)
预备知识: 了解hive窗口函数:LAG 和 LEAD 数据准备: cookie1,2015-04-10 10:00:02,url2 cookie1,2015-04-10 10:00:00,url1 cookie1,20…
尚硅谷大数据技术之HBase 第5章 HBase API操作
5.1 环境准备 新建项目后在pom.xml中添加依赖: <dependency> <groupId>org.apache.hbase</groupId> <artifactId…
Hive存储文件命名的规则
Hive命令行 Hive在存储文件时候,有一些文件命名的规则,现在还不是很懂底层的原理,但是把现象记录下来,以备之后讨论。 hive> insert into table db.table PARTITION (p…
ubuntu16.04 本地安装hive
前提条件 安装hadoop 1.下载hive2.3.3 2.创建hive文件夹 sudo mkdir /usr/share/hive 3.解压hive sudo tar -zxvf apache-hive-2.3.3-b…
Hive 使用Jdbc连接进行连接
之前在学习hive时,一直是通过命令行进行相关操作,但是,稍稍有些不方便,因此就想着学习通过Java直接访问Hive数据库,特此写了这篇文章,记录一下,方便今后查阅和复习。 一、 配置文件 <configurati…
Hive distinct vs group by
select count(distinct id) from mytbl; select count(*) from (select distinct id from mytbl ) t; 两个查询,都会在map阶段co…
Hive基础
一.hive的数据类型 基本类型:整数类型,浮点类型,布尔类型,字符串类型; 复杂的数据类型(新增): 数组类型array: 创建表: create table student (sid int,game string,…
(六)Hive函数大全
一、关系运算: 1. 等值比较: = 2. 等值比较:<=> 3. 不等值比较: <>和!= 4. 小于比较: < 5. 小于等于比较: <= 6. 大于比较: > 7. 大于等…
Failed with exception java.io.IOException:java.lang.ClassCastException: org.apache.hadoop.hbase.client.Result cannot be cast to org.apache.hadoop.io.Writable
Failed with exception java.io.IOException:java.lang.ClassCastException: org.apache.hadoop.hbase.client.Result …
hive中order by,sort by, distribute by, cluster by作用以及用法
1. order by Hive中的order by跟传统的sql语言中的order by作用是一样的,会对查询的结果做一次全局排序,所以说,只有hive的sql中制定了order by所有的数据都会到同一个reduce…
HIVE: lateral view explode & json_turpe 实现 json数组行转列&字段拆分
问题描述 有时候因为业务的需要,有些字段不但是json格式,并且还是个json数组,比如下表 pay_infos: pay_id infos 1111 [{“uid”:123,”ter…