HIVE直接读入json的函数有两个: (1)get_json_object(string json_string, string path) 返回值: string 说明:解析json的字符串json_string,返…
分类:Hive
HIVE基础语法
1、HIVE基本结构 Hive中主要包含以下几种数据模型:database(数据库),Table(表),External Table(外部表),Partition(分区),Bucket(桶) HIVE中数据存放在HDFS…
hive语法
查询语句 自动升级数据类型 在做join或计算处理时候,低级的type会自动升级成高级的,如int-bigint,int-float 表生成函数 explode 把行变成列 stack 把多列变成多行 case……whe…
[SQL]Crunch简化MR开发(与 Pig 和 Hive 一样)
Apache Crunch——简化 MapReduce 开发 http://www.ibm.com/developerworks/cn/opensource/os-cn-apache-crunch/index.html …
Hadoop 组件之Hive
弄这个hive 就有点小曲折了 ,安装hive还算是顺顺利利,关键是hive 使用默认的Derby…
Hive窗口函数02-NTILE、ROW_NUMBER、RANK、DENSE_RANK
Hive窗口函数NTILE、ROW_NUMBER、RANK、DENSE_RANK入门 1. 数据说明 现有 hive 表 cookie2, 内容如下: hive> select * from cookie2; co…
黑猴子的家:Hive 基本查询(SELECT…FROM)
1、全表和特定字段查询 1)全表查询 hive (default)> select * from emp; 2)选择特定列查询 hive (default)> select empno, ename from…
hive 导出数据
1. 导出到hdfs insert overwrite directory ‘$hdfs_dir’ select distinct concat(query,’\t’,qu…
Impala 实现在指定位置添加列
今天在数据脱敏的工作中碰到一个需求: 将数据仓库中的用户画像的phone字段以及该字段下的数据全部删除 1. 错误示范:impala里面直接删除该列 ALTER TABLE name DROP [COLUMN] colu…
hive级联累计
根据访问次数统计表,得到累计访问总计 建表,load数据 t_access_times.dat A,2015-01,5 A,2015-01,15 B,2015-01,5 A,2015-01,8 B,2015-01,25 …
【转载】hive使用技巧
自动化动态分配表分区及修改hive表字段名称 1、自动化动态分配表分区 set hive.exec.dynamic.partition.mode=nonstrict; insert overwrite table ods…
[译]Hive学习指南(一)
Hive是什么 Hive是基于Apache Hadoop的数据仓库。Hadoop提供了在商用硬件上存储和处理大量数据的能力,并且具有容错机制。 Hive能够让大数据的汇总,即时查询和分析变得更加简单。Hive提供了SQL…