1、HQL脚本的三种执行方式: Hive –e ‘hql执行一行脚本 Hive –f ‘hql.file’执行一个脚本文件 Hive jdbc代码执行脚本 2、UDF函数(输入1条数据,输出1条数据) (1)Extend…
分类:Hive
##[开源]HIVE数仓数据血缘分析工具-SQL解析
HIVE数仓数据血缘分析工具-SQL解析 – thomas0yang的专栏 – 博客频道 – CSDN.NET http://blog.csdn.net/thomas0yang/art…
hadoop、hbase下载地址
hadoop下载地址:http://mirror.bit.edu.cn/apache/hadoop/common/ hbase下载地址:http://archive.apache.org/dist/hbase/ zook…
Hive小文件合并迁移
1 需求 Hive数据库内有4张表,每张表有1TB左右数据,按天分区,需要将这4张表的数据迁移到另一个集群。因为两个Hadoop集群都开启了kerberos身份认证,直接进行数据迁移不太好实现,所以需要先将A集群的数据下…
区分 hdfs hbase hive hbase适用场景
越来越多的人选择学习大数据,那关于大数据技术中hdfs hbase hive hbase适用场景一起来了解一下。 Hive 不想用程序语言开发MapReduce的朋友,熟悉SQL的朋友可以使用Hive开离线的进行数据处理…
hive 复合数据类型
hive提供了复合数据类型: Structs: structs内部的数据可以通过DOT(.)来存取,例如,表中一列c的类型为STRUCT{a INT; b INT},我们可以通过c.a来访问域a Maps(K-V对):访…
黑猴子的家:Hive 优化之并行执行
Hive会将一个查询转化成一个或者多个阶段。这样的阶段可以是MapReduce阶段、抽样阶段、合并阶段、limit阶段。或者Hive执行过程中可能需要的其他阶段。默认情况下,Hive一次只会执行一个阶段。不过,某个特定的…
##[MAPJOIN]可以使用的场景分析
HIVE中MAPJOIN可以使用的场景分析 – 东杰书屋 – 博客频道 – CSDN.NET http://blog.csdn.net/jiedushi/article/details…
利用shell脚本设置hive查询语句中的变量
在shell脚本中设置的变量,可以通过hive -e直接使用,例如: #!/bin/bash tablename="student" #等号左右不能有空格 varsubject="Math" hive -e "SELEC…
从Hive1.0升级到Hive2.0(删除hive1.x中的元数据, 并不是数据迁移)
软件环境: linux系统: CentOS6.7 Hadoop版本: 2.6.5 zookeeper版本: 3.4.8 </br> 主机配置: 一共m1, m2, m3这五部机, 每部主机的用户名都为cent…
尚硅谷大数据技术之Hive第10章 Sqoop
10.1 Sqoop概述 Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql…)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,O…
##[优化]hive优化总结
hive优化总结 – 上帝之手 – 博客频道 – CSDN.NET http://blog.csdn.net/preterhuman_peak/article/details/4064…