科多大数据带你学习Hive和HBase之间的不同。 Apache Hive是一个构建在hadoop基础设施之上的数据仓库。通过Hive可以使用HQL语言查询存放在HDFS上的数据。HQL是一种类SQL语言,这种语言最终被…
标签:hive
hive新增字段Bug
最近工作中遇到一个问题: 对于分区表添加字段,向已存在分区中插入数据,结果新增字段的值全部为null。 注:是已存在分区,新的分区并不会产生该问题;无论是内部表还是外部表均有该问题。 解决办法:删除旧分区,重跑数据(因为…
Hive外表批量添加分区
简介 我们有一批日志数据存储在hdfs上,按天创建目录,如2018-07-31的日志hdfs路径为:/data/logs/gateway/20180731。 现在要用hive分析数据,同时要保证这些数据目录不能改变,就需…
Python链接Hive读取数据的几种方式
R和Python是数据分析人员常用的两个工具, 笔主在R通过RJDBC链接Hive 介绍了R如何链接Hive, 今天换Python. 以下有几种链接方式, 标题均包含了官方链接, 详情大家可点击查看 注意: Python…
Hive-Transform-Python:快捷的Map/Reduce
Hive 提供了 Transform 这一关键字,使用 python 脚本处理hive 的数据,实现 Map/Reduce 的效果,在一些场景下,相比直接编写 Hadoop MR 要方便不少。 简介 首先简要介绍一下 h…
hive笔记之beeline
beeline 连接hive 建表 查询 聚合运算 一般用beeline连接hive进行建表 !connect jdbc:hive2://hadoop6:10000/db: 输入对应的用户和密码 !quit 退出 进行聚…
06-Hive高级01
Hive高级 1)产生背景 2)部署 3)DDL 4)DML 5)JOIN 6)function:build-in & udf 7)Sqoop hive cli:hive/webui/beeline/Java A…
HIVE UDTF 自定义函数
HIVE UDTF 自定义函数 关键词:HIVE UDTF 开发 实例 Hive运行用户自定义函数对数据信息处理,可以试用show functions查看 hive当前支持的函数,查看凡是如下 hive> show…
Spark SQL(一)入门介绍
假设有如下文本文件: id, name, age, city 1001,zhangsan,45,beijing 1002,lisi,35,shanghai 1003,wangwu,29,tianjin ……
Hive数据操作
Hive数据操作 Hive执行命令方式 cli,jdbc,hwi,beeline cli shell hive -help hive –help list,source 注:命令脚本必须在集群的节点或hive…
一起学Hive系列文章
转载:http://lxw1234.com/archives/2015/07/365.htm 这一系列都是转载,做个学习记录 [一起学Hive]之一–Hive概述,Hive是什么 [一起学Hive]之二–Hive函数大全…
Hive- UDF&GenericUDF
hive udf简介 在Hive中,用户可以自定义一些函数,用于扩展HiveQL的功能,而这类函数叫做UDF(用户自定义函数)。UDF分为两大类:UDAF(用户自定义聚合函数)和UDTF(用户自定义表生成函数)。在介绍U…