Hive中有种假的NULL,它看起来和NULL一摸一样,但是实际却不是NULL。空值NULL在底层默认是用’\N’来存储的,而我们习惯性对NULL 值的过滤,一般是is null 和 is not…
标签:hive
Hive和Java API操作HBase实践
本博客采用创作共用版权协议, 要求署名、非商业用途和保持一致. 转载本博客文章必须也遵循署名-非商业用途-保持一致的创作共用协议. 由于五一假期, 成文较为简略, 一些细节部分并没有详细介绍, 如有需求, 可以参考之前几…
Hive2
Hive的部署 解压缩、重命名、设置环境变量 在目录$HIVE_HOME/conf/下,执行命令mv hive-default.xml.template hive-site.xml重命名 hive.metastore.w…
hive存储json格式文件
hive从0.12版本以后就开始自身支持json文件的格式了 1.文件格式 下面是测试用的文件预览格式,我将其存储为jsonTest.json文件,放在了/root目录下 {"_location":"(32.121, 4…
spark 读取 hdfs 数据分区规则
下文以读取 parquet 文件 / parquet hive table 为例: hive metastore 和 parquet 转化的方式通过 spark.sql.hive.convertMetastoreParq…
Hive简易教程 - 自定义UDF
简介 实现自定义的UDF需要编写Java程序,然后在Hive客户端中加载相关Jar并注册函数后就可以使用了。 示例:实现转化IP地址为二进制格式 import org.apache.hadoop.hive.ql.exec…
Hive的安装之嵌入模式
#cd training # tar -zxvf apache-hive-2.1.1-bin.tar.gz # rm -rf apache-hive-2.1.1-bin.tar.gz # mv apache-hive-2…
尚硅谷大数据技术之Hive
4.5.2 外部表 1.理论 因为表是外部表,所以Hive并非认为其完全拥有这份数据。删除该表并不会删除掉这份数据,不过描述表的元数据信息会被删除掉。 2.管理表和外部表的使用场景 每天将收集到的网站日志定期流入HDFS…
Hive解析Json数据
HIVE直接读入json的函数有两个: (1)get_json_object(string json_string, string path) 返回值: string 说明:解析json的字符串json_string,返…
HIVE基础语法
1、HIVE基本结构 Hive中主要包含以下几种数据模型:database(数据库),Table(表),External Table(外部表),Partition(分区),Bucket(桶) HIVE中数据存放在HDFS…
Hadoop 组件之Hive
弄这个hive 就有点小曲折了 ,安装hive还算是顺顺利利,关键是hive 使用默认的Derby…
黑猴子的家:Hive 基本查询(SELECT…FROM)
1、全表和特定字段查询 1)全表查询 hive (default)> select * from emp; 2)选择特定列查询 hive (default)> select empno, ename from…