Hive是什么? Hive是一种基于Hadoop的数据库技术 并提供完整的sql查询功能, . HIVE能做什么? 可以将结构化的数据文件映射为一张数据库表 可以为生成的数据库表提供完整的sql查询功能(提供了一系列工具…
分类:Hive
Hive中UDF编程
UDF介绍及编程要点 Hive中自带了许多函数,方便数据的处理分析。但是有时候没有内部的函数来提供想要的功能,需要自定义函数(UDF)来实现想要的功能。 编写UDF需要下面两个步骤 继承org.apache.hadoop…
hcatalog简介和使用
Hcatalog是apache开源的对于表和底层数据管理统一服务平台,目前最新release版本是0.5,不过需要Hive0.10支持,由于我们hive集群版本是0.9.0,所以只能降级使用hcatalog 0.4,由于…
Hadoop 之上的数据建模 - Data Vault 2.0
对比传统的基于 RDBMS 之上的数据仓库和商业智能项目,尝试着说说,Hadoop 之上的数据仓库,从ETL, 数据存储,到分析展现。重点围绕数据建模方面做分析,因为这是本文的重点,介绍一份新的数据建模方式 Data V…