创建表格 CREATE TABLE u_data ( userid INT, movieid INT, rating INT, unixtime STRING) ROW FORMAT DELIMITED FIELDS T…
分类:Hive
集群之间hive表数据迁移
前言 这几天在做集群之间的hive表数据迁移,方法比较笨,但是亲测有效,能够实现预期目标。 操作流程 1、在本地集群建立临时文件夹currentData mkdir currentData 2、将hive表中的数据保存到…
Beeline连接Hiveserver2错误
错误定位 最近给hadoop集群配置了kerberos认证,之后准备配置sentry进行权限管理。安装并启用sentry服务后需要在beeline进行Grant等授权操作。 Note that since Hive CL…
大数据方向学习指南
前置知识:Linux用户管理,Linux文件权限管理,文件打包与解压,SQL语句 Step1 熟悉工作室软件环境 Step2 VirtualBox使用&启动vimtutor Step3 熟悉云平台的使用 Step…
hive OVER(PARTITION BY)开窗函数用法
hive OVER(PARTITION BY)函数用法 – sherri_du的博客 – 博客频道 – CSDN.NET http://blog.csdn.net/sherri_du/…
Hive扩展功能(七)--Hive On Spark
软件环境: linux系统: CentOS6.7 Hadoop版本: 2.6.5 zookeeper版本: 3.4.8 </br> 主机配置: 一共m1, m2, m3这三部机, 每部主机的用户名都为cent…
Hive知识点总结
Hive知识点总结 – 不仅仅是程序员 – 博客频道 – CSDN.NET http://blog.csdn.net/it18911008884/article/details/518…
Hadoop-Hive常用基础HQL语句
一. 数据库 1. 查询数据库列表 show databases ; 2. 使用指定的数据库 use default; 3. 查看数据库的描述信息 desc database extended db_hive_03 ; …
sqoop集成Kerberos
隶属于文章系列:大数据安全实战 https://www.jianshu.com/p/76627fd8399c 创建密钥文件 /var/opt/app/keytab/zkcli.keyTab 创建配置文件:/var/opt…
阿里数据分析师面试
阿里数据分析师面试 一面 帮助了解简历,基本是自己在说,学校,专业,实习经历,收获及感悟。最后可以问两个问题:1.阿里数据分析师的主要职责及所需的工作技能?2.入职后有没有相关的培训? 二面 二面问的比较详细。 最能体现…
hive的动态分区加载数据和静态分区加载数据
静态分区static partition:手动输入数据分区名称。 动态分区dynamic partition:通过数据来判断数据分区名称。 开启动态分区:set hive.exec.dynamic.partition=t…
Hive自定义UDAF
注:本文copy自http://blog.csdn.net/lzm1340458776/article/details/43313919,纯属当笔记使用。 Hive在查询数据时,有些聚类函数框架并没有提供实现,需要用户自…