HiveQL 数据定义 HiveQL 是Hive查询语言,不完成遵循任一种ANSI SQL标准的修订版。 Hive 不支持行级插入操作、更新操作和删除操作,也不支持事务 Hive中的数据库 Hive中数据库本质上是表的一…
分类:Hive
黑猴子的家:Sqoop 公用参数:hive
序号 参数 说明 1 –hive-delims-replacement <arg> 用自定义的字符串替换掉数据中的\r\n和\013 \010等字符 2 –hive-drop-impo…
Spark on Yarn集群搭建
软件环境: linux系统: CentOS6.7 Hadoop版本: 2.6.5 zookeeper版本: 3.4.8 </br> 主机配置: 一共m1, m2, m3这五部机, 每部主机的用户名都为cent…
Hive练习(三)
使用beeline连接到hive beeline -u "jdbc:hive2://localhost:10000" ' ' ' ' 创建users表和train表,为了方便, 创建表的hql语句单独写在一个脚本文件中,…
常见Hive调优策略
Hive是否执行mapreduce 因为有些sql语句是不需要走mapreduce的。比如:select *、limit。 #在配置文件中hive-site.xml设置 <name>hive.fetch.ta…
动态分区说明
Hive分区 Hive的动态分区 概述 hive中支持两种类型的分区: 静态分区SP(static partition) 动态分区DP(dynamic partition) 静态分区与动态分区的主要区别在于静态分区是手动…
Hive的事务
基础 事务和ACID 何为事务? 事务就是一组单元化操作,这些操作要么都执行,要么都不执行,是一个不可分割的工作单位。 事务(transaction)所应该具有的四个要素:原子性(Atomicity)、一致性(Consi…
我的Hive学习之旅
row number 作用 : 返回这个Partition下的当前Row号,根据排序字段生成,无重复。 语法 :row_number() over (partition by 字段a order by 计算项b desc…
51cto赵强HADOOP学习(十一)Hive安装
安装模式 嵌入模式 元数据信息被存储在Hive自带的Derby数据库中 只允许创建一个连接 多用于Demo hadoop用伪分布 #start-all.sh #tar -zxvf apache-hive-0.13.0-b…
(三)Hive的文件存储格式
hive文件存储格式包括以下几类: TEXTFILE SEQUENCEFILE RCFILE 自定义格式 其中TEXTFILE为默认格式,建表时不指定默认为这个格式,导入数据时会直接把数据文件拷贝到hdfs上不进行处理。…
从零开始搭建hadoop3集群
配置参考文章 https://blog.csdn.net/dream_an/article/details/80258283 准备工作 起始是一台ubuntu,另外两台是裸机。准备一个u盘(用来复制系统或拷贝文件)。 需…
Hive的常用表修改操作
1.修改表名称: hive > alter table log_messages to logmsgs; 2.增加列: hive > alter table log_messages add coloumns…