一 环境 OS:ubuntu 16.04.3 LTS Hadoop:2.6.5 java:1.8.0_151 Hive 2.1.1 Hadoop集群环境 10.190.3.10 master 10.190.3.6 sla…
分类:Hive
利用Sqoop实现Hive的数据与MySQL数据的互导
1. 配置概览 Hive arguments: --create-hive-table Fail if the target hive table exists --hive-database <database-…
MySQL中的open_files_limit
open_files_limit 是mysql中的一个全局变量且不可动态修改。它控制着mysqld进程能使用的最大文件描述(FD)符数量。需要注意的是这个变量的值并不一定是你设定的值,mysqld会在系统允许的情况下尽量…
hive执行sql:stage-1 map = 0 reduce = 0
问题描述: 在hive shell中执行sql,如 insert into person_base1 select * from person_base; 运行日志中一直显示如下信息 hive> insert in…
Hive分组取TOPN数据
1、ROW_NUMBER,RANK(),DENSE_RANK() 语法格式:row_number() OVER (partition by COL1 order by COL2 desc ) rank partition…
Hadoop数据分析平台实战——180Oozie工作流使用介绍
离线数据分析平台实战——180Oozie工作流使用介绍 Oozie工作流介绍 Oozie的四大组件服务分别是: workflow, coordinator, bundle和sla。 其中sla是作为监控服务协议的一个组件…
Hive的metastore安装配置方式
Hive 的 metastore 安装方式共有三种 1)内嵌模式 使用内嵌的derby数据库储存元数据, 默认即为内嵌模式 运行hive会在当前目录生成一个derby文件和一个metastore_db目录 同一个目录下同…
Hive数据导出
Hive数据导出 导出方式 Hadoop命令方式 Get (hadoop fs -get /warehouse/test/* /home/data) text (hadoop fs -text /warehouse/te…
Hive笔记6-hive元数据表结构详解
hive系列之六-hive元数据表结构详解 Hive自己维护了一套元数据,用户通过HQL查询时候,Hive首先需要结合元数据,将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途,以…
oozie问题总结
遇到的问题 oozie的sqoop节点配置过多时启动卡死现象,报错为Heart beat 解决方式:将oozie的action队列和launcher队列分开配置参数如下 oozie.launcher.mapred.job…
Azkaban安装和配置
Azkaban是由Linkedin公司推出的一个批量工作流任务调度器,用于在一个工作流内以一个特定的顺序运行一组工作和流程 Azkaban使用job配置文件建立任务之间的依赖关系,并提供一个易于使用的web用户界面维护和…
hive sql查询语句练习
测试数据 course.txt 1,数据库 2,数学 3,信息系统 4,操作系统 5,数据结构 6,数据处理 sc.txt 95001,1,81 95001,2,85 95001,3,88 95001,4,70 9500…