Hive与MySQL的不同之处之类型转换cast和covert函数

Hive:

cast(xxx AS 类型)
如:
cast(tm AS bigint)

附上Hive基本数据类型:

数据类型所占字节开始支持版本
TINYINT1byte,-128 ~ 127
SMALLINT2byte,-32,768 ~ 32,767
INT4byte,-2,147,483,648 ~ 2,147,483,647
BIGINT8byte,-9,223,372,036,854,775,808 ~ 9,223,372,036,854,775,807
BOOLEAN
FLOAT4byte单精度
DOUBLE8byte双精度
STRING
BINARY从Hive0.8.0开始支持
TIMESTAMP从Hive0.8.0开始支持
DECIMAL从Hive0.11.0开始支持
CHAR从Hive0.13.0开始支持
VARCHAR从Hive0.12.0开始支持
DATE从Hive0.12.0开始支持

复杂类型包括ARRAY,MAP,STRUCT,UNION,这些复杂类型是由基础类型组成的。

ARRAY

ARRAY类型是由一系列相同数据类型的元素组成,这些元素可以通过下标来访问。比如有一个ARRAY类型的变量fruits,它是由[‘apple’,’orange’,’mango’]组成,那么我们可以通过fruits[1]来访问元素orange,因为ARRAY类型的下标是从0开始的;

MAP:

MAP包含key->value键值对,可以通过key来访问元素。比如”userlist”是一个map类型,其中username是key,password是value;那么我们可以通过userlist[‘username’]来得到这个用户对应的password;

STRUCT:

STRUCT可以包含不同数据类型的元素。这些元素可以通过”点语法”的方式来得到所需要的元素,比如user是一个STRUCT类型,那么可以通过user.address得到这个用户的地址。

UNION:

UNION TYPE,他是从Hive 0.7.0开始支持的。

创建一个包含复制类型的表格可以如下

CREATE TABLE employees (  
    name STRING,  
    salary FLOAT,  
    subordinates ARRAY<STRING>,  
    deductions MAP<STRING, FLOAT>,  
    address STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>  
) PARTITIONED BY (country STRING, state STRING); 

MySQL:

cast(xxx AS 类型)或convert(xxx,类型),类型必须用下列的类型:

二进制,同带binary前缀的效果 : BINARY
字符型,可带参数 : CHAR()
日期 : DATE
时间: TIME
日期时间型 : DATETIME
浮点数 : DECIMAL
整数 : SIGNED
无符号整数 : UNSIGNED

如:cast(tm AS signed)
或convert(tm,signed)

警告:

MySQL类型转换不能用int之类的,否则会报错:
cast(tm AS int)
或convert(tm,int)

附上MySQL基本数据类型:

|** 类型 **| **大小 **| ** 描述 **|
|————| ———-| ———- |:———–:|
|char[length] | length字节 | 定长字段,长度为0-255个字节|
|varchar[length] | string长度+1字节 | 变长字段,在mysql5.03以前,长度为0-255个字节,在5.0.3以后,最大长度为65535字节。一个utf8字符占3个字节、一个gbk字符占两个字节。|
|tinytext | string长度+1字节 | 字符串,长度为0-255个字节|
|text | string长度+2字节 | 字符串,最大长度为0-65535个字节|
|mediumtext | string长度+3字节 | 字符串,最大长度为16777215个字节|
|longtext | string长度+4字节 | 字符串,最大长度为4194967295个字节|
|tinyint[length] | 1字节 | 范围:-128127或0255|
|smallint[length] | 2字节 | |
|mediumint[length] | 3字节 | |
|int[length] | 4字节 | |
|bigint[length] | 8字节 | |
|float | 4字节 | |
|double[length,decimals] | 8字节 | 运行固定的小数点|
|decimal[length,decimals] | length+1字节或length+2字节 | |
|date | 3字节 | 采用YYYY-MM-DD格式|
|datetime | 8字节 | 采用YYYY-MM-DD HH:mm:SS格式|
|timestamp | 4字节 | 采用YYYYMMDDHHmmSS格式|
|time | 3字节 | 采用HH:MM:SS格式|
|enum | 1或2字节 | 枚举类型|
|set | 1、2、3、4或8字节 | 与enum一样,只不过每一列可以具有多个可能的值|
|blob | | 是text的一个变体。允许存储二进制文件,还可用于某些加密数据。|

    原文作者:元七少
    原文地址: https://www.jianshu.com/p/57448abf1e68
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞