Hive:
cast(xxx AS 类型)
如:
cast(tm AS bigint)
附上Hive基本数据类型:
数据类型 | 所占字节 | 开始支持版本 |
---|---|---|
TINYINT | 1byte,-128 ~ 127 | |
SMALLINT | 2byte,-32,768 ~ 32,767 | |
INT | 4byte,-2,147,483,648 ~ 2,147,483,647 | |
BIGINT | 8byte,-9,223,372,036,854,775,808 ~ 9,223,372,036,854,775,807 | |
BOOLEAN | ||
FLOAT | 4byte单精度 | |
DOUBLE | 8byte双精度 | |
STRING | ||
BINARY | 从Hive0.8.0开始支持 | |
TIMESTAMP | 从Hive0.8.0开始支持 | |
DECIMAL | 从Hive0.11.0开始支持 | |
CHAR | 从Hive0.13.0开始支持 | |
VARCHAR | 从Hive0.12.0开始支持 | |
DATE | 从Hive0.12.0开始支持 |
复杂类型包括ARRAY,MAP,STRUCT,UNION,这些复杂类型是由基础类型组成的。
ARRAY
ARRAY类型是由一系列相同数据类型的元素组成,这些元素可以通过下标来访问。比如有一个ARRAY类型的变量fruits,它是由[‘apple’,’orange’,’mango’]组成,那么我们可以通过fruits[1]来访问元素orange,因为ARRAY类型的下标是从0开始的;
MAP:
MAP包含key->value键值对,可以通过key来访问元素。比如”userlist”是一个map类型,其中username是key,password是value;那么我们可以通过userlist[‘username’]来得到这个用户对应的password;
STRUCT:
STRUCT可以包含不同数据类型的元素。这些元素可以通过”点语法”的方式来得到所需要的元素,比如user是一个STRUCT类型,那么可以通过user.address得到这个用户的地址。
UNION:
UNION TYPE,他是从Hive 0.7.0开始支持的。
创建一个包含复制类型的表格可以如下
CREATE TABLE employees (
name STRING,
salary FLOAT,
subordinates ARRAY<STRING>,
deductions MAP<STRING, FLOAT>,
address STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>
) PARTITIONED BY (country STRING, state STRING);
MySQL:
cast(xxx AS 类型)或convert(xxx,类型),类型必须用下列的类型:
二进制,同带binary前缀的效果 : BINARY
字符型,可带参数 : CHAR()
日期 : DATE
时间: TIME
日期时间型 : DATETIME
浮点数 : DECIMAL
整数 : SIGNED
无符号整数 : UNSIGNED
如:cast(tm AS signed)
或convert(tm,signed)
警告:
MySQL类型转换不能用int之类的,否则会报错:
cast(tm AS int)
或convert(tm,int)
附上MySQL基本数据类型:
|** 类型 **| **大小 **| ** 描述 **|
|————| ———-| ———- |:———–:|
|char[length] | length字节 | 定长字段,长度为0-255个字节|
|varchar[length] | string长度+1字节 | 变长字段,在mysql5.03以前,长度为0-255个字节,在5.0.3以后,最大长度为65535字节。一个utf8字符占3个字节、一个gbk字符占两个字节。|
|tinytext | string长度+1字节 | 字符串,长度为0-255个字节|
|text | string长度+2字节 | 字符串,最大长度为0-65535个字节|
|mediumtext | string长度+3字节 | 字符串,最大长度为16777215个字节|
|longtext | string长度+4字节 | 字符串,最大长度为4194967295个字节|
|tinyint[length] | 1字节 | 范围:-128127或0255|
|smallint[length] | 2字节 | |
|mediumint[length] | 3字节 | |
|int[length] | 4字节 | |
|bigint[length] | 8字节 | |
|float | 4字节 | |
|double[length,decimals] | 8字节 | 运行固定的小数点|
|decimal[length,decimals] | length+1字节或length+2字节 | |
|date | 3字节 | 采用YYYY-MM-DD格式|
|datetime | 8字节 | 采用YYYY-MM-DD HH:mm:SS格式|
|timestamp | 4字节 | 采用YYYYMMDDHHmmSS格式|
|time | 3字节 | 采用HH:MM:SS格式|
|enum | 1或2字节 | 枚举类型|
|set | 1、2、3、4或8字节 | 与enum一样,只不过每一列可以具有多个可能的值|
|blob | | 是text的一个变体。允许存储二进制文件,还可用于某些加密数据。|