在HIVE中建表的时候,有时候难免要表中文注释,然而如果不经过配置,会导致desc某个表名的时候,直接以?的方式返回。
因此也来解决一下HIVE中文注释乱码的问题。由于HIVE的元数据是存在于MYSQL上的,因此需要在MYSQL上进行元数据的管理。
当hive使用mysql作为元数据库的时候mysql的字符集要设置成latin1 default。 为了保存那些utf8的中文,要将mysql中存储注释的那几个字段的字符集单独修改为utf8。
1.修改字段注释字符集
修改mysql-hive数据库当中的COLUMNS_V2表
alter table COLUMNS_V2 modify column COMMENT varchar(256) characterset utf8;
2.修改表注释字符集
修改mysql-hive数据库当中的TABLE_PARAMS表
alter tableTABLE_PARAMS modify column PARAM_VALUE varchar(4000) characterset utf8;
3.修改分区表参数,以支持分区键能够用中文表示
修改mysql-hive数据库当中的PARTITION_PARAMS与PARTITION_KEYS表
alter table PARTITION_PARAMS modify column PARAM_VALUE varchar(4000) characterset utf8;
altertable PARTITION_KEYS modify column PKEY_COMMENT varchar(4000) characterset utf8;
如果以上修改还不成功,需要在hive-site.xml修改mysql对于hive的编码为utf8
4.修改相关表相关字段编码
alter table INDEX_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
来源:https://blog.csdn.net/u013368491/article/details/71105643