Hive创建snappy压缩格式的orc文件类型表

创建表时添加一些两个选项

文件存储格式: [STORED AS file_format]
  • file_format:
    : SEQUENCEFILE
    | TEXTFILE — (Default, depending on hive.default.fileformat configuration)
    | RCFILE — (Note: Available in Hive 0.6.0 and later)
    | ORC — (Note: Available in Hive 0.11.0 and later)
    | PARQUET — (Note: Available in Hive 0.13.0 and later)
    | AVRO — (Note: Available in Hive 0.14.0 and later)
    | INPUTFORMAT input_format_classname OUTPUTFORMAT output_format_classname
表属性值: [TBLPROPERTIES (property_name=property_value, …)]

创建带压缩格式的orc表

《Hive创建snappy压缩格式的orc文件类型表》

导入数据并查看文件大小(原始文件大小为8M)

《Hive创建snappy压缩格式的orc文件类型表》

《Hive创建snappy压缩格式的orc文件类型表》
《Hive创建snappy压缩格式的orc文件类型表》

    原文作者:志辉聊码
    原文地址: https://www.jianshu.com/p/f89f2f5ec1b5
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞