标签:hive

Hive分桶

分桶:把上传数据,分为不同的文件 将同一个目录下的数据文件,拆分成多个 同一目录多个文件 加快表连接的速度(join) 应用场景:数据抽样(sampling)、map-join 其他情况不建议分桶,小文件很恐怖! 资源调…