Hive分桶表
概述:
分桶表也叫桶表,是一种用于优化查询而设计的表类型
分桶表对应的数据文件在底层会被分解为若干个小部分
在分桶时,要指定根据哪个字段将数据分为几桶(几个部分)
分桶规则:
分桶表的创建:
分桶表数据的加载:
分桶表优势:
1、减少全表查询
2、JOIN时可以提高效率,减少笛卡尔积数量
3、提高抽样的效率
版权声明:本文为weixin_45264992原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。
概述:
分桶表也叫桶表,是一种用于优化查询而设计的表类型
分桶表对应的数据文件在底层会被分解为若干个小部分
在分桶时,要指定根据哪个字段将数据分为几桶(几个部分)
分桶规则:
分桶表的创建:
分桶表数据的加载:
分桶表优势:
1、减少全表查询
2、JOIN时可以提高效率,减少笛卡尔积数量
3、提高抽样的效率