大数据开发学习之Hive的静态分区

分区是hive存放数据的一种方式。将列值作为目录来存放数据,就是一个分区。这样查询时使用分区列进行过滤,只需根据列值直接扫描对应目录下的数据,不扫描其他不关心的分区,快速定位,提高查询效率。Hive分区分为静态分区和动态分区两种,以下是Hive的静态分区。

静态分区:若分区的值是确定的,那么称为静态分区。新增分区或者是加载分区数据时,已经指定分区名。

create table if not exists day_part1(

uid int,

uname string

)

partitioned by(year int,month int)

row format delimited fields terminated by '\t';

##加载数据指定分区

load data local inpath '/root/Desktop/students.txt' into tableday_part1 partition(year=2018,month=06);

##新增分区指定分区名

alter table day_part1 add partition(year=2018,month=1)partition(year=2018,month=2);

分区注意细节

(1)、尽量不要用动态分区,因为动态分区


版权声明:本文为lmseo5hy原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。