【hive】约束-enable|disable novlidate


ENABLE|DISABLE NOVALIDATE RELY/NORELY 

启用约束:
enable novalidate :启用约束,创建索引,仅对新加入的数据强制执行约束,而不管表中的现有数据. 

禁用约束:
disable novalidate:关闭约束,删除索引,可以对约束列的数据进行修改等操作.

Hive包含对未经验证的主键和外键约束的支持,一些sql工具在存在约束时会生成更加高效的查询,由于这些限制条件未经验证,上游系统在加载到Hive之前需要确保数据的完整性。
常用的PK( PRIMARY KEY)和FK(FOREIGN KEY)约束使用如下:

CREATE TABLE product 
  ( 
     product_id        INTEGER, 
     product_vendor_id INTEGER, 
     PRIMARY KEY (product_id)  DISABLE NOVALIDATE, 
     CONSTRAINT product_fk_1 FOREIGN KEY (product_vendor_id) REFERENCES vendor(vendor_id)  DISABLE NOVALIDATE
  ); 
CREATE TABLE vendor 
  ( 
     vendor_id INTEGER, 
     PRIMARY KEY (vendor_id)  DISABLE NOVALIDATE RELY
  ); 
 
create table pk(id1 integer, id2 integer,
  primary key(id1, id2) disable novalidate);
在上面的语法中,需要注意一下几点:

[CONSTRAINT constraint-Name]是可选的,定义一个约束名称,若是没有指定系统会生成一个约束名称,为简单起见,CONSTRAINT在外键时可以使用,因为每个表只有一个主键因此没有必要定义约束名称。
RELY/NORELY同样是可选的。如果一个约束指定RELY,也就是希望HIVE CBO(cost based optimize)使用约束信息来获得更好的统计,对不必要的连接删除( join
elimination),来得到更好的整体执行计划。
DISABLE 和NOVALIDATE现在是强制性的因为现在暂不支持默认的ENABLE 和VALIDATE,实际上就是上边介绍的hive未验证约束。
一个表只允许有一个主键约束。
正常来说外键的引用必须是唯一性索引,也就是unique或者主键,但是hive目前并不支持unique,因此目前外键的父列必须是主键。
添加约束

ALTER TABLE table_name ADD CONSTRAINT constraint_name PRIMARY KEY (column, ...) DISABLE NOVALIDATE;

ALTER TABLE table_name ADD CONSTRAINT constraint_name FOREIGN KEY (column, ...) REFERENCES table_name(column, ...) DISABLE NOVALIDATE RELY;

ALTER TABLE table_name ADD CONSTRAINT constraint_name UNIQUE (column, ...) DISABLE NOVALIDATE;

ALTER TABLE table_name CHANGE COLUMN column_name column_name data_type CONSTRAINT constraint_name NOT NULL ENABLE;

ALTER TABLE table_name CHANGE COLUMN column_name column_name data_type CONSTRAINT constraint_name DEFAULT default_value ENABLE;

ALTER TABLE table_name CHANGE COLUMN column_name column_name data_type CONSTRAINT constraint_name CHECK check_expression ENABLE;

ALTER TABLE table_name DROP CONSTRAINT constraint_name;