hive测试技巧

1.仅采用分区进行测试,加快测试速度,单个分区测试通过,再放开全量

select
	a.value1,
	a.value2
from
	a
where
	dt=$dt
	hour=$hout
>> hour=$hour将分区限制到最小

2.多表join时,当关心其中两个表join结果时,可以把其他表删掉,数据插入空数据替代

>> 本条过于简单
>> 但却十分实用

3.大表采样后落一个新的小表,用小表测试

select * from (
select t.* 
from (

select *,rand() x
from table
where dt=$dt
) t
 where t.x between 0 and 0.1
) a

版权声明:本文为qq_22866291原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。