hive分位数

percentile函数

percentile(col, p) ,col是要计算的列(值必须为int类型),p的取值为0-1,若为0.5,那么就是2分位数,即中位数。

percentile_approx函数

percentile_approx(col, p),列为数值类型都可以,percentile_approx还有一种形式percentile_approx(col, p, B),参数B控制内存消耗的近似精度,B越大,结果的精度越高。默认值为10000。其中,p也可以是个数组,可以一次计算多个分位的值,percentile_approx(col, arrray(0.25,0.5,0.75), B)。
注意:推荐使用percentile函数,分别去计算不同分位!!!

-------------------------------------------------------------------------------------------------------------------------------

分位数计算举例:

 

分位数网站: 

四分计算器


版权声明:本文为qq_36932624原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。