如何在hive中模拟bigquery的分位数

a11xaf1n  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(335)

我想在hive中模拟bigquery的分位数函数。
数据集:1,2,3,4
bigquery的查询结果将返回值2
选择n(2,分位数(col1,3))
但在 hive 里:
选择百分位(col1,0.5)
我有2.5分
注意:对于奇数个记录,我得到了相同的结果。
Hive有没有足够的自定义项功能?

5uzkadbs

5uzkadbs1#

我想你要找的是 percentile_approx 自定义项。
此页面提供配置单元中所有内置自定义项的列表。
百分位_近似值(双栏,p[,b])
返回组中数值列(包括浮点类型)的大约第p百分位。b参数以内存为代价控制近似精度。值越高,得到的近似值越好,默认值为10000。当col中不同值的数目小于b时,这将给出一个精确的百分位值。

相关问题