hive:从集合中选择最近的项

bkkx9g8r  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(345)

我正在寻找一种方法来选择最近的项目(日期)从设置在Hive。例如,我们有下表 t1 :

item       date
a          2016-01-01
a          2016-02-04
b          2016-01-10

之后

hive> select item, collect_set(date) as dates from t1 group by item;

我有

item       dates
a          [2016-01-01, 2016-02-04]
b          [2016-01-10]

所以现在我需要去掉绝对日期,也就是说,创建一个类似于

item       date
a          2016-02-04
b          2016-01-10

有人能帮忙吗?

s3fp2yjn

s3fp2yjn1#

只是使用 max() :

select item, max(date) as date
from t1
group by item;

如果您真的想要一个新表,可以使用 create table as .

相关问题