Hive中的分割和扣合

zlwx9yxi  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(367)

我的配置单元表将有呼叫记录数据。该表的3列是field1-call\u date,field2-from\u phone\u num,field3-to\u phone
我会像这样查询1)我想获得特定日期之间的所有通话记录。2) 我要获取特定日期之间某个发件人电话号码的所有通话记录。2) 我要获取特定日期之间to\电话号码的所有通话记录。
我的table大约是6tb。
我可以知道如何应用分区或bucketing来提高所有查询的性能吗?

vsaztqbk

vsaztqbk1#

您的需求总是获取特定日期之间的数据并对其进行过滤,所以表分区要偏向于日期。
如何为动态分区创建链接
您可以将分区密钥日期设置为yyyymmdd。
(比如——20170406今天(2017年4月6日))

相关问题