我正在尝试根据时间范围生成报告,我希望能够将事情分割成不同的部分。例如,我有一些数据,我想分组到重叠的范围内(一个24小时的窗口,我想在7天内按小时递增滑动)。如果不将时间范围从外部生成到一个由pig读取的文件中,我看不到任何方法可以做到这一点。
clj7thdc1#
你得到的答案很大程度上取决于你需要的日期格式 JOIN . 我在这里回答了一个类似的问题,我们可以在这里使用相同的原则(扩展日期范围)。另外,我很确定你可以不使用一个空白文件作为第二个输入。你至少需要做点什么 FOREACH 当然,自由民主党可以做所有的工作。我将提供一些示例代码(如果需要)一旦我知道日期需要如何格式化。
JOIN
FOREACH
1条答案
按热度按时间clj7thdc1#
你得到的答案很大程度上取决于你需要的日期格式
JOIN
. 我在这里回答了一个类似的问题,我们可以在这里使用相同的原则(扩展日期范围)。另外,我很确定你可以不使用一个空白文件作为第二个输入。你至少需要做点什么FOREACH
当然,自由民主党可以做所有的工作。我将提供一些示例代码(如果需要)一旦我知道日期需要如何格式化。