我正试着跟着第一个练习http://dataartisans.github.io/flink-training/exercises/.
现在我来讨论下面的问题。这是什么意思 groupBy
你能还给我吗?你觉得 foldLeft
方法转换-对我来说未知-结果?
代码如下:
mails.map {
m => (m._1.substring(0, 7), m._2.substring(m._2.lastIndexOf("<") + 1, m._2.length - 1))
}
.groupBy(0, 1)
.reduceGroup( ms => ms.foldLeft("", "", 0)( (c, m) => (m._1, m._2, c._3 + 1) ) )
你好,凯文
1条答案
按热度按时间cbwuti441#
groupBy
返回分组数据集:https://ci.apache.org/projects/flink/flink-docs-release-1.0/apis/batch/dataset_transformations.html#groupreduce-关于分组数据集foldLeft
定义折叠(或缩小)顺序。请看这里:https://en.wikipedia.org/wiki/fold_%28higher-order_function%29