我想使用自定义分区器对数据进行分区,并将数据集与其自身交叉,从而在每个分区中生成数据的笛卡尔积。
下面的代码在所有数据集上运行交叉运算符,但我正在寻找一种解决方案,以便在每个分区和分区内执行此操作。
DataSet<Tuple2<Integer, String>> partitionedData =
data.partitionCustom(new MyPartitioner(), 0);
DataSet<Tuple2<Tuple2<Integer, String>, Tuple2<Integer, String>>> crossedData = data.cross(data);
暂无答案!
目前还没有任何答案,快来回答吧!