hadoop：按前两个键进行数字排序？

6vl6ewon 于 2021-06-04 发布在 Hadoop

关注(0)|答案(1)|浏览(344)

我正在寻找hadoop（使用流媒体和python）来按前两个键对Map器的输出进行排序；
我的Map绘制程序打印如下 print '%s\t%s\t%s' & (num1, num2, value) 我想让我的减速机接收按 num1 然后 num2 ，以便这些输出：

交付给异径管（假设我们有3个异径管）：

1   2   A
1   10  B
-----------
2   1   C
------------
10  3   D

我试过使用 mapred.text.key.partitioner.options 选项将其设置为 -k1n,1 -k2n,2 但这似乎不起作用。
有什么想法吗？
我基本上想让hadoop来执行这个 unix 排序： sort -k1n,1 -k2n,2 我使用的hadoop版本是0.20.2
谢谢

hadoop hadoop-streaming

来源：https://stackoverflow.com/questions/20294940/hadoop-sorting-by-first-two-keys-numerically