跳过失败的Map作业

eh57zj3b  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(269)

有没有一种方法可以跳过一个失败的Map作业而不是整个作业?我有成千上万的Map工作都运行良好,总是有这个恼人的最后一个Map工作,需要永远,最终杀死大工作。
有没有一种方法可以设置“忽略失败”这样的常规设置或可以忽略的Map百分比?
我不期待完美的结果与100%的数据,一个好的估计与95%将完全足够。

j2qf4p5b

j2qf4p5b1#

可以使用mapred.max.map.failures.percent(新版本2.1.0中的mapreduce.map.failures.maxpercent)和mapred.max.reduce.failures.percent属性来控制作业失败
http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/deprecatedproperties.html

相关问题