我正在做一个关于mapreduce任务失败的项目。根据hadoop初学者gudie(garrytukington)的说法,所有skip数据都存储在\u logs/skip/文件夹中。作者使用了hadoop1.0版本。我正在使用hadoop2.7.4。虽然我使用skip数据进行了测试,但是没有创建输出文件夹和\u logs/skip/。\u logs/skip文件夹是否与hadoop版本相关?如果我想跳过hadoop2.7.4中的数据,我应该怎么做?
dgsult0t1#
简而言之,答案是否定的,它与hadoop没有任何关系。在执行时创建了许多临时文件夹,这些临时文件夹在执行完成后将被删除。这包括日志文件夹、临时输出文件夹和其他临时文件夹。你不应该被他们弄糊涂。唯一的保证是它将生成一个带有 _SUCCESS 文件,即使没有输出。我希望它能回答你的问题。
_SUCCESS
1条答案
按热度按时间dgsult0t1#
简而言之,答案是否定的,它与hadoop没有任何关系。在执行时创建了许多临时文件夹,这些临时文件夹在执行完成后将被删除。这包括日志文件夹、临时输出文件夹和其他临时文件夹。
你不应该被他们弄糊涂。唯一的保证是它将生成一个带有
_SUCCESS
文件,即使没有输出。我希望它能回答你的问题。