我如何知道在/mnt/yarn/usercache和/var/log/hadoop yarn/containers目录中删除哪些内容是安全的?

dojqjjoe  于 2021-05-27  发布在  Hadoop
关注(0)|答案(1)|浏览(1356)

我在aws上运行了一个emr集群。我看了一下Yarn,我发现我的4个工人有这种“不健康的状态”是由于

1/2 local-dirs are bad: /mnt/yarn; 1/1 log-dirs are bad: /var/log/hadoop-yarn/containers

所以,我ssh到worker节点->run df 确实如此 /mnt/yarn 是在99%的磁盘空间使用。还有,很多 stderror 以及 stdout 文件占用了很多空间 /var/log/hadoop-yarn/containers 目录。我的问题是:哪些可以安全删除,哪些不能?我觉得自己就像掉进了一个兔子洞,读了几个小时后,仍然不知道如何在我的工作节点中释放磁盘空间。我一直在读关于 /mnt/yarn/usercache 目录,并且该目录中的内容似乎是用于运行spark应用程序的“本地资源”。但是 /mnt/yarn/usercache/hadoop/filecache 以及 /mnt/yarn/usercache/hadoop/appcache 在中分别占用3%和96%的磁盘空间 /mnt/yarn

nwlls2ji

nwlls2ji1#

可能需要清除此文件夹-/var/log/hadoop/apps/hadoop/logs/
在hdfs上。尝试 hdfs dfs -ls /var/log/hadoop-yarn/apps/hadoop/logs 来查看它。
检查执行器上的-/mnt/var/log/hadoop/containers的另一个选项。
应该有另一个名为“application\u someid”的文件夹。这些文件夹包含已完成和正在运行的spark作业的日志。

相关问题