我如何知道在/mnt/yarn/usercache和/var/log/hadoop yarn/containers目录中删除哪些内容是安全的？

dojqjjoe 于 2021-05-27 发布在 Hadoop

关注(0)|答案(1)|浏览(1356)

我在aws上运行了一个emr集群。我看了一下Yarn，我发现我的4个工人有这种“不健康的状态”是由于

1/2 local-dirs are bad: /mnt/yarn; 1/1 log-dirs are bad: /var/log/hadoop-yarn/containers

所以，我ssh到worker节点->run df 确实如此 /mnt/yarn 是在99%的磁盘空间使用。还有，很多 stderror 以及 stdout 文件占用了很多空间 /var/log/hadoop-yarn/containers 目录。我的问题是：哪些可以安全删除，哪些不能？我觉得自己就像掉进了一个兔子洞，读了几个小时后，仍然不知道如何在我的工作节点中释放磁盘空间。我一直在读关于 /mnt/yarn/usercache 目录，并且该目录中的内容似乎是用于运行spark应用程序的“本地资源”。但是 /mnt/yarn/usercache/hadoop/filecache 以及 /mnt/yarn/usercache/hadoop/appcache 在中分别占用3%和96%的磁盘空间 /mnt/yarn

hadoop yarn amazon-emr

来源：https://stackoverflow.com/questions/60142371/how-i-know-what-is-safe-to-delete-in-mnt-yarn-usercache-and-var-log-hadoop-yar

1条答案

按热度按时间

nwlls2ji1#

可能需要清除此文件夹-/var/log/hadoop/apps/hadoop/logs/
在hdfs上。尝试 hdfs dfs -ls /var/log/hadoop-yarn/apps/hadoop/logs 来查看它。
检查执行器上的-/mnt/var/log/hadoop/containers的另一个选项。
应该有另一个名为“application\u someid”的文件夹。这些文件夹包含已完成和正在运行的spark作业的日志。

赞(0）回复(0）举报 2021-05-27

我来回答

我如何知道在/mnt/yarn/usercache和/var/log/hadoop yarn/containers目录中删除哪些内容是安全的？

1条答案

相关问题

热门标签

最新问答