我在aws上运行了一个emr集群。我看了一下Yarn,我发现我的4个工人有这种“不健康的状态”是由于
1/2 local-dirs are bad: /mnt/yarn; 1/1 log-dirs are bad: /var/log/hadoop-yarn/containers
所以,我ssh到worker节点->run df
确实如此 /mnt/yarn
是在99%的磁盘空间使用。还有,很多 stderror
以及 stdout
文件占用了很多空间 /var/log/hadoop-yarn/containers
目录。我的问题是:哪些可以安全删除,哪些不能?我觉得自己就像掉进了一个兔子洞,读了几个小时后,仍然不知道如何在我的工作节点中释放磁盘空间。我一直在读关于 /mnt/yarn/usercache
目录,并且该目录中的内容似乎是用于运行spark应用程序的“本地资源”。但是 /mnt/yarn/usercache/hadoop/filecache
以及 /mnt/yarn/usercache/hadoop/appcache
在中分别占用3%和96%的磁盘空间 /mnt/yarn
1条答案
按热度按时间nwlls2ji1#
可能需要清除此文件夹-/var/log/hadoop/apps/hadoop/logs/
在hdfs上。尝试
hdfs dfs -ls /var/log/hadoop-yarn/apps/hadoop/logs
来查看它。检查执行器上的-/mnt/var/log/hadoop/containers的另一个选项。
应该有另一个名为“application\u someid”的文件夹。这些文件夹包含已完成和正在运行的spark作业的日志。