在边缘节点中运行hadoop jar命令

lkaoscv7  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(319)

我是hadoop新手,对于从edgenode运行hadoopjar命令有以下问题(http://www.dummies.com/programming/big-data/hadoop/edge-nodes-in-hadoop-clusters/). hadoop jar ${JAR_FILE} {CLASS_NAMEWithPackage} . 有以下问题
在运行上述命令之后,为什么在edgenode的djava.io.tmpdir dir中提取jar?每次运行这个命令,我都会在temp dir中得到一个类似hadoop-unjar7637059002474165348的目录,它已经提取了jar。这是预期的吗?我以为hadoopjar会将整个jar提交给yarn,但我不明白为什么它会被提取到temp文件夹中?
在边缘节点中提取jar之后,程序是否希望删除提取的jar目录。在本例中是hadoop-unjar7637059002474165348?
谢谢!

13z8s7eq

13z8s7eq1#

您可能可以看看这里和这个问题,了解在运行hadoopjar命令时为什么在边缘节点(客户机节点)中提取jar。它是为了在从客户机节点运行jar时支持“jarwithin jar”的思想。把jar推到hdfs,yarn和所有这些之后发生的事情,但是,在这些发生之前,你的jar必须首先被执行,对吗?在您的例子中,jar中可能有jar,也可能没有,但是这个概念是受支持的。
关于自动删除,可能不是自动删除。

相关问题