如何将多个作业提交到hadoop集群

px9o7tmv 于 2021-05-30 发布在 Hadoop

关注(0)|答案(2)|浏览(330)

我有一个运行hadoop2.6的hadoop集群。我想同时提交多份工作。我想知道我是应该简单地提交多个作业并让集群处理其余的作业，还是应该将它们作为一个应用程序来编写。事实上，我不太熟悉yarn应用程序开发，也不知道它与常规hadoop应用程序有什么不同。

hadoop mapreduce yarn

来源：https://stackoverflow.com/questions/29681987/how-to-submit-multiple-jobs-to-a-hadoop-cluster

2条答案

按热度按时间

vsikbqxv1#

您可以使用mr1和yarn来运行mr jobs。 YARN has nothing to do with job parallelism. 它只是一个运行各种作业的框架。
使用oozie工作流或shell脚本并行运行作业。

赞(0）回复(0）举报 2021-05-30

edqdpe6u2#

您可以使用分叉的mapreduce作业定义oozie工作流。下面是apacheoozie文档中的示例。

<workflow-app name="sample-wf" xmlns="uri:oozie:workflow:0.1">
    ...
    <fork name="forking">
        <path start="firstparalleljob"/>
        <path start="secondparalleljob"/>
    </fork>
    <action name="firstparallejob">
        <map-reduce>
            <job-tracker>foo:9001</job-tracker>
            <name-node>bar:9000</name-node>
            <job-xml>job1.xml</job-xml>
        </map-reduce>
        <ok to="joining"/>
        <error to="kill"/>
    </action>
    <action name="secondparalleljob">
        <map-reduce>
            <job-tracker>foo:9001</job-tracker>
            <name-node>bar:9000</name-node>
            <job-xml>job2.xml</job-xml>
        </map-reduce>
        <ok to="joining"/>
        <error to="kill"/>
    </action>
    <join name="joining" to="nextaction"/>
    ...
</workflow-app>

赞(0）回复(0）举报 2021-05-30

我来回答

如何将多个作业提交到hadoop集群

2条答案

相关问题

热门标签

最新问答