我的场景:我有一个spark submit,它通过shell脚本运行,这个spark作业将把7个表从oracle拉到hive。我还有一个脚本,它将根据从oracle导入的数据生成.dat文件。我的问题是:在oozie中,如果第一个作业成功,那么只有第二个作业应该运行。如果你对这个问题有任何疑问,请询问。提前谢谢
monwx1rj1#
你可以在oozie中建立依赖关系。请在下面找到伪代码:
<workflow-app xmlns="uri:oozie:workflow:0.5" name="MYsimpleWF"> <global> ... </global> <action name=" ShellAction "> <shell> ... <exec>${EXEC}</exec> <argument>A</argument> <argument>B</argument> <file>${EXEC}#${EXEC}</file> </shell> <ok to="SecondJOB"/> <error to="fail"/> </action> <action name="SecondJOB"> <shell xmlns="uri:oozie:shell-action:0.2"> ... </shell> <ok to="success"/> <error to="fail"/> </action> <end name="done"/> </workflow-app>
1条答案
按热度按时间monwx1rj1#
你可以在oozie中建立依赖关系。请在下面找到伪代码: