spark错误-退出状态:143诊断:按请求杀死容器

b4lqfgs4  于 2021-05-19  发布在  Spark
关注(0)|答案(1)|浏览(716)

我得到以下错误:
原因:org.apache.spark.sparkexception:由于阶段失败而中止作业:阶段7.0中的任务653失败了4次,最近的失败:阶段7.0中的任务653.3丢失(tid 27294,ip-10-0-57-16.ec2.internal,executor 34):executorlostfailure(executor 34因某个正在运行的任务而退出)原因:标记为失败的容器:主机ip-10-0-57-16.ec2.internal上的容器\u 1602898457220 \u 0001 \u 01 \u 000370。退出状态:143。诊断:应请求杀死容器。出口代码是143集装箱出口,非零出口代码143被外部信号杀死
我的数据集是80gb,我做的操作是创建一些正方形的交互功能,所以列的数量可能会增加一倍。
我使用的是20 m4.16xlarge(64cpu,256gb,https://aws.amazon.com/ec2/instance-types/)示例spark.yarn.executor.memoryoverhead='16384'
我能做点什么来解决这个问题吗?为什么我得到oom错误,甚至我的数据集比我的示例数小。

eni9jsuy

eni9jsuy1#

我增加了以下两个参数并避免了错误:
spark.default.parallelism='128'spark.executor.cores='16'

相关问题