如何减少spark作业中“未使用的vcore秒数”？

mftmpeh8 于 2021-07-12 发布在 Spark

关注(0)|答案(0)|浏览(182)

我正在运行sparkjob，其中运行的sparksql查询既复杂又冗长。
有些转换需要很长时间，因为作业要运行几个小时。
我试着用小文件来减少spark任务的数量，以避免vcore的浪费，但这并没有帮助我提高5%以上。
如果有人遇到同样的问题，请告知。

yarn python apache-spark performance

来源：https://stackoverflow.com/questions/66647450/how-to-reduce-unused-vcore-seconds-in-spark-job

暂无答案！

目前还没有任何答案，快来回答吧！

相关问题

微信公众号

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

Python pillow/PIL无法识别对象“imagedraw”的属性“textsize”
回答(3) 发布于 5个月前
python-3.x ImportError：无法从“typing_extensions”导入名称“deprecated”
回答(2) 发布于 5个月前
python-3.x 我正尝试使用密码学对字典进行加密
回答(1) 发布于 5个月前
在Python的IDLE中导入audiolazy的问题
回答(1) 发布于 5个月前
如何将Python程序中的数据添加到Markdown？
回答(2) 发布于 5个月前