有人能给我解释一下Yarn上高性能flink作业的最佳配置和并行性吗?
我使用clouderahadoop和4个节点(1个主节点+3个工作节点),每个节点有12个cpu和96gb内存。
Yarn的性能很少
yarn.scheduler.maximum-allocation-mb-当前值为36gb
yarn.nodemanager.resource.memory-mb-当前值为36gb
我发现当我开始Yarn课程时,我应该 -tm
标记不超过36gb,否则我的应用程序将因错误而失败 The cluster does not have the requested resources for the TaskManagers available! Maximum Memory: <...> Requested: <...>MB . Please check the 'yarn.scheduler.maximum-allocation-mb' and the 'yarn.nodemanager.resource.memory-mb' configuration values
否则。
我想使用集群上所有可用的资源来提高flink作业的性能。所以我的问题是:
我是否应该将上述属性几乎设置为96 gb(即88 gb),并为每个工作节点使用一个taskmanager,其中有12个插槽(3个节点上有3个taskmanager,总共36个插槽)?在Yarn上使用大型任务管理器是常见的吗?
或者我应该设置 yarn.nodemanager.resource.memory-mb
至88 gb和 yarn.scheduler.maximum-allocation-mb
到8 gb,并在每个工作节点上使用多个TaskManager?例如,每个节点有6个TaskManager,每个节点有2个插槽(3个节点上有18个TaskManager,总共有36个插槽)?我已经读到不建议设置太高的值 yarn.scheduler.maximum-allocation-mb
.
是不是太难受了 -jm
flink会话的标志为4GB?对此有什么建议吗?
请解释一下,它对网络流量、垃圾收集、cpu和内存利用率等有何影响?我应该使用哪种配置来获得最佳性能?
谢谢你的帮助!
暂无答案!
目前还没有任何答案,快来回答吧!