请详细解释Flink的Yarn

pepwfjgg 于 2021-06-24 发布在 Flink

关注(0)|答案(0)|浏览(145)

有人能给我解释一下Yarn上高性能flink作业的最佳配置和并行性吗？
我使用clouderahadoop和4个节点（1个主节点+3个工作节点），每个节点有12个cpu和96gb内存。
Yarn的性能很少
yarn.scheduler.maximum-allocation-mb-当前值为36gb
yarn.nodemanager.resource.memory-mb-当前值为36gb
我发现当我开始Yarn课程时，我应该 -tm 标记不超过36gb，否则我的应用程序将因错误而失败 The cluster does not have the requested resources for the TaskManagers available! Maximum Memory: <...> Requested: <...>MB . Please check the 'yarn.scheduler.maximum-allocation-mb' and the 'yarn.nodemanager.resource.memory-mb' configuration values 否则。
我想使用集群上所有可用的资源来提高flink作业的性能。所以我的问题是：
我是否应该将上述属性几乎设置为96 gb（即88 gb），并为每个工作节点使用一个taskmanager，其中有12个插槽（3个节点上有3个taskmanager，总共36个插槽）？在Yarn上使用大型任务管理器是常见的吗？
或者我应该设置 yarn.nodemanager.resource.memory-mb 至88 gb和 yarn.scheduler.maximum-allocation-mb 到8 gb，并在每个工作节点上使用多个TaskManager？例如，每个节点有6个TaskManager，每个节点有2个插槽（3个节点上有18个TaskManager，总共有36个插槽）？我已经读到不建议设置太高的值 yarn.scheduler.maximum-allocation-mb .
是不是太难受了 -jm flink会话的标志为4GB？对此有什么建议吗？
请解释一下，它对网络流量、垃圾收集、cpu和内存利用率等有何影响？我应该使用哪种配置来获得最佳性能？
谢谢你的帮助！