java—为什么向新(动态)示例发出的请求比向常驻示例发出的请求更多？

yhuiod9q 于 2021-07-09 发布在 Java

关注(0)|答案(2)|浏览(364)

有一个java应用程序，在应用程序引擎标准环境中自动伸缩。现在，缩放配置如下：

<instance-class>F2</instance-class>

<automatic-scaling>
    <min-idle-instances>1</min-idle-instances>

    <!-- ‘automatic’ is the default value. -->
    <max-idle-instances>2</max-idle-instances>

    <!-- ‘automatic’ is the default value. -->
    <min-pending-latency>2000ms</min-pending-latency>

    <max-pending-latency>8000ms</max-pending-latency>
    <max-concurrent-requests>60</max-concurrent-requests>
</automatic-scaling>

刚开始尝试 F2 示例，正在使用 F1 以前的示例。不管我如何配置我的自动伸缩，似乎新创建的示例（在负载增加时创建）开始获取所有传入的请求，而驻留示例的负载非常轻。
为什么会这样？当然，我无法实时监控流量（以及流量流向哪个示例），但每次我看到的情况似乎都是一样的。我在下面提供了一些示例屏幕截图。

在下面的例子中，有三个示例（这与上面的配置稍有不同）处于空闲状态，但是gae的负载均衡器选择将所有请求发送到延迟最高的示例！

还有一个示例：这是今天上午10:15:45开始的常驻示例的请求日志：

以及10秒后启动的动态示例的请求日志：

如您所见，动态示例正在处理所有的请求（到目前为止是1889个），而驻留示例基本上处于空闲状态（同一时间段中有7个）。如果不是因为驻留示例似乎在创建新的动态示例时被销毁和创建，这仍然是可以的。这意味着在一分钟左右的时间内，所有请求都会看到10-20秒的响应时间。
有人能告诉我怎么配置吗？
我想要的是：
一个空闲示例应该能够在大多数情况下（目前）处理负载。
当更多的请求进来时，启动一个额外的示例。准备好后，开始转移交通。
我试图运行一个合理的负载在一个小本经营的预算网站，所以这是很重要的，我试图保持尽可能接近免费配额。

更新1

因为这两个答案都突出地提到了热身请求，所以我想我应该在这里列出有关它的细节。我用的是 ServletContextListener 来处理初始化。它执行以下操作（使用Guava汁收集时间） Stopwatch 类和用于我已编写/正在显式调用的代码）：
注册对象化实体（1.449 s）
freemarker初始化229毫秒
firebase初始化228.2毫秒
除此之外，我还有shiro过滤器、objectify过滤器和jersey过滤器（在jersey中，我想通过显式注册类而不是给它一个包来扫描来避免类路径扫描） web.xml . 不使用任何依赖注入来避免类路径扫描。
这个 /_ah/warmup 请求时间为7.8秒（取上述时间的时间）。但是，一个刚启动的动态示例（其预热已经完成）所处理的请求需要10多秒才能完成，尽管这些调用需要200-700毫秒（两分钟后）。那么，除了我在我的生活中明确地做的事情之外，在后台还发生了什么呢 StartupListener ?
这是日志的第一部分，这是日志的第二部分。

Java autoscaling google-app-engine startup

来源：https://stackoverflow.com/questions/45103831/why-do-more-requests-go-to-new-dynamic-instances-than-to-resident-instance

2条答案

按热度按时间

zzwlnbp81#

似乎新创建的示例（在负载增加时创建）开始获取所有传入的请求，而驻留示例的负载非常轻。
我的心理模型是，驻留示例和预热请求只有在gae示例的引导时间很长时才有用(我不确定这是否是我的意图，但这是我观察到的行为）
也就是说，在启动新示例时，通信量被发送到驻留示例（而其他动态示例不能处理它）。一旦新示例启动并运行，流量就被路由到它，而不是常驻示例。
这意味着，如果示例启动时间较短，那么驻留示例将不会做太多工作。f2可以在大约250ms内启动（根据我的测试），因此如果您的平均响应延迟是2000ms，那么新的动态示例将在常驻示例完成处理请求之前完全启动。因此，它将准备好处理后续请求，而不是常驻请求。
这似乎符合你看到的行为模式。
您可以通过查看stackdriver和日志如何区分响应时间和引导时间来确认这一点。如果引导时间真的很短，那么驻留示例可能对您帮助不大。
但是gae的负载均衡器选择将所有请求发送到延迟最高的示例！
遗憾的是，关于gae如何决定向哪个示例发送新数据包的信息并不多。我所发现的就是如何管理示例和调度设置，这些设置更多地讨论了何时启动新示例或不启动新示例的参数。
我知道这不是你问的问题，但2000毫秒的响应时间可能是造成这个问题的原因？如果您的min pending latency设置为2000，那么在生成新示例之前，新请求将在队列中等待2000毫秒。但是如果它是以串行方式（线程安全关闭）进行服务的，那么在1500到2000之间的响应时间仍然可以正常服务。
我建议打开threadsafe，看看这是否对场景有帮助，还可以添加一些自定义跟踪，以防代码做了一些你看不到的奇怪的事情。

赞(0）回复(0）举报 2021-07-09

iyfamqjs2#

空闲示例的作用不是处理通常的流量，而是能够处理溢出—在新示例启动之前，已经运行的动态示例（如果有的话）无法处理的临时流量峰值。
从某种意义上说，这就是为什么他们被称为闲置-大多数时候，他们只是坐在闲置。在预算压力下，imho首先要做的事情之一就是丢弃空闲示例。
也可能相关：在googleappengine中，只有一个示例处理大多数请求
旁注：不是那样的 the GAE's load balancer chooses to send all requests to the instance with the highest latency! . 实际上，首选示例上的延迟是最高的，因为它是获得大部分流量的示例。
要防止gae在新示例准备好处理它们之前向它们发送流量，您需要配置（并正确处理）预热请求：
warmup请求是一种特定类型的加载请求，它在发出任何实时请求之前将应用程序代码提前加载到示例中。要了解有关如何使用预热请求的更多信息，请参阅预热请求。手动或基本缩放示例不会收到 /_ah/warmup 请求。
您可能还需要考虑一下这个答案：如何保持googleappengine示例的运行。基本上，通过cron作业防止动态示例长时间处于空闲状态，从而使它们无限期地运行。
至于在新的动态示例启动之后立即重新启动驻留示例，似乎有点奇怪。我不会太担心—它可能只是某种安全的刷新策略：此时对空闲示例的需求最低，因为新启动的动态示例最不可能被传入的请求淹没。

赞(0）回复(0）举报 2021-07-09

我来回答

java—为什么向新(动态)示例发出的请求比向常驻示例发出的请求更多？

更新1

2条答案

相关问题

热门标签

最新问答