我的一项微服务正在 Kubernetes 上运行。
我想在 Pod 繁忙时指定 K8s 负载均衡器,因为我当前得到的行为不正常。
一个例子:
我有 8 个 pod 正在运行,每个 pod 一次可以处理 1 个请求。每个请求占用分配给 Pod 的 CPU 核心的 70% 到 100%。
但是,当我向应用程序发送 8 个请求时,Kubernetes 不会将这些请求分派到 8 个 pod,而是尝试仅使用 1 个。由于我(通过线程池)阻止应用程序的每个副本一次仅使用一个线程,因此请求当然会排队等待 pod 1。
所以我的问题是:我如何告诉 Kubernetes POD 1 正忙并且负载均衡器必须将请求 2 分派到 POD 2 ?
Note:出于开发和测试目的,我在 Windows 10 和 kubectl 上使用 Docker Desktop(Docker for Windows)。
你必须使用活性探针
当 Pod 无法处理请求时,其 IP 将从服务端点中删除,因此不会将任何流量转发给它。
LivenessProbe 可以TCP or HTTP
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)