GKE 集群未缩小规模

2023-12-23

我在 Google Kubernetes 集群上启用了自动缩放，并且我可以看到其中一个 Pod 的使用率要低得多

我总共有 6 个节点，我预计至少有这个节点被终止。我经历了以下事情：https://github.com/kubernetes/autoscaler/blob/master/cluster-autoscaler/FAQ.md#what-types-of-pods-can-prevent-ca-from-removing-a-node https://github.com/kubernetes/autoscaler/blob/master/cluster-autoscaler/FAQ.md#what-types-of-pods-can-prevent-ca-from-removing-a-node

我已将此注释添加到我的所有 pod 中

cluster-autoscaler.kubernetes.io/safe-to-evict: true

但是，集群自动缩放程序可以正确扩展，但不会像我预期的那样缩小。

我有以下日志

$ kubectl  logs kube-dns-autoscaler-76fcd5f658-mf85c -n kube-system

autoscaler/pkg/autoscaler/k8sclient/k8sclient.go:90: Failed to list *v1.Node: Get https://10.55.240.1:443/api/v1/nodes?resourceVersion=0: dial tcp 10.55.240.1:443: getsockopt: connection refused
E0628 20:34:36.187949       1 reflector.go:190] github.com/kubernetes-incubator/cluster-proportional-autoscaler/pkg/autoscaler/k8sclient/k8sclient.go:90: Failed to list *v1.Node: Get https://10.55.240.1:443/api/v1/nodes?resourceVersion=0: dial tcp 10.55.240.1:443: getsockopt: connection refused
E0628 20:34:47.191061       1 reflector.go:190] github.com/kubernetes-incubator/cluster-proportional-autoscaler/pkg/autoscaler/k8sclient/k8sclient.go:90: Failed to list *v1.Node: Get https://10.55.240.1:443/api/v1/nodes?resourceVersion=0: net/http: TLS handshake timeout
I0628 20:35:10.248636       1 autoscaler_server.go:133] ConfigMap not found: Get https://10.55.240.1:443/api/v1/namespaces/kube-system/configmaps/kube-dns-autoscaler: net/http: TLS handshake timeout, will create one with default params
E0628 20:35:17.356197       1 autoscaler_server.go:95] Error syncing configMap with apiserver: configmaps "kube-dns-autoscaler" already exists
E0628 20:35:18.191979       1 reflector.go:190] github.com/kubernetes-incubator/cluster-proportional-autoscaler/pkg/autoscaler/k8sclient/k8sclient.go:90: Failed to list *v1.Node: Get https://10.55.240.1:443/api/v1/nodes?resourceVersion=0: dial tcp 10.55.240.1:443: i/o timeout

我不确定以上是否是相关日志，调试此问题的正确方法是什么？

我的 Pod 有本地存储。我一直在尝试使用来调试这个问题

kubectl drain  gke-mynode-d57ded4e-k8tt

error: DaemonSet-managed pods (use --ignore-daemonsets to ignore): fluentd-gcp-v3.1.1-qzdzs, prometheus-to-sd-snqtn; pods with local storage (use --delete-local-data to override): mydocs-585879b4d5-g9flr, istio-ingressgateway-9b889644-v8bgq, mydocs-585879b4d5-7lmzk

我认为忽略是安全的daemonsets因为 CA 应该可以驱逐它，但是我不确定如何让 CA 理解 mydocs 可以被驱逐并在添加注释后移动到另一个节点

EDIT

The min and the max nodes have been set correctly as seen on the GCP console

The kubectl logs命令适用于 DNS 自动缩放程序，而不是集群自动缩放程序。它将为您提供有关集群中 kube-dns 副本数量的信息，而不是节点数量或扩展决策的信息。

来自集群自动缩放器常见问题解答 https://github.com/kubernetes/autoscaler/blob/master/cluster-autoscaler/FAQ.md#what-types-of-pods-can-prevent-ca-from-removing-a-node（并考虑到您在问题中所写的内容）：

Kube 系统 pod：

默认情况下不在节点上运行

具有本地存储的 Pod

另外，限制性Pod Disruption Budgets。但是，由于问题中没有说明，我假设您没有设置任何内容。

尽管您有带有本地存储的 Pod，但您添加了注释以使它们可以安全地逐出，这样系统 Pod 默认情况下不会在节点中运行。

由于 GKE 中的系统 Pod 带有注释协调循环 https://github.com/kubernetes/kubernetes/tree/master/cluster/addons/addon-manager，您不能向它们添加此指令，这可能会阻止它们被驱逐。

在这种情况下，您可以考虑使用Pod Disruption Budget配置为允许自动缩放程序驱逐它们 https://github.com/kubernetes/autoscaler/blob/master/cluster-autoscaler/FAQ.md#how-can-i-scale-my-cluster-to-just-1-node.

This Pod Disruption Budget https://github.com/kubernetes/autoscaler/blob/master/cluster-autoscaler/FAQ.md#how-to-set-pdbs-to-enable-ca-to-move-kube-system-pods可以包含默认情况下不在节点中运行的 DNS 和日志记录 Pod。

不幸的是，GKE 是一个托管选项，因此自动缩放器常见问题解答中没有太多可应用的内容。不过，如果你想更进一步，你不妨考虑一下Pod 装箱策略 https://en.wikipedia.org/wiki/Bin_packing_problem using 亲和力与反亲和力 https://kubernetes.io/docs/concepts/configuration/assign-pod-node/#affinity-and-anti-affinity, 污染和容忍 https://kubernetes.io/docs/concepts/configuration/taint-and-toleration/ and 要求和限制 https://cloud.google.com/blog/products/gcp/kubernetes-best-practices-resource-requests-and-limits正确安装它们，尽可能使缩小尺寸变得更容易。

最后，在 GKE 上您可以使用cluster-autoscaler-status配置映射表 https://github.com/kubernetes/autoscaler/blob/master/cluster-autoscaler/FAQ.md#how-can-i-check-what-is-going-on-in-ca-检查自动缩放器正在做出哪些决定。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

GKE 集群未缩小规模的相关文章

Kubernetes 1.8 支持的 Docker 版本

我要将我的 Kubernetes 集群升级到该版本1 8 7 有谁知道哪个 docker 版本与其最兼容这是我在 Kubernetes 官方页面上找到的但我想它可能是针对最新的 k8s 版本的 1 9 在每台计算机上安装 Docker
kubernetes 集群中 django 应用程序的 Nginx 配置

我在为部署在 kubernetes 中的 django 应用程序创建 nginx 配置文件时遇到困难 Nginx 和 app 是同一集群中的两个独立容器据我了解容器可以通过 127 0 0 1 XX 和主机名相互通信我为此使用 min
kubernetes nginx ingress 无法将 HTTP 重定向到 HTTPS

我有一个托管在 Google Cloud 平台中的网络应用程序该应用程序位于负载均衡器后面而负载均衡器本身位于入口后面入口设置了 SSL 证书并按预期接受 HTTPS 连接但有一个问题我无法让它将非 HTTPS 连接重定向到 H
Kubernetes Pod 中现在几点了？

假设我有一些 NET Core 代码在 k8s pod 中运行我要求 DateTime Now 我假设我将从运行 pod 的主机获取日期时间有没有办法获得在 k8s 集群中一致的日期时间值容器中的时钟与主机相同因为它由内核控制时区
Kubernetes coredns pod 陷入待处理状态。无法启动仪表板[关闭]

Closed 这个问题是与编程或软件开发无关 help closed questions 目前不接受答案我正在按照此构建 Kubernetes 集群tutorial https www profiq com kubernetes clus
如何使用 Prometheus Alert Manager 在 Kubernetes 中触发警报

我在集群中设置了 kube prometheus https github com coreos prometheus operator tree master contrib kube prometheus https github co
除了 80 / 443 之外，我还可以为 Kubernetes 入口设置自定义端口来侦听吗？

我并不是说能够路由到特定端口我的意思是实际更改入口侦听的端口这可能吗如何这是在哪里记录的不从Kubernetes 文档 https kubernetes io docs concepts services networking
Podman：如何解析使用 Kubernetes YAML 部署的 pod 的主机名

我正在使用 podman 4 5 dev 我使用以下方式部署了两个 Pod podman kube 播放 foo yaml podman kube play bar yaml 我在文件中指定了 pod 的主机名但它们不会在容器内得到解析
Spring Cloud Kubernetes + Spring Cloud Gateway：无法找到 k8s 服务的实例

我正在使用 Spring Cloud Kubernetes Spring Cloud Gateway SCG 但在 GKE 上部署应用程序时遇到一些问题 SCG 找不到 k8s 服务我仍然收到此错误 There was an unexpe
有没有办法用Lettuce自动发现Redis集群中新的集群节点IP

我有一个Redis集群 3主3从运行在一个库伯内斯簇该集群通过Kubernetes 服务 Kube 服务我将我的应用程序服务器连接到 Redis 集群使用Kube 服务作为 URI 通过 Redis 的 Lettuce java 客
如何将 configmap 附加到 Kubernetes 中的部署？

根据此处找到的说明 https kubernetes io docs tasks access application cluster connecting frontend backend https kubernetes io docs
无法使用 minikube 设置 Istio

我按照 Istio 的官方文档为带有 minikube 的示例 bookinfo 应用程序设置了 Istio 但我得到了无法连接到服务器 net http TLS 握手超时错误这些是我遵循的步骤我安装了 kubectl 和 miniku
自动递增 EC2 实例名称

我在 Stackoverflow 上看到很多问题询问是否有办法自动递增实例名称例如 foo1 foo2 fooN 我想看看是否有办法在 Powershell 中执行此操作我正在使用 AutoLaunchConfiguration AS
如何为某些节点分配命名空间？

有什么办法可以配置吗nodeSelector在命名空间级别我只想在此命名空间的某些节点上运行工作负载为了达到这个目的你可以使用PodNodeSelector准入控制器首先您需要在您的kubernetes apiserver Edi
Kubernetes 通过基于时间的触发器扩展 Pod

我有一台在 Kubernetes 上运行的服务器来处理每小时的处理作业考虑使用服务来公开 pod 并使用外部 cron 作业来访问负载均衡器以便 kubernetes 可以根据需要自动缩放以处理更高的负载然而在实现中如果 cron
如何使用 kubectl 了解有关先前发布版本的更多详细信息？

有给出的命令here https kubernetes io docs reference kubectl cheatsheet updating resources其中解释了如何使用执行回滚kubectl 列出以前的部署版本的是 kube
多个值文件中包含多个列表的 Helm 图表

我有一个包含以下内容的values yaml abc env name name01 value value01 name name02 value value02 我有另一个值文件values dev yaml 我在使用 f安装时添加它
阻止 ingress-nginx 负载均衡器上的特定路径

我有许多指向入口控制器 IP 的域我想阻止所有域站点的特定路径有没有办法做到这一点我可以用nginx ingress kubernetes io configuration snippet 对于每个站点但正在寻找同时处理所有站点
如何从容器内运行 podman？

我想跑podman https podman io作为运行 CI CD 管道的容器但是我不断从 podman 容器中收到此错误 podman info ERRO 0000 overlay is not supported over ov
如何限制对 Kubernetes 服务的访问？

我正在尝试使用以下 yaml 创建服务正如您所看到的我正在尝试限制 10 0 0 0 8 范围内对该服务的访问 apiVersion v1 kind Service metadata name nginx service spec po

随机推荐

如何在Play框架单元测试中加载不同的插件？

我有不同的插件实现了Plugin界面现在我将它们硬编码在 play plugins 中如下所示 100 test A 200 test B 然而在我的单元测试中我不希望同时加载它们换句话说在测试 A 中我只想加载插件 A 在测试
如何并行运行函数？

我正在尝试在 Python 中并行运行多个函数我有这样的事情 files py import common common is a util class that handles all the IO stuff dir1 C folde
为什么我的网页中不断出现小空间？

这可能是一个愚蠢的问题但如果有更好或正确的方法来做到这一点我很乐意学习我已经遇到过几次这种情况包括最近我的 HTML 页面的渲染版本中出现了小空格直觉上我认为这些不应该存在因为在文本或实体之外页面 HTML 的格式不应该重要
在 Windows Phone 8 中使用 Google 地图

可以在 Windows Phone 8 中使用 Google 地图吗这个问题可能看起来很奇怪因为互联网上有很多关于这个问题的帖子但在实践中我遇到了现实的问题我知道使用 Google 地图使用 MapTileLayer TileS
如何在 r 中传播或转换多个值[重复]

这个问题在这里已经有答案了这是此示例的玩具数据集 data lt data frame x rep c red blue green each 4 y rep letters 1 4 3 value 1 1 12 value 2 13 2
Javascript：为什么对数组使用 for 循环而不是 for-in 循环？

我一直在阅读 Stoyan Stefanov 的面向对象的 Javascript 有一次他写道 The for in循环用于迭代数组或对象我们稍后会看到的元素这是它唯一的用途它不能用作替代的通用重复机制for or while
Magento Catalog ProductController 重写

我尝试使用模块覆盖 magento Mage Catalog controllers ProductController php 在我的模块中我尝试这样做 etc config xml
如何使用超时取消 TaskCompletionSource

我有使用 wait 关键字异步调用的函数 public Task
通过命令行设置 macOS 壁纸文件夹

macOS 允许用户通过旋转文件夹中的图像来自动更改桌面背景如 Apple 支持中所述 https support apple com kb PH25258 我使用该功能每 30 分钟轮换一次 iCloud 中的壁纸文件夹我尝试设置一
正则表达式 - 如何在匹配中查找匹配？

我一直在尝试使用 VB 正则表达式对象执行以下操作但找不到简单的方法来执行此操作有没有人可以提供一些建议例如我有一个字符串 1289 我想获取内的字符串在这种情况下应该是 56 我目前正在做的是尝试找到将返回的表达式然后我尝
如何将 0 索引处的项目插入到 Realm 容器中

有没有办法在 0 索引处插入新项目Realm容器我在中没有看到插入方法Realm class 我需要使用吗List是如果答案是肯定的我如何重构以下代码才能使用Lists 并保持列表与Realm容器换句话说我很难想出一个好方法来保持
如何使用 C# 执行 .SQL 脚本文件

我确信这个问题已经得到解答但是我无法使用搜索工具找到答案使用 C 我想运行一个 sql 文件 sql 文件包含多个 sql 语句其中一些语句分为多行我尝试读取该文件并尝试使用 ODP NET 执行该文件但是我认为 ExecuteN
在 org.apache.maven.plugins.shade.resource.ServicesResourceTransformer 类中找不到“manifestEntries”

我正在尝试创建一个 FAT jar 并组合 vertx config 和 vert config yaml JAR 文件中 META INF services io vertx config spi ConfigProcessor 中的条目
创建 Hibernate SessionFactory 时如何设置数据源？

我正在创建 SessionFactory 并且我将数据源作为我正在创建 SessionFactory 的代码中的对象但我无法将数据源设置为 Hibernate Configuration 对象那么如何将数据源设置为 SessionFac
ASP.NET core 2.2 Web api 记录与数据保护密钥相关的警告：我们应该如何处理这个问题？

我们有一个 ASP NET core 2 2 Web 应用程序公开了一些 Web API 控制器我们的应用程序没有任何类型的身份验证机制所有公开的端点都可以由匿名用户调用当我们在 IIS 下托管应用程序时我们在应用程序启动时收到三
在 Web 应用程序开发环境中进行更新时要复制到生产服务器的内容

我有一个在 Asp net Framework 3 5 Net 2008 中构建的 Web 应用程序我使用 Web 部署项目 WDP 来编译它我想知道例如如果我对代码隐藏文件 aspx vb 进行了一些更改我需要将哪些文件上传到生
ArrayList 是否替换给定索引处存在的元素？

如果给定索引处存在于 ArrayList 中如何替换元素 arrayList set index i String replaceElement
通常只允许每个套接字地址（协议/网络地址/端口）使用一次

我正在连接到 Asp Net 中的 TCP IP 端口基本上我已经在我正在读取的该端口上附加了一个设备它工作正常但第二次当 tcp 侦听器尝试启动时它会生成上述错误任何人都可以指导我如何摆脱这个错误这是我用来连接到 TCP IP
PHP #region 用于代码折叠？

PHP 中是否有相当于 c 的 region 的功能不语言中没有直接的内容但每一个像样的编辑器都允许某种标记来实现这一点例如在 Netbeans 中
GKE 集群未缩小规模

我在 Google Kubernetes 集群上启用了自动缩放并且我可以看到其中一个 Pod 的使用率要低得多我总共有 6 个节点我预计至少有这个节点被终止我经历了以下事情 https github com kubernetes a

GKE 集群未缩小规模

EDIT

GKE 集群未缩小规模 的相关文章

随机推荐

热门标签

GKE 集群未缩小规模的相关文章