Kubernetes HPA - 延长冷却时间

2024-01-19

我正在运行一个带有 HPA 的 Kubernetes 集群 v1.16（目前 GKE 上的最新版本），它根据自定义指标（特别是从谷歌云监控获取的rabbitmq消息计数）扩展部署。

问题

当消息计数暂时较高时，部署会非常快地扩展到最大 Pod 计数。

信息

HPA --horizontal-pod-autoscaler-sync-period 在 GKE 上设置为 15 秒，据我所知无法更改。

我的自定义指标每 30 秒更新一次。

我认为导致这种行为的原因是，当队列中每 15 秒就有大量消息计数时，HPA 会触发扩展，并在几个周期后达到最大 pod 容量。

在 kubernetes api v1.18 中，您可以控制扩展稳定时间，但我在 v1.16 中找不到类似的功能。

我的问题

如何让 HPA 逐步扩大规模？

Edit 1

我的一项部署的 HPA 示例：

apiVersion: autoscaling/v2beta1
kind: HorizontalPodAutoscaler
metadata:
  name: my-deployment-hpa
  namespace: production
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: my-deployment
  minReplicas: 6
  maxReplicas: 100
  metrics:
  - type: External
    external:
      metricName: "custom.googleapis.com|rabbit_mq|v1-compare|messages_count"
      metricSelector:
        matchLabels:
          metric.labels.name: production
      targetValue: 500

首先，需要了解的一个好信息是，Kubernetes 中有一个针对自动缩放器的内置冷却时间。引用《Kubernetes 实践》：

目前，只有在过去三分钟内没有发生重新扩展事件时才会进行扩展。缩减事件的执行频率甚至更低——每五分钟一次。请记住这一点，这样您就不会想知道为什么自动缩放器拒绝执行重新缩放操作，即使指标明确表明它应该执行。

此声明可能已过时，但除非它发生更改，否则这是硬编码的，并且每个扩展/缩减事件的扩展不应超过现有 pod 的 100%。

也就是说，无论哪种方式，您都不是没有选择，您可以采取以下一些方法：

通过时间平均函数传递用于扩展的自定义指标- 上次我这样做是使用 prometheus 和 promql 可能与您使用的不同，但如果您在问题中分享更多配置，我相信我可以帮助找到语法。
您可以尝试使用Keda https://keda.sh/docs/2.0/scalers/rabbitmq-queue/- 它有一个cooldownPeriod您可以将其放置在ScaledObject它附带的自定义资源。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Kubernetes

googlekubernetesengine

HPA

Kubernetes HPA - 延长冷却时间的相关文章

解析 dockerfile 路径时出错：请使用 --dockerfile 在构建上下文中提供 Dockerfile 的有效路径

apiVersion v1 kind Pod metadata name kaniko spec containers name kaniko image gcr io kaniko project executor latest args
Jenkinsfile 泊坞窗

我正在 docker 容器内的 GCE 上运行一个 jenkins 实例并希望从此 Jenkinsfile 和 Github 执行多分支管道我正在使用GCE詹金斯 https cloud google com solutions con
如何在 microk8s 中使用本地 docker 镜像？

我一直在使用 minikube 在本地测试 Kubernetes 在 minikube 中我们可以使用本地 docker 镜像eval minikube docker env 命令我开始探索microk8s 在我运行 Ubuntu 18
Grafana/prometheus 中没有 kafka 指标

我成功部署了 Helm Chart普罗米修斯操作员 https github com coreos prometheus operator tree master helm prometheus operator kube 普罗米修斯 ht
从 App Engine 连接到 Kubernetes 引擎

我们希望使用应用程序引擎灵活的流程来更新位于 Google Kubernetes Engine 上的 ElasticSearch 索引我们需要通过 http s 地址连接到 ElasticSearch 推荐的方法是什么我们不想将集群暴露
Istio 允许所有出口流量

如何允许 Istio 的所有出站流量我尝试了以下方法禁用出口网关并使用 set global proxy includeIPRanges 0 0 0 0 0 0 0 0 0 0 绕过 sidecar 所有选项都不起作用值得一提的是我
Kubernetes 集群自动缩放器似乎不适用于 GKE？

我定义了一个节点池最小实例设置为 1 最大实例设置为 5 并启用了自动缩放但它似乎并没有缩小规模我已经封锁了一个节点已经过去12个多小时了没有待处理的 Pod 删除节点不会减少我自己的部署的副本数量相关节点上运行以下 pod f
Spring OAuth2 Keycloak Kubernetes 内部/外部访问

我在 Kubernetes 集群内配置了 Keycloak 10 0 3 服务器 keycloak 服务器必须处理外部用户的身份验证使用外部 url 并处理用于 Spring 微服务通信的 oauth2 令牌然后Web应用程序Sprin
Spring Cloud Kubernetes + Spring Cloud Gateway：无法找到 k8s 服务的实例

我正在使用 Spring Cloud Kubernetes Spring Cloud Gateway SCG 但在 GKE 上部署应用程序时遇到一些问题 SCG 找不到 k8s 服务我仍然收到此错误 There was an unexpe
有没有办法用Lettuce自动发现Redis集群中新的集群节点IP

我有一个Redis集群 3主3从运行在一个库伯内斯簇该集群通过Kubernetes 服务 Kube 服务我将我的应用程序服务器连接到 Redis 集群使用Kube 服务作为 URI 通过 Redis 的 Lettuce java 客
GKE 出现错误：ImagePullBackOff 和错误：ErrImagePull 错误

当 kubectl 应用 yaml 将自定义构建的 docker 映像部署到 GCP 中的集群编辑掉敏感信息时我收到以下错误已尝试以下但没有运气手动部署镜像检查以确保防火墙规则允许 443 并且没有任何东西阻止它尝试将容器注册
无法使用 minikube 设置 Istio

我按照 Istio 的官方文档为带有 minikube 的示例 bookinfo 应用程序设置了 Istio 但我得到了无法连接到服务器 net http TLS 握手超时错误这些是我遵循的步骤我安装了 kubectl 和 miniku
让我们加密证书颁发

我正在尝试获取 Let s Encrypt 颁发的证书已经过去了 3 个半小时我不小心最初将我的 SecretName 设置为 echo tls 然后将其切换到我想使用的正确的 pandaist tls 我目前有这个 kubectl g
如何允许 Kubernetes 作业访问主机上的文件

我已经彻底阅读了 Kubernetes 文档但在与主机文件系统上的文件与 K8 作业启动的 pod 内运行的应用程序进行交互时仍然遇到问题即使是最简单的实用程序也会发生这种情况因此我提供了 yaml 配置的精简示例此处引用的本地文件
K8s服务无法ping通

我在 minikube 集群中有一个 k8s 服务部署名称amq in default命名空间 D20181472 argo k8s gms kubectl get svc all namespaces NAMESPACE NAME T
Rabbit mq - 等待 Mnesia 表时出错

我已经在 Kubernetes 集群上使用 Helm Chart 安装了 RabbitMQ rabbitmq pod不断重新启动在检查 pod 日志时我收到以下错误 2020 02 26 04 42 31 582 warning lt
如何解决 https://kubernetes-charts.storage.googleapis.com”不是有效的图表存储库

我正在开发 helm 2 并尝试将 Tiller 部署为 pod gt helm init service account tiller 但我遇到以下错误错误初始化错误看起来像 https kubernetes charts stor
如何将我的 pod 日志存储在持久存储中？

我已经使用以下命令为我的 Pod 生成了日志kubectl logs pod name 但我想将这些日志保存在一个卷某种持久存储中因为如果 Pod 宕机容器日志将被清除有没有办法做到这一点我必须写某种脚本吗我已经阅读了很多答案
Kubernetes 中可以连接两个集群 IP 服务吗？

情况是我想连接一个租户内的两个集群IP服务该租户已经将Traefik作为NodePort 以便这两个服务中的任何一个都可以成为LoadBalancer 因为NodePort由Traefik使用我尝试连接的两个服务的工作方式如下第一个服
如何通过命令和api删除节点标签？

为节点添加标签 kubectl label nodes 10 xx xx xx key1 val1 如果我想删除label key1 val1 在节点 10 xx xx xx 上如何通过 kubectl 命令和 API 删除为节点创建标

随机推荐

将参数设置为 IN 表达式的列表

每当我尝试将列表设置为参数以在 IN 表达式中使用时我都会收到非法参数异常互联网上的各种帖子似乎表明这是可能的但这对我来说肯定不起作用我正在使用 Glassfish V2 1 和 Toplink 有其他人能够让它发挥作用吗如果可以
JavaScript Promise 在未被拒绝或解决时是否会造成内存泄漏？

我所处的情况是我需要并行执行异步函数并继续以最佳结果执行程序因此我写了这样的东西 var p for var i 0 i lt 10 i function index p push new Promise function res
如何获取 DLL 内的函数列表（托管和非托管）？

所以我玩了一个DLL UnityEditor dll 我想获得这个托管DLL中所有非托管函数的列表 dll可能由本机C 如果使用静态编译的库核心和托管组成C 包装器全部包装到一个 dll 中我想获取该 Dll 内所有非托管函数的列表例
标签点击事件

我也尝试为一组动态创建的标签创建一个单击事件如下所示 private void AddLBL Btn Click object sender EventArgs e int ListCount listBox1 Items Count i
对 ImageView 进行着色在 Android 5.0 上不起作用。想法如何让它再次发挥作用？

在我构建的应用程序中我注意到运行新 Android Lollipop 的设备上的 ImageView 没有着色这是曾经在旧版本操作系统上正常工作的代码
如何在 CLion 中创建、编译和运行单个文件

我正在研究一些c 我讨厌必须创建一个全新的项目才能在文件上运行一些东西我也不喜欢在创建项目时如何调用文件main cpp 我只想制作一个包含一些函数或类的单个文件创建整个项目还不够重要我想创建一个文件并按我想要的名称命名只需创建一个
将字符串 ISO-8601 日期转换为 Oracle 的时间戳数据类型

我有一个 VARCHAR2 类型的 ISO 8601 日期如何将该字符串日期转换为 Oracle 数据库中的时间戳日期示例 2014 09 12T11 53 06 00 00 也许类似于以下内容但我不确定格式是什么 SELECT to
emacs 自动完成功能不适用于 jde

我想在emacs中开发java 我安装了 ecb jde 和自动完成扩展每个都可以很好地工作无需启动其他但是当我想一起使用它们时出现了一些问题 auto complete mode 不会自动启动 jde 我需要通过 M x auto
将自定义区域与 JQVmap 结合使用

我正在使用 JQVmap https github com manifestinteractive jqvmap https github com manifestinteractive jqvmap 以输出站点上的地图我不想将鼠标悬停在
首先部署实体框架代码

我想我应该在开始项目之前就考虑到这一点但我已经使用代码优先方法成功构建并测试了一个迷你应用程序并且我准备将其部署到生产 Web 服务器我已将该文件夹移动到我的临时服务器一切正常我只是好奇是否有建议的部署策略如果我对应用程序进行更
Swift 4 保存应用程序中参考的背景颜色

我希望你成为应用程序中选定的背景颜色我做到了背景颜色已更改但未保存 IBAction func ButtonColor sender UIButton let colorTag sender tag if colorTag 1 self
SignalR：检测客户端的连接状态

我已经了解了如何通过绑定到 disconnect 事件使用 SignalR 在客户端捕获断开连接事件现在我已经完成了此操作我希望将客户端置于等待重新连接周期在该周期中它会不断尝试连接直到成功或用户取消集线器是否公开连接状态属性
"' aria-label='Laravel '无法解析的依赖关系解析 [参数 #0 [ "'> Laravel '无法解析的依赖关系解析 [参数 #0 [ "

Laravel 上的错误获取空白页 Laravel 版本 5 1 16 错误记录并显示以下消息 2015 09 28 09 37 48 local CRITICAL 异常带有消息的 Symfony Component Debug Exc
在javascript中生成符合要求的随机密码字符串

我想生成一个随机字符串该字符串必须包含 a z 中的 5 个字母和 3 个数字我怎样才能用 JavaScript 做到这一点我有以下脚本但它不符合我的要求 var chars 0123456789ABCDEFGHIJKLMNOPQR
将 Quill 文本编辑器集成到 Angular 应用程序中

我正在学习如何创建博客网站我首先尝试了一个简单的例子但文本编辑器没有显示在我的屏幕上我安装了 Quillnpm install save email protected cdn cgi l email protection ngx q
Android Compose 中的全屏对话框不占用全屏高度

Dialog properties DialogProperties usePlatformDefaultWidth false onDismissRequest viewModel showDialog value false Colum
如何通过android自定义键盘操作按钮执行搜索操作？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在开发一个 Android 自定义键盘我需要执行搜索操作根据用户选择的文本字段将光标移动到下一个文本字段操作如何执行这些动作
如何使用休眠读取地理值？

在我的 spring boot 应用程序中我尝试使用 spring data 和 hibernate jpa 来存储空间数据最小复制示例的完整源代码可在github https github com slartidan sqlserve
C# Mersenne Twister 随机整数生成器实现（SFMT）蒙特卡罗模拟

到目前为止我一直在使用C 梅森扭转者 http en wikipedia org wiki Mersenne twister在这里找到生成随机数 http www centerspace net resources php http www
Kubernetes HPA - 延长冷却时间

我正在运行一个带有 HPA 的 Kubernetes 集群 v1 16 目前 GKE 上的最新版本它根据自定义指标特别是从谷歌云监控获取的rabbitmq消息计数扩展部署问题当消息计数暂时较高时部署会非常快地扩展到最大 Pod

Kubernetes HPA - 延长冷却时间

Kubernetes HPA - 延长冷却时间 的相关文章

随机推荐

热门标签

Kubernetes HPA - 延长冷却时间的相关文章