根据每个 Pod 的活动连接数扩展 GKE Pod

2024-02-02

我有一个正在运行的 GKE 集群，其中包含使用目标 CPU 利用率指标的 HPA。这没问题，但 CPU 利用率对我们来说并不是最佳的扩展指标。分析表明，活动连接计数是一般平台负载的良好指标，因此，我们希望将其视为我们的主要扩展指标。

为此，我为我们使用的 NGINX 入口启用了自定义指标。从这里我们可以看到活动连接数、请求率等。

以下是使用 NGINX 自定义指标的 HPA 规范：

apiVersion: autoscaling/v2beta1
kind: HorizontalPodAutoscaler
metadata:
  name: hpa-uat-active-connections
  namespace: default
spec:
  minReplicas: 3
  maxReplicas: 6
  metrics:
    - type: Pods
      pods:
        metricName: custom.googleapis.com|nginx-ingress-controller|nginx_ingress_controller_nginx_process_connections
        selector: 
          matchLabels:
            metric.labels.state: active
            resource.labels.cluster_name: "[redacted]"
        targetAverageValue: 5
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: "[redacted]"

然而，虽然此规范确实部署正常，但我总是从 HPA 获得以下输出：

NAME                         REFERENCE                                 TARGETS       MINPODS   MAXPODS   REPLICAS   AGE
hpa-uat-active-connections   Deployment/[redacted]                     <unknown>/5   3         6         3          31s

简而言之，目标值是“未知”，到目前为止我还无法理解/解决原因。自定义指标确实存在：

kubectl get --raw "/apis/external.metrics.k8s.io/v1beta1/namespaces/default/custom.googleapis.com|nginx-ingress-controller|nginx_ingress_controller_nginx_process_connections?labelSelector=metric.labels.state%3Dactive,resource.labels .cluster_name%3D[已编辑]" |杰克

这使：

{
  "kind": "ExternalMetricValueList",
  "apiVersion": "external.metrics.k8s.io/v1beta1",
  "metadata": {
    "selfLink": "/apis/external.metrics.k8s.io/v1beta1/namespaces/default/custom.googleapis.com%7Cnginx-ingress-controller%7Cnginx_ingress_controller_nginx_process_connections"
  },
  "items": [
    {
      "metricName": "custom.googleapis.com|nginx-ingress-controller|nginx_ingress_controller_nginx_process_connections",
      "metricLabels": {
        "metric.labels.controller_class": "nginx",
        "metric.labels.controller_namespace": "ingress-nginx",
        "metric.labels.controller_pod": "nginx-ingress-controller-54f84b8dff-sml6l",
        "metric.labels.state": "active",
        "resource.labels.cluster_name": "[redacted]",
        "resource.labels.container_name": "",
        "resource.labels.instance_id": "[redacted]-eac4b327-stqn",
        "resource.labels.namespace_id": "ingress-nginx",
        "resource.labels.pod_id": "nginx-ingress-controller-54f84b8dff-sml6l",
        "resource.labels.project_id": "[redacted],
        "resource.labels.zone": "[redacted]",
        "resource.type": "gke_container"
      },
      "timestamp": "2019-12-30T14:11:01Z",
      "value": "1"
    }
  ]
}

所以我真的有两个问题：

（主要的）：我在这里做错了什么导致 HPA 无法读取指标？
这是尝试扩展到多个 Pod 上的平均活动连接负载的正确方法吗？

提前谢谢了，本

Edit 1

kubectl 获取全部

NAME                                                READY   STATUS    RESTARTS   AGE
pod/[redacted]-deployment-7f5fbc9ddf-l9tqk          1/1     Running   0          34h
pod/[redacted]-uat-deployment-7f5fbc9ddf-pbcns      1/1     Running   0          34h
pod/[redacted]-uat-deployment-7f5fbc9ddf-tjfrm      1/1     Running   0          34h

NAME                                TYPE        CLUSTER-IP     EXTERNAL-IP   PORT(S)                      AGE
service/[redacted]-webapp-service   NodePort    [redacted]     <none>        [redacted]                   57d
service/kubernetes                  ClusterIP   [redacted]     <none>        [redacted]                   57d

NAME                                           READY   UP-TO-DATE   AVAILABLE   AGE
deployment.apps/[redacted]-uat-deployment      3/3     3            3           57d

NAME                                                      DESIRED   CURRENT   READY   AGE
replicaset.apps/[redacted]-uat-deployment-54b6bd5f9c      0         0         0       12d
replicaset.apps/[redacted]-uat-deployment-574c778cc9      0         0         0       35h
replicaset.apps/[redacted]-uat-deployment-66546bf76b      0         0         0       11d
replicaset.apps/[redacted]-uat-deployment-698dfbb6c4      0         0         0       4d
replicaset.apps/[redacted]-uat-deployment-69b5c79d54      0         0         0       6d17h
replicaset.apps/[redacted]-uat-deployment-6f67ff6599      0         0         0       10d
replicaset.apps/[redacted]-uat-deployment-777bfdbb9d      0         0         0       3d23h
replicaset.apps/[redacted]-uat-deployment-7f5fbc9ddf      3         3         3       34h
replicaset.apps/[redacted]-uat-deployment-9585454ff       0         0         0       6d21h
replicaset.apps/[redacted]-uat-deployment-97cbcfc6        0         0         0       17d
replicaset.apps/[redacted]-uat-deployment-c776f648d       0         0         0       10d

NAME                                                               REFERENCE                                 TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
horizontalpodautoscaler.autoscaling/[redacted]-uat-deployment      Deployment/[redacted]-uat-deployment      4%/80%    3         6         3          9h

好吧，我通过查找 HPA 的架构设法解决了这个问题（https://docs.okd.io/latest/rest_api/apis-autoscaling/v2beta1.HorizontalPodAutoscaler.html https://docs.okd.io/latest/rest_api/apis-autoscaling/v2beta1.HorizontalPodAutoscaler.html).

简而言之，我使用了错误的指标类型（如上所示，您可以看到我正在使用“Pods”，但我应该使用“External”）。

正确的 HPA 规格是：

apiVersion: autoscaling/v2beta1
kind: HorizontalPodAutoscaler
metadata:
  name: hpa-uat-active-connections
  namespace: default
spec:
  minReplicas: 3
  maxReplicas: 6
  metrics:
    - type: External
      external:
        metricName: custom.googleapis.com|nginx-ingress-controller|nginx_ingress_controller_nginx_process_connections
        metricSelector: 
          matchLabels:
            metric.labels.state: active
            resource.labels.cluster_name: [redacted]
        targetAverageValue: 5
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: [redacted]

一旦我这样做了，事情就立即开始了：

NAME                         REFERENCE                                 TARGETS        MINPODS   MAXPODS   REPLICAS   AGE
hpa-uat-active-connections   Deployment/bustle-webapp-uat-deployment   334m/5 (avg)   3         6         3          30s

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Kubernetes

horizontalscaling

根据每个 Pod 的活动连接数扩展 GKE Pod 的相关文章

Google Kubernetes Engine 中的存储 ReadWriteMany

有没有一种方法能够提供 ReadWriteMany 存储而无需实现存储集群我能够使用 gcsfuse 提供存储但速度非常慢我需要接近 GlusterFS 速度的东西我目前正在使用 GlusterFS 另一种选择 Google Clo
多个值文件中包含多个列表的 Helm 图表

我有一个包含以下内容的values yaml abc env name name01 value value01 name name02 value value02 我有另一个值文件values dev yaml 我在使用 f安装时添加它
Helm 3 图表安装错误：验证数据时出错：未设置 apiVersion

我有一个简单的 helm 图表它将通过 docker 桌面将应用程序部署到我的 kubernetes 本地副本如果我使用 kubectl 一次部署一个 yaml 文件一切都会正常工作但是当我尝试创建 helm 图表以方便部署时出
Rabbit mq - 等待 Mnesia 表时出错

我已经在 Kubernetes 集群上使用 Helm Chart 安装了 RabbitMQ rabbitmq pod不断重新启动在检查 pod 日志时我收到以下错误 2020 02 26 04 42 31 582 warning lt
多个容器 POD 中的一个容器进程崩溃会发生什么情况？

通常在单容器POD中当容器的主进程崩溃时 Pod会重新启动如果有多个容器 POD 如果第二个容器中的一个进程崩溃会发生什么情况 POD 会重新启动吗来自文档here https kubernetes io docs concepts
服务器找不到 pod 的 nginx_vts_server_requests_per_second 指标

我安装了kube prometheus 0 9 0 https github com prometheus operator kube prometheus 并且想要部署一个示例应用程序来测试 Prometheus 指标自动缩放并使用以下
使用代理协议的 kubernetes nginx 入口最终出现损坏的标头

我尝试使用代理协议在 google 容器上设置 nginx 入口 nodeport 以便可以将真实 IP 转发到后端服务但最终导致标头损坏 2017 02 05 13 48 52 error 18 18 2 broken header H
ResourceVersion 和 Generation 之间有什么区别？

在 Kubernetes 对象元数据中有的概念resourceVersion and generation https github com kubernetes community blob master contributors de
如何在 Spring Boot 上针对 Openshift（基于云的 Kubernetes）部署的 Elasticsearch 实施带有自签名证书的 SSL

有谁知道如何在 Spring Boot 应用程序上使用 SSL 与以 https 形式部署在 Openshift 上的 ElasticSearch 连接我的 Spring Boot 应用程序中有一个 config java 如下所示 Co
当使用 k8s.io/client-go 库的 kubernetes 部署发生更改时获得通知的最佳方式是什么？

Context 我正在编写一个使用k8s io client go https github com kubernetes client go 图书馆这里是 godocs https godoc org k8s io client go
container_memory_working_set_bytes 与 process_resident_memory_bytes 和total_rss 之间的关系

我希望了解以下关系容器内存工作集字节 vs 进程驻留内存字节 vs 总计RSS 容器内存 rss 文件映射以便更好地配备OOM可能性警报系统这似乎违背了我的理解这让我现在感到困惑如果容器 pod 运行单个进程执行用 Go 编写的编
kubernetes helm：“与 pod 的连接丢失”和“传输正在关闭”错误

I run helm upgrade install修改我的 kubernetes 集群的状态有时会收到如下错误 22 24 34 StdErr E0126 17 24 28 472048 48084 portforward go 178
禁用 Kubernetes NGINX 入口的 SSL 重定向

默认情况下在 Kubernetes NGINX 入口中启用 SSL 重定向如何禁用此功能目前的实施如下 apiVersion extensions v1beta1 kind Ingress metadata name project
Kubernetes 上的气流：Errno 13 - 权限被拒绝：'/opt/airflow/logs/scheduler

我在 Kubernetes 上运行 Airflow稳定舵图 https github com helm charts tree master stable airflow 我在 AWS 环境中运行它无论是否安装任何用于日志存储的外部卷都
如何在没有部署 K8S 的情况下重启 pod？

我部署了一个弹性搜索 https www elastic co elasticsearch使用此命令在 K8S 上集群helm install elasticsearch elastic elasticsearch 我可以看到 Pod 正在
从 SCDF 执行任务时，数据库凭证作为部分作业参数公开

我有自定义构建的 SCDF 它在 Openshift 中构建为 docker 映像并在 server deployment yaml 中称为 docker 映像我使用 Oracle 数据库来存储任务元数据并且是此处的外部源我传递了
GKE 上的 Ingress 仍处于“后端不健康”状态

Given 一个运行 nginx 的简单 pod 节点端口服务一个入口当拨打电话时pod从集群内部我们得到 200 响应代码当拨打电话时service从集群内部我们得到 200 响应代码入口显示为注释 ingress kuberne
支持 Kubernetes NodePort 服务的 SSL/TLS

问题我需要通过 https 向外部公开 Kubernetes NodePort 服务设置我已经在裸机上部署了 Kubernetes 并且已经部署Polyaxon https github com polyaxon polyaxon通过
如何使用fabric8 java客户端获取kubernetes服务帐户访问令牌？

我已经在本地计算机中配置了 minikube 并将在外部使用 kubernetes 我已经在 kubernetes 中创建了一个服务帐户并使用它的秘密我可以使用以下命令获取访问令牌 kubectl get secret
Kubernetes，VolumeMount 一个文件，而不是一个目录

我将使用 K8S 来编排 docker 容器在 k8s 中我需要从主机目录复制一个文件 configs nginx cas server conf 到 pod 容器目录 etc nginx nginx conf 但是目前的k8s只允许挂

随机推荐

如何使用 Tensorflow 对象检测 API 继续训练对象检测模型？

我在用着Tensorflow 对象检测 API https github com tensorflow models tree master research object detection tensorflow object detec
使用 CSS 构建 3D 金字塔

这里有一个jsbin http jsbin com suvajux 1 edit html css output到目前为止我所拥有的和下面是我正在尝试构建的图像这是 html 到目前为止我只添加了金字塔的 2 条边 div class
“无法从空字符串创建路径”使用 S3 路径在 hive 中出现“CREATE TABLE AS”错误

我正在尝试在 Glue 目录中创建一个表其中包含使用 hive 在 EMR 中运行的 Spark 的 s3 路径位置我已尝试以下命令但出现错误 pyspark sql utils AnalysisException u java la
如何在移动浏览器中打开网站上弹出“添加到主屏幕”

如何让手机浏览器弹出这个提示添加到主页将在手机主屏幕上创建 chrome 图标并在手机上创建网站链接请提出解决方案官方要求是当您的应用满足以下条件时 Chrome 会自动显示横幅 Has a web app manifest h
对不重复的团队对进行排序 |循环赛

我正在制定锦标赛的时间表每支球队应该打 8 场比赛队伍数量 2 为了将团队分成对我使用循环算法来获取表格例如 6 支团队然后我将其转换为对的集合 1 4 2 3 3 2 4 1 5 6 6 5 1 2 2 1 3 5 4 6 5
当 Twebbrowser 控件不可见时如何强制加载页面

我需要从 delphi 代码执行一些 javascript 函数但是如果页面未加载到 Twebbrowser 控件中则此函数将失败所以问题是如果页面位于不活动的选项卡中则在选项卡变为活动状态之前不会加载页面问题是如何强制加载页面
什么更快？一个intent.putExtras(Bundle with Strings)还是多个intent.putExtra(String)？

什么更快将一堆字符串值添加到bundle然后将其添加到intent 或者只是将值添加到intent using intent putExtra 还是没有太大区别谷歌搜索给了我教程但没有太多答案只是出于好奇而询问想知道使用其中之一是
为什么我收到“未实现错误：数据库对象未实现真值测试或 bool()”。在 django 中运行 makemigration cmd 时

我正在尝试连接Django with MongoDB using Djongo 我更改了数据库参数但收到此错误未实现错误数据库对象未实现真值测试或 bool 当我运行 makemigration 命令时请问有人可以解释一下为什么我会
无法解析方法 getDownloadUrl() [重复]

这个问题在这里已经有答案了 getDownloadUrl 不适用于我的项目 StorageReference image path storageReference child profile images child user id jp
为什么 IQueryable.All() 在空集合上返回 true？

所以我今天遇到了一种情况一些生产代码失败正是因为一个方法的执行完全按照记录在 MSDN 中 http msdn microsoft com en us library bb534754 aspx 为我没有阅读文档而感到羞耻然而我仍然摸
是否可以获取atomic_int的底层存储地址？

我想用一个std atomic int http en cppreference com w cpp atomic atomic与futex http man7 org linux man pages man2 futex 2 htmlLi
结束准备好的陈述

我知道结束准备好的陈述是建议做的事情 https stackoverflow com questions 6631364 when to close prepared statement 但我有一个PHP像这样的脚本 sql SELECT
限制搜索建议的数量，android

使用具有自定义搜索建议的搜索界面时是否有办法限制显示的建议数量 Thanks 其实很简单首先在你的ContentProvider 定义一个变量来引用 public static final String LIMIT PARAMETER
如何从 Windows 窗体 DateTimePicker 控件中仅获取日期值？

我正在使用 C 代码构建一个应用程序如何仅获取日期值DateTimePicker控制我假设您指的是 winforms 应用程序中的日期时间选择器在您的代码中您可以执行以下操作 string theDate dateTimePicke
为什么 selenium webdriver Firefox 不适用于非特权用户？

我正在尝试使用 selenium 在 python 的 Django 视图中创建屏幕截图如果我在 root 下启动 selenium firefox webdriver 运行良好但是当我尝试使用非超级用户运行它时它在尝试实例化驱动程
java.net.SocketTimeoutException：读取超时

我有一个具有客户端服务器架构的应用程序客户端将 Java Web Start 与 Java Swing AWT 结合使用 sert 使用 HTTP 服务器 Servlet 与雄猫通信是通过对象的序列化进行的创建一个 ObjectO
描边宽度变换 (SWT) 实现（Java、C#...）[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我最近发现了笔划宽度变换如以下研究论文中所述使用笔划宽度变换检测自然场景中的文本 https ie
如何在 Angular 2 中进行全局搜索？

我是 angular2 的新开发人员我想在 json 对象数组中进行全局搜索例如这个数组 invoiceList invoiceNumber 1234 invoiceSupplier test invoiceStatus Import
使用 jquery.validation equalTo( other ) 确保“Sunday”是输入值

RE http docs jquery com Plugins Validation http docs jquery com Plugins Validation 我正在设置一个简单的联系表单并希望使用测验作为简单的垃圾邮件防护因
根据每个 Pod 的活动连接数扩展 GKE Pod

我有一个正在运行的 GKE 集群其中包含使用目标 CPU 利用率指标的 HPA 这没问题但 CPU 利用率对我们来说并不是最佳的扩展指标分析表明活动连接计数是一般平台负载的良好指标因此我们希望将其视为我们的主要扩展指标为此我

根据每个 Pod 的活动连接数扩展 GKE Pod

根据每个 Pod 的活动连接数扩展 GKE Pod 的相关文章

随机推荐

热门标签