为什么内存使用量比我在 Kubernetes 节点中设置的要大？

2024-03-30

我仅将资源分配给 1 个 pod，内存为 650MB/30%（对于其他内置 pod，限制内存仅为 69%）

然而，在 Pod 处理过程中，Pod 的使用量在 650MB 以内，但 Node 的总体使用率为 94%。

为什么会出现这种情况，因为它的上限应该是 69%？是不是其他内置pod没有设置限制的原因？如果内存使用率 > 100%，有时我的 pod 会出错，如何防止这种情况发生？

My allocation setting (kubectl describe nodes):

Memory usage of Kubernetes Node and Pod when idle:
kubectl top nodes

kubectl top pods

Memory usage of Kubernetes Node and Pod when running task:
kubectl top nodes

kubectl top pods

进一步测试的行为：
1. 准备命名空间下的deployment、pods和servicetest-ns
2. 因为只有kube 系统 and test-ns有 pod，因此为每个 pod 分配 1000Mi（从kubectl describe nodes) 目标小于 2GB
3. 假设内存使用于kube 系统 and test-ns会小于2GB，小于100%，为什么内存使用率可以是106%？

In .yaml 文件：

    apiVersion: v1
    kind: LimitRange
    metadata:
      name: default-mem-limit
      namespace: test-ns
    spec:
      limits:
      - default:
          memory: 1000Mi
        type: Container
    ---
    apiVersion: v1
    kind: LimitRange
    metadata:
      name: default-mem-limit
      namespace: kube-system
    spec:
      limits:
      - default:
          memory: 1000Mi
        type: Container
    ---
    apiVersion: apps/v1
    kind: Deployment
    metadata:
      name: devops-deployment
      namespace: test-ns
      labels:
        app: devops-pdf
    spec:
      selector:
        matchLabels:
          app: devops-pdf
      replicas: 2
      template:
        metadata:
          labels:
            app: devops-pdf
        spec:
          containers:
          - name: devops-pdf
            image: dev.azurecr.io/devops-pdf:latest
            imagePullPolicy: Always
            ports:
            - containerPort: 3000
            resources:
              requests:
                cpu: 600m
                memory: 500Mi
              limits:
                cpu: 600m
                memory: 500Mi
          imagePullSecrets:
          - name: regcred
    ---
    apiVersion: v1
    kind: Service
    metadata:
      name: devops-pdf
      namespace: test-ns
    spec:
      type: LoadBalancer
      ports:
      - port: 8007
      selector:
        app: devops-pdf

这种影响很可能是由该节点上运行的 4 个 Pod 引起的without指定的内存限制，显示为0 (0%)。当然0并不意味着它不能使用哪怕一个字节的内存，因为不使用内存就无法启动程序；相反，这意味着没有限制，可以使用尽可能多的东西。此外，不在 pod 中运行的程序（ssh、cron 等）也包含在总使用量中，但不受 kubernetes（cgroup）限制。

现在，kubernetes 以一种巧妙的方式设置内核 oom 调整值，以支持其内存下的容器request，使其更有可能杀死内存之间的容器中的进程request and limit，并使其最有可能杀死没有内存的容器中的进程limits。然而，这仅在长期运行中表现得相当好，有时内核可以杀死你最喜欢的容器中表现良好的你最喜欢的进程（使用少于其内存的进程）request). See https://kubernetes.io/docs/tasks/administer-cluster/out-of-resource/#node-oom-behavior https://kubernetes.io/docs/tasks/administer-cluster/out-of-resource/#node-oom-behavior

在这种特殊情况下，没有内存限制的 pod 来自 aks 系统本身，因此在 pod 模板中设置其内存限制不是一个选项，因为有一个协调器将恢复它（最终）。为了解决这种情况，我建议您在 kube-system 命名空间中创建一个 LimitRange 对象，该对象将为所有 pod 分配内存限制，而没有限制（在创建它们时）：

apiVersion: v1
kind: LimitRange
metadata:
  name: default-mem-limit
  namespace: kube-system
spec:
  limits:
  - default:
      memory: 150Mi
    type: Container

（您需要删除已经存在的Pods没有内存限制才能生效；他们将被重新创建）

这并不能完全消除问题，因为您最终可能会遇到过度使用的节点；然而，内存使用将是有意义的，并且 oom 事件将更可预测。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么内存使用量比我在 Kubernetes 节点中设置的要大？的相关文章

通过 nginx 入口控制器进行基本身份验证

我正在使用 nginx 入口控制器 https kubernetes github io ingress nginx deploy https kubernetes github io ingress nginx deploy 在 AWS
在 Kubernetes 中向 MySQL 添加另一个用户

这是我的MySQL apiVersion apps v1beta1 kind Deployment metadata name abc def my mysql namespace abc sk test labels project ab
将代码/文件直接注入 Google Cloud Engine 上的 Kubernetes 容器中

如何将代码文件直接注入 Google Cloud Engine 上的 Kubernetes 容器中类似于使用 Docker 挂载主机文件目录的方式例如 docker run d name nginx p 443 443 v ngin
Kubernetes ConfigMap 大小限制

Though resourceQuotas可能会限制命名空间中的配置映射的数量是否有任何这样的选项来限制单个配置映射的大小我不喜欢某些用户开始上传大型文本文件作为配置映射 ConfigMap etcd 支持的最大大小是多少如果 etc
Kubernetes nginx 入口控制器返回 502，但仅适用于 AJAX/XmlHttpRequest 请求

我有一个在 nginx 入口控制器后面运行 Kubernetes 的 Web 应用程序它对于请求浏览工作正常但来自浏览器的任何 AJAX XMLHTTPRequest 都会从 nginx 收到 502 错误我捕获了常规请求和 AJAX
Grafana/prometheus 中没有 kafka 指标

我成功部署了 Helm Chart普罗米修斯操作员 https github com coreos prometheus operator tree master helm prometheus operator kube 普罗米修斯 ht
kubernetes 集群中 django 应用程序的 Nginx 配置

我在为部署在 kubernetes 中的 django 应用程序创建 nginx 配置文件时遇到困难 Nginx 和 app 是同一集群中的两个独立容器据我了解容器可以通过 127 0 0 1 XX 和主机名相互通信我为此使用 min
从 App Engine 连接到 Kubernetes 引擎

我们希望使用应用程序引擎灵活的流程来更新位于 Google Kubernetes Engine 上的 ElasticSearch 索引我们需要通过 http s 地址连接到 ElasticSearch 推荐的方法是什么我们不想将集群暴露
Kubernetes coredns pod 陷入待处理状态。无法启动仪表板[关闭]

Closed 这个问题是与编程或软件开发无关 help closed questions 目前不接受答案我正在按照此构建 Kubernetes 集群tutorial https www profiq com kubernetes clus
在容器中运行多个相似的进程有意义吗？

提供有关该问题的背景的简要背景目前我和我的团队正在将微服务迁移到 k8s 以减少维护多个部署工具和管道的工作量我们计划迁移的微服务之一是 ETL Worker 它监听 SQS 上的消息并执行多阶段处理它是使用 PHP Laravel
如何为容器设置正确的 cpu 毫核？

我想要优化配置 CPU 核心而不会分配过多或不足如何测量给定容器所需的 CPU 毫核它还带来了一个问题即代理将根据 CPU 消耗将多少流量发送到任何给定的 Pod 以便我们可以最佳地使用计算目前我发送请求并进行监控 kubectl
将容器安装到部署中时如何避免“权限被拒绝”错误？

背景我目前正在部署阿帕奇气流 https airflow apache org 使用 Helm 使用this https github com helm charts tree master stable airflow图表我正在使用一
如何将 configmap 附加到 Kubernetes 中的部署？

根据此处找到的说明 https kubernetes io docs tasks access application cluster connecting frontend backend https kubernetes io docs
入口和 SSL 直通

我最近一直在使用 nginxdemo nginx ingress 控制器据我了解该控制器无法执行 SSL 直通我的意思是将客户端证书一直传递到后端服务进行身份验证因此我一直通过标头传递客户端主题 DN 最终我更喜欢 SSL 直通
如何将 kubernetes LoadBalancer Ingress URL 发布到 aws Route53

今天当我通过 aws 使用 kubernetes 启动一个应用程序时它公开了一个公开可见的 LoadBalancer Ingress URL 但是要将其链接到我的域以使公众可以访问该应用程序我需要在每个设备上的浏览器中手动进入 aws
为什么 tty 在命令完成后挂起？

我想运行这样的命令 kubectl run busybox it rm restart Never image busybox command sh c env 预计运行命令并删除 pod 它打印变量但随后终端冻结尽管 pod 处于完成
如何在 Kubernetes 中按特定顺序配置 Pod 初始化？

我想知道如何按特定顺序开始部署我知道initContainers但这对我不起作用我有一个巨大的平台有大约 20 个部署和 5 个有状态集每个都有自己的服务环境变量卷水平自动缩放器等所以不可能或者我不知道如何在另一个中定义
如何通过 kubectl 代理访问此 Kubernetes 服务？

我想通过以下方式访问我的 Grafana Kubernetes 服务kubectl 代理服务器 https kubernetes io docs user guide kubectl v1 7 proxy 但由于某种原因即使我可以使其适用
使用 Docker Desktop 调试本地部署到 Kubernetes 的应用程序的最佳方法是什么？

我有使用 Docker 开发相对复杂的应用程序的经验使用 Visual Studio 2019 调试应用程序非常容易我只是将 docker compose yaml 设置为启动应用程序并开始调试是否可以使用 Docker Deskto
从节点列表中提取边和社区

我的数据集有超过 50k 个节点我试图从中提取可能的边缘和社区我确实尝试使用一些图形工具如 gephi cytoscape socnet nodexl 等来可视化和识别边缘和社区但节点列表对于这些工具来说太大了因此我正在尝试编写

随机推荐

在运行时创建实例变量

我想在运行时动态创建实例变量并且想将这些变量添加到类别中实例变量的数量可能会根据我用于定义它们的配置属性文件而变化有任何想法吗 Use 关联参考 http developer apple com library ios docume
从 Angular 访问 webapi 时出现 401 未经授权的错误

当用户访问我的 webapi 应用程序时我需要捕获用户的域用户名在我的开发机器上我的 webapi 位于localhost 10570和我的 angularjs 网站它调用网络服务localhost 34575 如果我直接调用我的
xUnit 和 Moq 不支持 async -await 关键字

我正在尝试探索如何将 async 和 wait 关键字应用到我的 xUnit 测试中我正在使用 xUnit 1 9 和 Async CTP 1 3 这是我的测试用例我有一个接口它指定一个异步方法调用 public interface
如何使用 pytest-mock 或 magicmock 模拟导入的对象

我正在尝试理解mock monkeypatch pytest mock能力让我知道这是否可能如果没有请建议我如何测试此代码我的代码结构 app init py some module1 init py some module2 in
使用 xmlagg 函数的 SQL 多个 SELECT 查询 - 未按所需方式提取数据

我在Oracle中的数据是这样的 NAME DEP VALUE ID DEP Amy 1 AA1234 Bob 2 BB4321 Clara 1 CC5678 Clara 2 CC7890 John 1 JJ6543 John 2 JJ78
在 GKE 集群上使用 Terraform 部署 Helm 工作负载

我正在尝试使用 Terraform Helm 提供程序 https www terraform io docs providers helm index html https www terraform io docs providers
Python pygame exe 构建时出现 cx_freeze TCL_LIBRARY 错误

我正在关注这个教程here https www youtube com watch v HosXxXE24hA在 pygame 中制作贪吃蛇游戏这是我的 setup py 代码 import cx Freeze executables c
我如何使用 ruby 驱动程序知道 MongoDB 中文档的大小

MongoDB 中一份文档的限制是 4Mo 我有一些包含大量数据的文档我如何使用 ruby 驱动程序知道 MongoDB 中文档的大小或者原生的 Object bsonsize db Foo findOne
在 Visual Studio 2010 中链接 boost 库时出现问题。

我根据找到的指南编译了我的boost库here https stackoverflow com questions 2629421 how to use boost in visual studio 2010并尝试使用 boost 文件系统
通过 Firefox WebDriver 处理“下载”窗口

我正在尝试 Firefox 的 WebDriver 我想问一下是否可以处理下载窗口接受或拒绝传入的下载请求例如一段简单的代码 import selenium firefox webdriver dr selenium firefox
如何获得 Podio APP 响应细节级别 mini、micro 或 Short？

在 Podio API 文档的许多地方您似乎可以指定响应中的详细程度完整短迷你微例如在 Get App 调用中https developers podio com doc applications get app 22349 h
如何从颠倒的钟形曲线中采样

我可以使用下面的代码生成均匀分布的数字 runif 1 min 10 max 20 如何对更频繁地接近最小和最大边界的随机生成的数字进行采样又名颠倒的钟形曲线钟形曲线通常是高斯曲线这意味着它没有最小值和最大值你可以尝试贝塔分布 h
在 Angular (4) 应用程序组件中包含外部 css

So from 将外部 css 样式加载到 Angular 2 组件中 https stackoverflow com questions 34542143 load external css style into angular 2 co
在 act 回调中包装异步 moxios 调用

我正在尝试使用钩子测试反应功能组件 useEffect 挂钩调用第三方 API 然后在返回时调用 setState 我已经进行了测试但不断收到警告表明组件的更新未包含在 act 中我遇到的问题是期望位于 moxios wait 承诺内
“游戏中心无法识别该游戏”错误

我正在努力度过游戏中心集成工作的第一阶段到目前为止我已经做到了我创建了一个新的干净的应用程序在应用程序委托中添加了 GameKit 标头和基本的authenticateWithCompletionHandler 方法在模拟器中启动
Lua：C++模块无法互相引用，未定义的符号

我创建了两个模块共享对象 CPU 和 SaveState 作为模拟器的一部分两者都独立编译成 so 单独文件并在运行时由 Lua 脚本使用 require 加载 IE SaveState require SaveState CPU r
Git 无法解释地更改单个文件的权限

我是唯一参与这个 git 项目的人每次我在本地 Ubuntu 存储库中编辑文件然后推送到 Bitbucket 并拉取到我的生产存储库时 git 都会将编辑的文件更改为 rwxrwxr x 775 Apache 不喜欢这样本地系统 Ub
从 Python 设置 gzip 时间戳

我对使用 Python 压缩数据感兴趣gzip模块碰巧我希望压缩输出是确定性的因为这对于一般事物来说通常是一个非常方便的属性如果某些不支持 gzip 的进程要寻找输出中的更改或者如果输出将被加密签名不幸的是每次的输出都不同据我
是否可以在Android中使用phoneGap在SD卡中加载/创建数据库？

如何使用phoneGap 或任何与phoneGap 配合使用的插件从sdcard 加载现有的 db 文件或在sdcard 中创建数据库我想将 db 文件保存在 SD 卡中因为数据库的大小可能会增加我面临同样的问题但经过长时间彻底阅读
为什么内存使用量比我在 Kubernetes 节点中设置的要大？

我仅将资源分配给 1 个 pod 内存为 650MB 30 对于其他内置 pod 限制内存仅为 69 然而在 Pod 处理过程中 Pod 的使用量在 650MB 以内但 Node 的总体使用率为 94 为什么会出现这种情况因为它的上限

为什么内存使用量比我在 Kubernetes 节点中设置的要大？

为什么内存使用量比我在 Kubernetes 节点中设置的要大？ 的相关文章

随机推荐

热门标签

为什么内存使用量比我在 Kubernetes 节点中设置的要大？的相关文章