Pod 处于挂起阶段（错误：FailedScheduling：节点与节点选择器不匹配）

2023-12-24

我的其中一个 pod 有问题。它说它处于待处理状态。

如果我描述这个 Pod，我会看到以下内容：

Events:
  Type     Reason             Age                From                Message
  ----     ------             ----               ----                -------
  Normal   NotTriggerScaleUp  1m (x58 over 11m)  cluster-autoscaler  pod didn't trigger scale-up (it wouldn't fit if a new node is added): 2 node(s) didn't match node selector
  Warning  FailedScheduling   1m (x34 over 11m)  default-scheduler   0/6 nodes are available: 6 node(s) didn't match node selector.

如果我检查日志，那里什么也没有（它只是输出空值）。

- - 更新 - - 这是我的 pod yaml 文件

apiVersion: v1
kind: Pod
metadata:
  annotations:
    checksum/config: XXXXXXXXXXX
    checksum/dashboards-config: XXXXXXXXXXX
  creationTimestamp: 2020-02-11T10:15:15Z
  generateName: grafana-654667db5b-
  labels:
    app: grafana-grafana
    component: grafana
    pod-template-hash: "2102238616"
    release: grafana
  name: grafana-654667db5b-tnrlq
  namespace: monitoring
  ownerReferences:
  - apiVersion: apps/v1
    blockOwnerDeletion: true
    controller: true
    kind: ReplicaSet
    name: grafana-654667db5b
    uid: xxxx-xxxxx-xxxxxxxx-xxxxxxxx
  resourceVersion: "98843547"
  selfLink: /api/v1/namespaces/monitoring/pods/grafana-654667db5b-tnrlq
  uid: xxxx-xxxxx-xxxxxxxx-xxxxxxxx
spec:
  containers:
  - env:
    - name: GF_SECURITY_ADMIN_USER
      valueFrom:
        secretKeyRef:
          key: xxxx
          name: grafana
    - name: GF_SECURITY_ADMIN_PASSWORD
      valueFrom:
        secretKeyRef:
          key: xxxx
          name: grafana
    - name: GF_INSTALL_PLUGINS
      valueFrom:
        configMapKeyRef:
          key: grafana-install-plugins
          name: grafana-config
    image: grafana/grafana:5.0.4
    imagePullPolicy: Always
    name: grafana
    ports:
    - containerPort: 3000
      protocol: TCP
    readinessProbe:
      failureThreshold: 3
      httpGet:
        path: /api/health
        port: 3000
        scheme: HTTP
      initialDelaySeconds: 30
      periodSeconds: 10
      successThreshold: 1
      timeoutSeconds: 30
    resources:
      requests:
        cpu: 200m
        memory: 100Mi
    terminationMessagePath: /dev/termination-log
    terminationMessagePolicy: File
    volumeMounts:
    - mountPath: /etc/grafana
      name: config-volume
    - mountPath: /var/lib/grafana/dashboards
      name: dashboard-volume
    - mountPath: /var/lib/grafana
      name: storage-volume
    - mountPath: /var/run/secrets/kubernetes.io/serviceaccount
      name: default-token-tqb6j
      readOnly: true
  dnsPolicy: ClusterFirst
  initContainers:
  - command:
    - sh
    - -c
    - cp /tmp/config-volume-configmap/* /tmp/config-volume 2>/dev/null || true; cp
      /tmp/dashboard-volume-configmap/* /tmp/dashboard-volume 2>/dev/null || true
    image: busybox
    imagePullPolicy: Always
    name: copy-configs
    resources: {}
    terminationMessagePath: /dev/termination-log
    terminationMessagePolicy: File
    volumeMounts:
    - mountPath: /tmp/config-volume-configmap
      name: config-volume-configmap
    - mountPath: /tmp/dashboard-volume-configmap
      name: dashboard-volume-configmap
    - mountPath: /tmp/config-volume
      name: config-volume
    - mountPath: /tmp/dashboard-volume
      name: dashboard-volume
    - mountPath: /var/run/secrets/kubernetes.io/serviceaccount
      name: default-token-tqb6j
      readOnly: true
  nodeSelector:
    nodePool: cluster
  priority: 0
  restartPolicy: Always
  schedulerName: default-scheduler
  securityContext: {}
  serviceAccount: default
  serviceAccountName: default
  terminationGracePeriodSeconds: 300
  tolerations:
  - effect: NoExecute
    key: node.kubernetes.io/not-ready
    operator: Exists
    tolerationSeconds: 300
  - effect: NoExecute
    key: node.kubernetes.io/unreachable
    operator: Exists
    tolerationSeconds: 300
  volumes:
  - emptyDir: {}
    name: config-volume
  - emptyDir: {}
    name: dashboard-volume
  - configMap:
      defaultMode: 420
      name: grafana-config
    name: config-volume-configmap
  - configMap:
      defaultMode: 420
      name: grafana-dashs
    name: dashboard-volume-configmap
  - name: storage-volume
    persistentVolumeClaim:
      claimName: grafana
  - name: default-token-tqb6j
    secret:
      defaultMode: 420
      secretName: default-token-tqb6j
status:
  conditions:
  - lastProbeTime: 2020-02-11T10:45:37Z
    lastTransitionTime: 2020-02-11T10:15:15Z
    message: '0/6 nodes are available: 6 node(s) didn''t match node selector.'
    reason: Unschedulable
    status: "False"
    type: PodScheduled
  phase: Pending
  qosClass: Burstable

你知道我应该如何进一步调试这个吗？

解决方案：您可以执行以下两件事之一，以允许调度程序满足您的 Pod 创建请求。

您可以选择从 pod yaml 中删除这些行，然后从头开始重新创建 pod（如果您出于某种原因需要选择器，请采用下一步 2 中的方法）
```
nodeSelector: 
    nodePool: cluster 
```

您可以确保添加此nodePool: cluster作为所有节点的标签，以便使用可用的选择器来调度 Pod。

您可以使用此命令来标记所有节点

kubectl label nodes <your node name> nodePool=cluster

通过替换每个节点的集群详细信息中的节点名称或仅替换要使用此标签选择的节点来运行上述命令。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Kubernetes

Pod 处于挂起阶段（错误：FailedScheduling：节点与节点选择器不匹配）的相关文章

如何从清单文件（通常是清单文件与 kubectl 运行）使用 kubectl port-forward

我正在尝试在本地使用 Kubernetes 运行我的第一个应用程序或者我应该说 minikube 我有一个非常基本的 Web 服务器一个本地 docker 镜像和官方 mongodb 我想从 dockerhub 中提取镜像我并不是
如何通过 kubectl 代理访问此 Kubernetes 服务？

我想通过以下方式访问我的 Grafana Kubernetes 服务kubectl 代理服务器 https kubernetes io docs user guide kubectl v1 7 proxy 但由于某种原因即使我可以使其适用
如何将 kubectl 配置文件与 ~/.kube/config 合并？

有没有一个简单的kubectl命令采取kubeconfig文件包含 cluster context user 并将其合并到 kube config 文件作为附加上下文 Do this export KUBECONFIG kube conf
Kubernetes 中可以连接两个集群 IP 服务吗？

情况是我想连接一个租户内的两个集群IP服务该租户已经将Traefik作为NodePort 以便这两个服务中的任何一个都可以成为LoadBalancer 因为NodePort由Traefik使用我尝试连接的两个服务的工作方式如下第一个服
如何从容器内运行 podman？

我想跑podman https podman io作为运行 CI CD 管道的容器但是我不断从 podman 容器中收到此错误 podman info ERRO 0000 overlay is not supported over ov
我可以将应用程序数据存储在 kubernetes 配置资源中吗？

我正在尝试为我的应用程序找到一个数据库对象存储该应用程序实际上是 ISTIO 网络路由 API 的包装器基本上简化了我的网络的 ISTIO 配置 Kubernetes k8s 自定义资源定义 CRD 似乎符合我的要求也喜欢 CRD
什么是 Kubernetes 清单？

我在网上搜索过大多数链接似乎都提到了清单但没有实际解释它们是什么什么是清单它基本上是 Kubernetes API 对象描述配置文件可以包含其中的一个或多个即 Deployment ConfigMap Secret Daemon
Kubernetes 反关联规则将 Deployment Pod 分散到至少 2 个节点

我在 k8s 部署中配置了以下反关联性规则 spec selector matchLabels app my app environment qa template metadata labels app my app environmen
如何在 kubernetes 上使多个 pod 相互通信

我是 Kubernetes 新手我正在尝试通过 microk8s 将应用程序部署到 Kubernetes 该应用程序包含Python Flask后端 Angular前端 Redis和MySQL数据库我将映像部署在多个 Pod 中状态显
container_memory_working_set_bytes 与 process_resident_memory_bytes 和total_rss 之间的关系

我希望了解以下关系容器内存工作集字节 vs 进程驻留内存字节 vs 总计RSS 容器内存 rss 文件映射以便更好地配备OOM可能性警报系统这似乎违背了我的理解这让我现在感到困惑如果容器 pod 运行单个进程执行用 Go 编写的编
无法在 minikube 和 haproxy loadBalancer 中导出 IP

我对 kubernetes 比较陌生我已经在 virtualbox VM ubuntu 19 10 中安装了 minikube v1 5 2 我想创建一个可以从主机和访客访问的 Web 服务器但是我无法访问它或公开 IP 你可以帮帮我
如何不覆盖 Helm 模板中随机生成的秘密

我想在 Helm 模板中生成密码这很容易使用randAlphaNum功能但是当版本升级时密码将会更改有没有办法检查密码是否先前生成然后使用现有值像这样的事情 apiVersion v1 kind Secret metadata
无法使用带有服务帐户的令牌登录 Kubernetes 仪表板

我已经安装了 Kubernetes 仪表板并创建了具有适当权限的服务帐户用户但是由于某种原因使用令牌登录失败我看到以下日志 2018 08 17 14 26 06 2018 08 17T14 26 06Z Incoming HTTP
从我的应用程序 Helm 图表配置第三方 Helm 图表

我似乎在任何地方都找不到任何关于此的明确信息但是 Helm 图表中是否有可能需要第三方例如stable jenkins 并指定配置值我看到的所有示例都是为了运行helm install直接命令但我希望能够将其配置为我的应用程序的一部
kubectl：在 WSL 终端中找不到

我按照以下说明在 Windows10 上安装了 WSL2 https learn microsoft com en us windows wsl install win10 https learn microsoft com en us w
使用 JWT 的 Istio Origin 身份验证不起作用

我一直在使用 JWT 将身份验证策略应用于我的测试服务我已关注本指南 https istio io docs tasks security authn policy end user authentication它确实按预期工作了但是
如何在 pod 之间或 kubernetes 集群中的节点之间复制文件？

在 kubernetes 集群中可以这样做吗我发现的所有示例都是从本地磁盘复制到 Pod 反之亦然或者是从一个节点复制到另一个节点的唯一选项例如通过 SSH SCP 或使用其他实用程序无法进行集群到集群的复制你需要使用kubect
Kubernetes 如何跟踪 StatefulSet 中哪个云盘挂载到哪个 Pod 上？

我在 GKE 上创建了一个 StatefulSet 它配置了一堆附加到属于该 StatefulSet 的 Pod 的 GCE 磁盘假设我将 StatefulSet 缩放为 0 组成的 Pod 被销毁并释放磁盘当我扩大规模时磁盘会重新连
Windows 持久卷上的 Kubernetes

Windows minikube 是否支持带有主机路径的持久卷如果是这样语法是什么 I tried apiVersion v1 kind PersistentVolume metadata name kbmongo002 labels
为什么ReadWriteOnce在不同的节点上工作？

我们在 K8s 上运行的平台有不同的组件我们需要在其中两个组件 comp A 和 comp B 之间共享存储但我们错误地将 PV 和 PVC 定义为ReadWriteOnce即使这两个组件在不同的节点上运行一切都正常我们能够从两个组

随机推荐

如何用PHP获取页面访问者所在国家？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案对于我正在开发的网站我希望它能够显示每个国家地区有多少用户访问过我的网站但我很好奇的是如何获取用
javascript CPU 使用率过高 - 如何调试？

查找 javascript cpu 使用率高的原因的最佳方法是什么我有一个脚本可以简单地从缩略图库中加载 flickr 中的照片它们加载后什么也不做等待您单击它们以显示在灯箱中但 cpu 使用率仍然是 25 或更多我打开了 F
Ndepend CQL 使用特定框架程序集查找某些类型的方法

为了检查不是从某些基类派生的类型是否正在使用低级框架程序集可以使用以下查询 SELECT TYPES WHERE IsDirectlyUsing ASSEMBLY Framework Data AND DeriveFrom App Bas
使用 SQLCipher 加密后无法压缩 Android SQLite 数据库

我随我的应用程序提供了一个只读数据库将其包含在 Assets Database 目录中所有数据均已预先填充集成后SQLCipher并对数据库进行加密我注意到 APK 大小从25MB 至 150MB 原因是SQLitedb 文件不再被
用于图像分割的张量流的 sigmoid_cross_entropy 损失函数

我试图理解什么是sigmoid cross entropy损失函数对于图像分割神经网络的作用这是相关的 Tensorflow 源码code https github com tensorflow tensorflow blob 600ca
生产环境中显示开发异常

我知道这是一个很大的不并且在我的网站上线时不应该显示开发人员错误页面我该怎么做才能确保开发环境错误消息不会出现在生产中为什么会出现这些我以为在生产模式下它默认是关闭的我错过了一个设置吗 Note 这是在共享服务器上我使用的是a
ArangoDB - 如何在图遍历中执行计算？

我有一个简单的图表来跟踪我借钱给的人所以图表看起来像这样 userB owes to amount 200 gt userA userC owes to amount 150 gt userA 等等假设您需要使用图形遍历来找出每个用户欠
控件不显示是否在后台线程上运行（c# winform）

我有一个表格复杂形式在代码中具有多个控件需要一些时间来加载因此我决定放入一个单独的线程中以减少初始加载时间除了等待表单上的标签控件 Form1在代码中最初不显示就在 Form1 响起之前的一瞬间所以我的问题是为什么标签
QMimeData 中的 Python 对象

我正在基于我的自定义模型实现拖放 QTreeView 一切正常我的树显示数据启用了拖放现在最后一步就在我面前放置和传输拖动的数据为此我需要在模型中实现 mimeTypes mimeData 和 dropMimeData 方法现
将多个canvas转换为html5中的dataURL

我想加入多个画布来制作一个图像那么有没有什么方法可以将多于一张画布隐藏起来toDataURL制作单个图像创建一个函数该函数接受多个参数画布元素将它们放在一个空白画布上然后返回新制作的画布的 dataurl var getImad
Java 中的逻辑表示法

绝对基本的 Java 问题我在 Google 上很难找到以下是什么意思 7 8 0 这相当于写 7 0 8 0 我写了一个快速的 main 来测试这一点情况似乎确实如此我只是想确保我没有遗漏任何东西 Nope is 按位和 http
Python 应用程序输出到系统日志服务器

我正在尝试在谷歌上进行一些搜索每 5 分钟左右循环一次当它受到攻击时我希望它将结果推送到系统日志服务器我对 python 很陌生所以请原谅我的无知我已经搜索了很长时间但找不到我的问题的答案我打算添加多个查询来查找不同的结果
逻辑数组 - 在赋值 A(I) = B 中，B 和 I 中的元素数量必须相同

我有三个矩阵 A B和C 当B大于A时我想用A使该值饱和它表示I中的元素数量即 B gt A 必须与A 中的元素数量我检查了下面它们是相同的 gt gt A 5 5 5 5 5 5 5 5 5 gt gt B 2 2 2 2 2
尝试将 Django 国家添加到 Django

我是 django 的新手我正在尝试安装 django 国家但遇到了问题我安装自http pypi python org pypi django countries 1 0 1 http pypi python org pypi dj
在 asp.net mvc 中使用 jQuery 动态删除表行

我有一个表可以动态添加和删除行 model AHBReports Models AdjustmentModel using Html BeginForm table Html EditorFor model gt model Adjust
确定运行 .NET 应用程序的系统要求

如何确定 NET 应用程序的最低系统要求我希望能够确定应列出的运行应用程序的最低系统要求 RAM CPU 等该应用程序是用 C 编写的并使用 NET 3 5 和 DirectX9 这一切都是关于反复试验在各种设置中运行它以查看它是否
添加 TwilioController 基类继承后，Microsoft Azure MVC 3 Web 角色未启动

Azure Web 角色 MVC 3 项目不会以 Twilio 控制器类启动我有一个托管在 MS Azure 上的 MVC 3 应用程序它发布到 Azure Web 角色没有问题我添加了 Nuget Twilio 和 Twilio
Android 向后代码兼容性

我正在开发一个应用程序使用 android hardware Camera parameters getSupportedPictureSizes 这仅适用于 SDK 版本 8 我希望与 SDK 4 兼容所以我这样做了 if Build
属性错误：“模块”对象没有属性“读者”[重复]

这个问题在这里已经有答案了我收到错误 AttributeError 模块对象没有属性读者当我运行下面的代码但我不明白为什么 import csv with open test csv as f q csv reader f 您导入了
Pod 处于挂起阶段（错误：FailedScheduling：节点与节点选择器不匹配）

我的其中一个 pod 有问题它说它处于待处理状态如果我描述这个 Pod 我会看到以下内容 Events Type Reason Age From Message Normal NotTriggerScaleUp 1m x58 over

Pod 处于挂起阶段（错误：FailedScheduling：节点与节点选择器不匹配）

Pod 处于挂起阶段（错误：FailedScheduling：节点与节点选择器不匹配） 的相关文章

随机推荐

热门标签

Pod 处于挂起阶段（错误：FailedScheduling：节点与节点选择器不匹配）的相关文章