Kubernetes 作业被创建但不会立即执行

2024-01-12

例如，创建如下所示的就业机会：

apiVersion: batch/v1
kind: Job
metadata:
  name: test-job-sebas
spec:
  template:
    spec:
      containers:
      - name: pi
        image: perl
        command: ["perl",  "-Mbignum=bpi", "-wle", "print bpi(2000)"]
      restartPolicy: Never
  backoffLimit: 4

导致作业资源被创建，但未观察到 Pod 或事件。 Pod 状态如下：

Pods Statuses: 1 Running / 0 Succeeded / 0 Failed

唯一可见的事件是成功创建 pod 的通知。问题是该消息仅在 30 分钟的完全静默后才出现。

Normal SuccessfulCreate 21m job-controller Created pod: test-job-sebas-882bh

从时间上我们可以观察到kube-apiserver日志允许作业资源的“create”动词，我们无法在任何其他具有文本“test-job-sebas”的 pod（控制器/调度程序/apiserver）中发现任何其他日志，直到约 30 分钟后哪里的kube-controller-manager记录以下内容。

Event occurred" object="test-namespace/job-test-01" kind="Job" apiVersion="batch/v1" type="Normal" reason="SuccessfulCreate" message="Created pod: test-job-sebas-882bh"

此集群中的任何作业都会发生这种情况，无论作业的名称空间或性质如何，无论它来自 CronJob 还是像此处示例中提供的那样显式创建。

查看代码并没有给我们带来任何明显的怀疑，表明可能发生的情况：https://github.com/kubernetes/kubernetes/blob/b5b0cc8bb88fb678c9b065c8da4f4c06a155a628/pkg/controller/job/job_controller.go https://github.com/kubernetes/kubernetes/blob/b5b0cc8bb88fb678c9b065c8da4f4c06a155a628/pkg/controller/job/job_controller.go

编辑：目前，我们的集群中有大约 15.000 个作业，其中大多数作业似乎都处于活动状态，并且仅来自一个命名空间。这会让我们认为我们正在达到某种极限或达到某种饱和……但我们无法通过任何可见数据来证实这一点。

这听起来与我在遇到行为不当的 Webhook 时遇到的情况非常相似。

如果您有大量作业都显示为活动状态，但没有出现 pod，或者 pod 需要很长时间才能出现，那么这表明准入 Webhook 干扰了 pod 创建。如果它是一个 cronjob 受影响的，你会得到一个“滚雪球”的效果：

写上去：https://blenderfox.com/2020/08/07/the-snowball-effect-in-kubernetes/ https://blenderfox.com/2020/08/07/the-snowball-effect-in-kubernetes/

库伯内特问题：https://github.com/kubernetes/kubernetes/issues/93783 https://github.com/kubernetes/kubernetes/issues/93783

至于解决您的问题，您需要找出是什么干扰了创建（在我们的例子中，我们有一个 up9 webhook 行为不当。禁用它允许创建 Pod）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Kubernetes

Kubernetes 作业被创建但不会立即执行的相关文章

如何使用 kubectl 了解有关先前发布版本的更多详细信息？

有给出的命令here https kubernetes io docs reference kubectl cheatsheet updating resources其中解释了如何使用执行回滚kubectl 列出以前的部署版本的是 kube
如何从清单文件（通常是清单文件与 kubectl 运行）使用 kubectl port-forward

我正在尝试在本地使用 Kubernetes 运行我的第一个应用程序或者我应该说 minikube 我有一个非常基本的 Web 服务器一个本地 docker 镜像和官方 mongodb 我想从 dockerhub 中提取镜像我并不是
如何将 kubectl 配置文件与 ~/.kube/config 合并？

有没有一个简单的kubectl命令采取kubeconfig文件包含 cluster context user 并将其合并到 kube config 文件作为附加上下文 Do this export KUBECONFIG kube conf
使用 Docker Desktop 调试本地部署到 Kubernetes 的应用程序的最佳方法是什么？

我有使用 Docker 开发相对复杂的应用程序的经验使用 Visual Studio 2019 调试应用程序非常容易我只是将 docker compose yaml 设置为启动应用程序并开始调试是否可以使用 Docker Deskto
容器中的 JVM 计算处理器错误？

最近我又做了一些研究偶然发现了这一点在向 OpenJDK 团队抱怨之前我想看看是否有其他人观察到这一点或者不同意我的结论因此众所周知 JVM 长期以来忽略了应用于 cgroup 的内存限制众所周知现在从 Java 8 更新某
如何从容器内运行 podman？

我想跑podman https podman io作为运行 CI CD 管道的容器但是我不断从 podman 容器中收到此错误 podman info ERRO 0000 overlay is not supported over ov
如何限制对 Kubernetes 服务的访问？

我正在尝试使用以下 yaml 创建服务正如您所看到的我正在尝试限制 10 0 0 0 8 范围内对该服务的访问 apiVersion v1 kind Service metadata name nginx service spec po
服务器找不到 pod 的 nginx_vts_server_requests_per_second 指标

我安装了kube prometheus 0 9 0 https github com prometheus operator kube prometheus 并且想要部署一个示例应用程序来测试 Prometheus 指标自动缩放并使用以下
Grafana 仪表板不显示 pod 名称，而是显示 pod_name

我已经在 kubernetes 集群上部署了应用程序并使用 prometheus 和 grafana 进行监控对于使用 Grafana 仪表板进行 kubernetes pod 监控 Kubernetes集群监控通过Prometheu
使用代理协议的 kubernetes nginx 入口最终出现损坏的标头

我尝试使用代理协议在 google 容器上设置 nginx 入口 nodeport 以便可以将真实 IP 转发到后端服务但最终导致标头损坏 2017 02 05 13 48 52 error 18 18 2 broken header H
ResourceVersion 和 Generation 之间有什么区别？

在 Kubernetes 对象元数据中有的概念resourceVersion and generation https github com kubernetes community blob master contributors de
如何在 Spring Boot 上针对 Openshift（基于云的 Kubernetes）部署的 Elasticsearch 实施带有自签名证书的 SSL

有谁知道如何在 Spring Boot 应用程序上使用 SSL 与以 https 形式部署在 Openshift 上的 ElasticSearch 连接我的 Spring Boot 应用程序中有一个 config java 如下所示 Co
如何在 kubernetes 上使多个 pod 相互通信

我是 Kubernetes 新手我正在尝试通过 microk8s 将应用程序部署到 Kubernetes 该应用程序包含Python Flask后端 Angular前端 Redis和MySQL数据库我将映像部署在多个 Pod 中状态显
container_memory_working_set_bytes 与 process_resident_memory_bytes 和total_rss 之间的关系

我希望了解以下关系容器内存工作集字节 vs 进程驻留内存字节 vs 总计RSS 容器内存 rss 文件映射以便更好地配备OOM可能性警报系统这似乎违背了我的理解这让我现在感到困惑如果容器 pod 运行单个进程执行用 Go 编写的编
添加istio出口网关后，Pod无法curl外部网站

我正在关注 Istio 文档 https istio io docs examples advanced egress egress gateway https istio io docs examples advanced egress
从 SCDF 执行任务时，数据库凭证作为部分作业参数公开

我有自定义构建的 SCDF 它在 Openshift 中构建为 docker 映像并在 server deployment yaml 中称为 docker 映像我使用 Oracle 数据库来存储任务元数据并且是此处的外部源我传递了
Kubectl 推出重启以实现有状态集

根据kubectl 文档 https kubernetes io docs reference generated kubectl kubectl commands rollout kubectl rollout restart适用于部署
GKE 上的 Ingress 仍处于“后端不健康”状态

Given 一个运行 nginx 的简单 pod 节点端口服务一个入口当拨打电话时pod从集群内部我们得到 200 响应代码当拨打电话时service从集群内部我们得到 200 响应代码入口显示为注释 ingress kuberne
无法使用带有服务帐户的令牌登录 Kubernetes 仪表板

我已经安装了 Kubernetes 仪表板并创建了具有适当权限的服务帐户用户但是由于某种原因使用令牌登录失败我看到以下日志 2018 08 17 14 26 06 2018 08 17T14 26 06Z Incoming HTTP
使用 JWT 的 Istio Origin 身份验证不起作用

我一直在使用 JWT 将身份验证策略应用于我的测试服务我已关注本指南 https istio io docs tasks security authn policy end user authentication它确实按预期工作了但是

随机推荐

在实例化时设置 PowerShell 类的属性

是否可以在实例化时定义 PowerShell 类的属性值而不使用构造函数假设有一个 cmdlet 将返回 Jon Snow 的当前状态活着或死亡我希望该 cmdlet 将该状态分配给我的类中的属性我可以使用构造函数来做到这一点但我
使用 Python 从 GIF 中提取关键帧

我想通过从 GIF 中提取 15 个帧来压缩 GIF 图像这些帧最好应该是不同的我正在使用 Python 和 Pillow 库但没有找到任何方法来获取 GIF 中的帧数枕头文档 https pillow readthedocs io
使用 KOIN 设置 WorkManager

我正在尝试设置工作管理器来完成一些工作但在初始化时遇到问题我正在使用 KOIN workmaanger dsl implementation org koin koin androidx workmanager 2 2 0 rc 4 我
Delphi 中的运算符重载

是否有可能在 Delphi 中重载类中的运算符我前段时间读过它只能用于记录但我发现对于类的信息也如下面的代码所示 type TMyClass class class operator Implicit a Integer TMyC
具有嵌套集合的类 - 如何填充嵌套类？

我对如何将一个类与另一个类的嵌套集合进行水合感到有点困惑我收到错误 AutoFixture 无法从 System Collections Generic IList 1 typename 创建实例我尝试过使用Fixture Regist
在Java 1.6中File.renameTo()在linux上是原子的吗？

正如标题所说在Java 1 6中File renameTo POSIX Linux 上的原子操作根据这个链接 http linux die net man 2 rename POSIX Linux 中的重命名操作是原子的但是它成立吗t
如何配置 Ninject 以便根据之前注入的实例注入正确的实例

我找不到合适的词语来表达我的问题所以我会让我的代码说话我有存储库 class Repository public Repository DbContext ctx 然后我有这个绑定 Bind
如何使我所需的包全局化，而不与composer-php发生冲突？

假设我有一个包裹sprout services我正在使用的另外 3 个软件包require 一旦第一个运行的包需要它它就会在全局空间中打开从我的应用程序中的任何地方我都可以做new SproutServices ServiceLoca
如何为 iPhone 应用程序创建多个主题/皮肤？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我已经准备好一个 iPhone 应用
PowerShell 中“@{}”的含义是什么

我在这里有一行脚本供审查我注意到带有值的变量声明 function readConfig Param string fileName config Get Content fileName Where Object like ForEac
如何删除codeigniter路径中的“index.php”

我该如何删除 index php 在 codeigniter 中心某处的每条路径中都突出我想要干净的非index php fied URLs 如果您使用 Apache 请将 htaccess 文件放入您的 Web 根目录中其中包含以下内
Api 无法在 onEachFeature React leaflet 函数内工作

我陷入了无法解决的问题我正在用反应传单制作等值线问题是我的API数据在highlightFeature函数中不起作用该函数将其分配给onEachFeature 当我控制台API数据时我在highlightFeature函数之外得到了
我怎样才能停止 jQuery Mobile 将样式应用到我的特定表单元素

是否可以指示 jQuery Mobile 不要设置我的输入框和提交按钮的样式我很擅长自定义 CSS jQuery 移动脚本将其自己的样式应用于我的所有元素我尝试的一种解决方法是覆盖我的自定义 CSS 中的这些元素还有其他功能可以让我执
泵送引理（常规语言）

我需要一些帮助来解决泵引理问题 L a b c a L lt b L lt c L 这是我到目前为止得到的 y uvw is the string from the pumping lemma 我让 y abbc n n 是泵引理的长度 y
从 R 调用 .NET/C#

我想使用仅在 NET 中可用的 R API 是否有可用于从 R 调用 NET C 代码的标准方法如果是这样我该怎么做本讨论的读者可能会考虑的另一个选择是rClr 包 https github com jmp75 rClr 我已经研究了
实体框架 CTP5，代码优先。可选的导航属性

我正在使用实体框架 CTP5 代码优先并且我有两个类 public class Order public int Id get set public decimal SomeOtherProperty1 get set navigatio
AWS Elastic Beanstalk NodeJS 和日志

我想将我的 NodeJS 项目从单个 EC2 迁移到 ElasticBeanstalk 在我当前的代码中我使用依赖项 log4js 在文件系统上创建日志文件在 EC2 上这可以创建但在 ElasticBeanstalk 中记录某些内
CLion 项目中所有错误的列表

CLion 2016 2 有助于检测您正在编辑的文件中的潜在错误这些错误可以在代码右侧的验证栏中看到但这只是一个文件有没有办法如工具窗口来获取整个项目或其特定部分中所有此类警告的列表如果它还列出了编译器的警告和错误那就加分了
如何在引导的 Firefox 扩展中实现 XPCOM 组件 (nsIContentPolicy)

我有一个 Firefox 的引导扩展现在我想实现 nsIContentPolicy XPCOM 组件我写了一个组件模块代码现在我想注册这个组件我想注册组件的原因是我想将我的组件添加到nsICategoryManager addCat
Kubernetes 作业被创建但不会立即执行

例如创建如下所示的就业机会 apiVersion batch v1 kind Job metadata name test job sebas spec template spec containers name pi image per

Kubernetes 作业被创建但不会立即执行

Kubernetes 作业被创建但不会立即执行 的相关文章

随机推荐

热门标签

Kubernetes 作业被创建但不会立即执行的相关文章