K8s 失败rabbitmq-peer-discovery-k8s 集群

2024-01-11

我正在尝试使用 Rabbitmq-peer-discovery-k8s 插件在 Kubernetes 上启动 RabbitMQ 集群，并且我总是只有一个 pod 运行并准备就绪，但下一个总是失败。

我尝试对配置进行多次更改，这就是至少一个 Pod 运行的原因

---
apiVersion: v1
kind: ServiceAccount
metadata:
  name: rabbitmq 
  namespace: namespace-dev
---
kind: Role
apiVersion: rbac.authorization.k8s.io/v1beta1
metadata:
  name: endpoint-reader
  namespace: namespace-dev
rules:
- apiGroups: [""]
  resources: ["endpoints"]
  verbs: ["get"]
---
kind: RoleBinding
apiVersion: rbac.authorization.k8s.io/v1beta1
metadata:
  name: endpoint-reader
  namespace: namespace-dev
subjects:
- kind: ServiceAccount
  name: rabbitmq
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: Role
  name: endpoint-reader
---
apiVersion: v1
kind: PersistentVolume
metadata:
  name: "rabbitmq-data"
  labels:
    name: "rabbitmq-data"
    release: "rabbitmq-data"
    namespace: "namespace-dev"
spec:
  capacity:
    storage: 5Gi
  accessModes:
  - "ReadWriteMany"
  nfs:
    path: "/path/to/nfs"
    server: "xx.xx.xx.xx"
  persistentVolumeReclaimPolicy: Retain

---  
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: "rabbitmq-data-claim"
  namespace: "namespace-dev"
spec:
  accessModes:
    - ReadWriteMany
  resources:  
    requests:
      storage: 5Gi
  selector:
    matchLabels:
      release: rabbitmq-data
---
# headless service Used to access pods using hostname
kind: Service
apiVersion: v1
metadata:
  name: rabbitmq-headless
  namespace: namespace-dev
spec:
  clusterIP: None
  # publishNotReadyAddresses, when set to true, indicates that DNS implementations must publish the notReadyAddresses of subsets for the Endpoints associated with the Service.     The default value is false. The primary use case for setting this field is to use a StatefulSet's Headless Service to propagate SRV records for its Pods without respect to     their readiness for purpose of peer discovery. This field will replace the service.alpha.kubernetes.io/tolerate-unready-endpoints when that annotation is deprecated and all clients have been converted to use this field.
  # Since access to the Pod using DNS requires Pod and Headless service to be started before launch, publishNotReadyAddresses is set to true to prevent readinessProbe from finding DNS when the service is not started.
  publishNotReadyAddresses: true 
  ports: 
   - name: amqp
     port: 5672
   - name: http
     port: 15672
  selector:
    app: rabbitmq
---
# Used to expose the dashboard to the external network
kind: Service
apiVersion: v1
metadata:
  namespace: namespace-dev
  name: rabbitmq-service
spec:
  type: NodePort
  ports:
   - name: http
     protocol: TCP
     port: 15672
     targetPort: 15672
     nodePort: 31672
   - name: amqp
     protocol: TCP
     port: 5672
     targetPort: 5672
     nodePort: 30672
  selector:
    app: rabbitmq
---
apiVersion: v1
kind: ConfigMap
metadata:
  name: rabbitmq-config
  namespace: namespace-dev
data:
  enabled_plugins: |
      [rabbitmq_management,rabbitmq_peer_discovery_k8s].
  rabbitmq.conf: |
      cluster_formation.peer_discovery_backend  = rabbit_peer_discovery_k8s
      cluster_formation.k8s.host = kubernetes.default.svc.cluster.local
      cluster_formation.k8s.address_type = hostname
      cluster_formation.node_cleanup.interval = 10
      cluster_formation.node_cleanup.only_log_warning = true
      cluster_partition_handling = autoheal
      queue_master_locator=min-masters
      loopback_users.guest = false

      cluster_formation.randomized_startup_delay_range.min = 0
      cluster_formation.randomized_startup_delay_range.max = 2
      cluster_formation.k8s.service_name = rabbitmq-headless
      cluster_formation.k8s.hostname_suffix = .rabbitmq-headless.namespace-dev.svc.cluster.local
      vm_memory_high_watermark.absolute = 1.6GB
      disk_free_limit.absolute = 2GB

---
apiVersion: apps/v1
kind: StatefulSet
metadata:
  name: rabbitmq
  namespace: rabbitmq
spec:
  serviceName: rabbitmq-headless   # Must be the same as the name of the headless service, used for hostname propagation access pod
  selector:
    matchLabels:
      app: rabbitmq # In apps/v1, it needs to be the same as .spec.template.metadata.label for hostname propagation access pods, but not in apps/v1beta
  replicas: 3
  template:
    metadata:
      labels:
        app: rabbitmq  # In apps/v1, the same as .spec.selector.matchLabels
      # setting podAntiAffinity
      annotations:
        scheduler.alpha.kubernetes.io/affinity: >
            {
              "podAntiAffinity": {
                "requiredDuringSchedulingIgnoredDuringExecution": [{
                  "labelSelector": {
                    "matchExpressions": [{
                      "key": "app",
                      "operator": "In",
                      "values": ["rabbitmq"]
                    }]
                  },
                  "topologyKey": "kubernetes.io/hostname"
                }]
              }
            }
    spec:
      serviceAccountName: rabbitmq
      terminationGracePeriodSeconds: 10
      containers:        
      - name: rabbitmq
        image: rabbitmq:3.7.10
        resources:
          limits:
            cpu: "0.5"
            memory: 2Gi
          requests:
            cpu: "0.3"
            memory: 2Gi
        volumeMounts:
          - name: config-volume
            mountPath: /etc/rabbitmq
          - name: rabbitmq-data
            mountPath: /var/lib/rabbitmq/mnesia
        ports:
          - name: http
            protocol: TCP
            containerPort: 15672
          - name: amqp
            protocol: TCP
            containerPort: 5672
        livenessProbe:
          exec:
            command: ["rabbitmqctl", "status"]
          initialDelaySeconds: 60
          periodSeconds: 60
          timeoutSeconds: 5
        readinessProbe:
          exec:
            command: ["rabbitmqctl", "status"]
          initialDelaySeconds: 20
          periodSeconds: 60
          timeoutSeconds: 5
        imagePullPolicy: IfNotPresent
        env:
          - name: HOSTNAME
            valueFrom:
              fieldRef:
                fieldPath: metadata.name
          - name: RABBITMQ_USE_LONGNAME
            value: "true"
          - name: RABBITMQ_NODENAME
            value: "rabbit@$(HOSTNAME).rabbitmq-headless.namespace-dev.svc.cluster.local"
          # If service_name is set in ConfigMap, there is no need to set it again here.
          # - name: K8S_SERVICE_NAME
          #   value: "rabbitmq-headless"
          - name: RABBITMQ_ERLANG_COOKIE
            value: "mycookie" 
      volumes:
        - name: config-volume
          configMap:
            name: rabbitmq-config
            items:
            - key: rabbitmq.conf
              path: rabbitmq.conf
            - key: enabled_plugins
              path: enabled_plugins
        - name: rabbitmq-data
          persistentVolumeClaim:
            claimName: rabbitmq-data-claim

我只运行并准备好 1 个 pod，而不是 3 个副本

[admin@devsvr3 yaml]$ kubectl get pods
NAME                          READY   STATUS    RESTARTS   AGE
rabbitmq-0                    1/1     Running   0          2m2s
rabbitmq-1                    0/1     Running   1          43s

检查失败的吊舱我得到了这个。

[admin@devsvr3 yaml]$ kubectl logs rabbitmq-1

  ##  ##
  ##  ##      RabbitMQ 3.7.10. Copyright (C) 2007-2018 Pivotal Software, Inc.
  ##########  Licensed under the MPL.  See http://www.rabbitmq.com/
  ######  ##
  ##########  Logs: <stdout>

              Starting broker...
2019-02-06 21:09:03.303 [info] <0.211.0> 
 Starting RabbitMQ 3.7.10 on Erlang 21.2.3
 Copyright (C) 2007-2018 Pivotal Software, Inc.
 Licensed under the MPL.  See http://www.rabbitmq.com/
2019-02-06 21:09:03.315 [info] <0.211.0> 
 node           : rabbit@rabbitmq-1.rabbitmq-headless.namespace-dev.svc.cluster.local
 home dir       : /var/lib/rabbitmq
 config file(s) : /etc/rabbitmq/rabbitmq.conf
 cookie hash    : XhdCf8zpVJeJ0EHyaxszPg==
 log(s)         : <stdout>
 database dir   : /var/lib/rabbitmq/mnesia/rabbit@rabbitmq-1.rabbitmq-headless.namespace-dev.svc.cluster.local
2019-02-06 21:09:10.617 [error] <0.219.0> Unable to parse vm_memory_high_watermark value "1.6GB"
2019-02-06 21:09:10.617 [info] <0.219.0> Memory high watermark set to 103098 MiB (108106919116 bytes) of 257746 MiB (270267297792 bytes) total
2019-02-06 21:09:10.690 [info] <0.221.0> Enabling free disk space monitoring
2019-02-06 21:09:10.690 [info] <0.221.0> Disk free limit set to 2000MB
2019-02-06 21:09:10.698 [info] <0.224.0> Limiting to approx 1048476 file handles (943626 sockets)
2019-02-06 21:09:10.698 [info] <0.225.0> FHC read buffering:  OFF
2019-02-06 21:09:10.699 [info] <0.225.0> FHC write buffering: ON
2019-02-06 21:09:10.702 [info] <0.211.0> Node database directory at /var/lib/rabbitmq/mnesia/rabbit@rabbitmq-1.rabbitmq-headless.namespace-dev.svc.cluster.local is empty. Assuming we need to join an existing cluster or initialise from scratch...
2019-02-06 21:09:10.702 [info] <0.211.0> Configured peer discovery backend: rabbit_peer_discovery_k8s
2019-02-06 21:09:10.702 [info] <0.211.0> Will try to lock with peer discovery backend rabbit_peer_discovery_k8s
2019-02-06 21:09:10.702 [info] <0.211.0> Peer discovery backend does not support locking, falling back to randomized delay
2019-02-06 21:09:10.702 [info] <0.211.0> Peer discovery backend rabbit_peer_discovery_k8s does not support registration, skipping randomized startup delay.
2019-02-06 21:09:10.710 [info] <0.211.0> Failed to get nodes from k8s - {failed_connect,[{to_address,{"kubernetes.default.svc.cluster.local",443}},
                 {inet,[inet],nxdomain}]}
2019-02-06 21:09:10.711 [error] <0.210.0> CRASH REPORT Process <0.210.0> with 0 neighbours exited with reason: no case clause matching {error,"{failed_connect,[{to_address,{\"kubernetes.default.svc.cluster.local\",443}},\n                 {inet,[inet],nxdomain}]}"} in rabbit_mnesia:init_from_config/0 line 164 in application_master:init/4 line 138
2019-02-06 21:09:10.711 [info] <0.43.0> Application rabbit exited with reason: no case clause matching {error,"{failed_connect,[{to_address,{\"kubernetes.default.svc.cluster.local\",443}},\n                 {inet,[inet],nxdomain}]}"} in rabbit_mnesia:init_from_config/0 line 164
{"Kernel pid terminated",application_controller,"{application_start_failure,rabbit,{bad_return,{{rabbit,start,[normal,[]]},{'EXIT',{{case_clause,{error,\"{failed_connect,[{to_address,{\\"kubernetes.default.svc.cluster.local\\",443}},\n                 {inet,[inet],nxdomain}]}\"}},[{rabbit_mnesia,init_from_config,0,[{file,\"src/rabbit_mnesia.erl\"},{line,164}]},{rabbit_mnesia,init_with_lock,3,[{file,\"src/rabbit_mnesia.erl\"},{line,144}]},{rabbit_mnesia,init,0,[{file,\"src/rabbit_mnesia.erl\"},{line,111}]},{rabbit_boot_steps,'-run_step/2-lc$^1/1-1-',1,[{file,\"src/rabbit_boot_steps.erl\"},{line,49}]},{rabbit_boot_steps,run_step,2,[{file,\"src/rabbit_boot_steps.erl\"},{line,49}]},{rabbit_boot_steps,'-run_boot_steps/1-lc$^0/1-0-',1,[{file,\"src/rabbit_boot_steps.erl\"},{line,26}]},{rabbit_boot_steps,run_boot_steps,1,[{file,\"src/rabbit_boot_steps.erl\"},{line,26}]},{rabbit,start,2,[{file,\"src/rabbit.erl\"},{line,815}]}]}}}}}"}
Kernel pid terminated (application_controller) ({application_start_failure,rabbit,{bad_return,{{rabbit,start,[normal,[]]},{'EXIT',{{case_clause,{error,"{failed_connect,[{to_address,{\"kubernetes.defau

Crash dump is being written to: /var/log/rabbitmq/erl_crash.dump...done
[admin@devsvr3 yaml]$

我在这里做错了什么？

最后我通过在我的 pod 的 /etc/resolv.conf 中添加以下内容来修复它：

[my-rabbit-svc].[my-rabbitmq-namespace].svc.[cluster-name]

为了将其添加到我的 Pod 中，我在 StatefulSet 中使用了此设置：

dnsConfig:
    searches:
      - [my-rabbit-svc].[my-rabbitmq-namespace].svc.[cluster-name]

完整的文档here https://kubernetes.io/docs/concepts/services-networking/dns-pod-service/#pod-s-dns-config

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Kubernetes

rabbitmq

clustercomputing

K8s 失败rabbitmq-peer-discovery-k8s 集群的相关文章

您可以将 Docker 映像直接拉入 IBM Cloud Kubernetes 集群吗？

TL DR 抱歉如果这是基础知识我正在学习 Kubernetes 我尝试在 IBM Cloud 中创建 Kubernetes 部署但失败了该部署在我的本地 minikube 上运行良好但在 IBM Cloud 中失败我是否需要使
如何解决 https://kubernetes-charts.storage.googleapis.com”不是有效的图表存储库

我正在开发 helm 2 并尝试将 Tiller 部署为 pod gt helm init service account tiller 但我遇到以下错误错误初始化错误看起来像 https kubernetes charts stor
如何将我的 pod 日志存储在持久存储中？

我已经使用以下命令为我的 Pod 生成了日志kubectl logs pod name 但我想将这些日志保存在一个卷某种持久存储中因为如果 Pod 宕机容器日志将被清除有没有办法做到这一点我必须写某种脚本吗我已经阅读了很多答案
我可以将应用程序数据存储在 kubernetes 配置资源中吗？

我正在尝试为我的应用程序找到一个数据库对象存储该应用程序实际上是 ISTIO 网络路由 API 的包装器基本上简化了我的网络的 ISTIO 配置 Kubernetes k8s 自定义资源定义 CRD 似乎符合我的要求也喜欢 CRD
如何限制对 Kubernetes 服务的访问？

我正在尝试使用以下 yaml 创建服务正如您所看到的我正在尝试限制 10 0 0 0 8 范围内对该服务的访问 apiVersion v1 kind Service metadata name nginx service spec po
如何通过命令和api删除节点标签？

为节点添加标签 kubectl label nodes 10 xx xx xx key1 val1 如果我想删除label key1 val1 在节点 10 xx xx xx 上如何通过 kubectl 命令和 API 删除为节点创建标
服务器找不到 pod 的 nginx_vts_server_requests_per_second 指标

我安装了kube prometheus 0 9 0 https github com prometheus operator kube prometheus 并且想要部署一个示例应用程序来测试 Prometheus 指标自动缩放并使用以下
如何改进 kubernetes 集群容器中的随机数生成？

我发现运行的容器内的随机数生成存在一些问题在 kubernetes 集群中重复值可能是缺乏熵在容器内部或者它可能是更高级别的其他东西但是我想研究熵角我有几个问题很难找到答案 proc sys kernel random e
Grafana 仪表板不显示 pod 名称，而是显示 pod_name

我已经在 kubernetes 集群上部署了应用程序并使用 prometheus 和 grafana 进行监控对于使用 Grafana 仪表板进行 kubernetes pod 监控 Kubernetes集群监控通过Prometheu
ECONNREFUSED：无法连接到集群内默认端口上的 RabbitMQ pod

我的本地集群中有一个运行 RabbitMQ 的 pod 我已经将其配置为 apiVersion v1 kind Service metadata name service rabbitmq spec selector app service
允许出口流量流向单个 IP 地址

我正在编写 Kubernetes 集群的网络策略如何在出口策略中指定要授权的单个 IP 地址而不是授权整个 IP 地址范围一个基于的例子官方文档 https kubernetes io docs concepts services n
kubernetes helm：“与 pod 的连接丢失”和“传输正在关闭”错误

I run helm upgrade install修改我的 kubernetes 集群的状态有时会收到如下错误 22 24 34 StdErr E0126 17 24 28 472048 48084 portforward go 178
使用 Spring 与 RabbitMQ 集成

我正在为我们的一个应用程序开发消息传递界面该应用程序是一种服务旨在接受作业进行一些处理并返回结果实际上以文件的形式这个想法是使用 RabbitMQ 作为消息传递基础设施并使用 Spring AMQP 来处理协议特定的细节我不
Kubernetes 上的气流：Errno 13 - 权限被拒绝：'/opt/airflow/logs/scheduler

我在 Kubernetes 上运行 Airflow稳定舵图 https github com helm charts tree master stable airflow 我在 AWS 环境中运行它无论是否安装任何用于日志存储的外部卷都
如何不覆盖 Helm 模板中随机生成的秘密

我想在 Helm 模板中生成密码这很容易使用randAlphaNum功能但是当版本升级时密码将会更改有没有办法检查密码是否先前生成然后使用现有值像这样的事情 apiVersion v1 kind Secret metadata
集群式 WildFly 10 域消息传递

我有三台机器位于不同的网络作为主控作为节点1 作为节点2 在 as master 中我将 WildFly 作为域主机主服务器两个节点将 WildFly 作为域主机从服务器每个节点在 full ha 服务器组中启动一个实例从 as
从 SCDF 执行任务时，数据库凭证作为部分作业参数公开

我有自定义构建的 SCDF 它在 Openshift 中构建为 docker 映像并在 server deployment yaml 中称为 docker 映像我使用 Oracle 数据库来存储任务元数据并且是此处的外部源我传递了
Celery 广播 vs RabbitMQ 扇出

我最近一直在使用 Celery 但我不喜欢它它的配置很混乱过于复杂并且文档记录很少我想用 Celery 从单个生产者向多个消费者发送广播消息让我困惑的是 Celery 术语和底层传输 RabbitMQ 术语之间的差异在 Rabbi
如何使用 LoadBalancer 服务从 Azure Kubernetes 内部获取客户端 IP 地址

我正在获取节点 IP 地址而不是客户端 IP 地址是否可以使用 type 的服务获取客户端 IPLoadBalancer 或者我需要使用入口控制器吗 apiVersion v1 kind Service metadata name app
kubectl：在 WSL 终端中找不到

我按照以下说明在 Windows10 上安装了 WSL2 https learn microsoft com en us windows wsl install win10 https learn microsoft com en us w

随机推荐

RIP寄存器不改变

为什么当我继续使用c和内联汇编打印堆栈和指令指针寄存器时它们不会改变因为逻辑上其他程序同时运行所以它们应该在打印时不断改变操作系统和 CPU 一起工作为进程同时运行提供 CPU 切片实际上他们通过分配时间片来虚拟化 CPU
如何在多行中编写 f 字符串而不引入意外的空格？ [复制]

这个问题在这里已经有答案了考虑以下代码片段 name1 Nadya name2 Jim def print string string f name1 n name2 print string print string 产生 Nadya
Monodevelop - 仅使用 sudo 运行

我已经在我的 Debian amd64 jessie 构建上安装了 Mono 和 Monodevelop 并且我只能使用提升的权限运行 monodevelop 从 UI startesque 菜单启动 monodevelop 似乎什么也没发
带有位置参数的 Git 别名

基本上我正在尝试别名 git files 9fa3 执行命令 git diff name status 9fa3 9fa3 但 git 似乎没有将位置参数传递给别名命令我努力了 alias files git diff name stat
为什么 Apache 没有在 XAMPP 上启动 [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案直到昨天我的本地主机一切都很好但从昨天开始本地主机无法打开它说无法连接我尝试了很多次来启动Apache on XAMPP 但它说消息忙我
.NET .config 文件中 ConnectionString 元素的用途

在中存储和读取应用程序的连接字符串有什么区别
转移 PyPI 包的所有权

As per PEP 541 https www python org dev peps pep 0541 现在可以认领废弃的 PyPI 项目有人这样做过吗联系谁我尝试过dist utils 邮件列表 https mail pytho
Get-EventLog - 某些事件日志源缺少有效消息

我正在使用 get eventlog 提取和过滤系统事件日志数据我发现 get event log 无法正确返回与某些条目关联的消息这些条目通常显示在事件日志查看器中例如 get eventlog logname system sou
Python 模拟多个具有不同结果的调用

我希望能够对特定属性函数进行多次调用为每次连续调用返回不同的结果在下面的示例中我希望增量在第一次调用时返回 5 然后在第二次调用时返回 10 Ex import mock class A def init self self size
OpenCV 和 VS2010：致命错误 LNK1104：致命错误 LNK1104：无法打开文件“tbb_debug.lib”

我尝试按照本指南使用 Visual Studio C 2010 安装 OpenCV 使用 Windows 7 64 位在 Visual C 2010 Express 中安装 OpenCV 2 4 3 https stackoverflow
Django 独立脚本

我正在尝试从另一个 python 脚本访问我的 Django v1 10 应用程序数据库但遇到了一些问题这是我的文件和文件夹结构 store store init py settings py urls py wsgi py store
面向对象的设计建议

这是我的代码 class Soldier public Soldier const string name const Gun gun string getName private Gun gun string name class Gun
Android：SensorManager.getRotationMatrix 和 SensorManager.getOrientation() 的算法

要在 Android 中获取欧拉角例如俯仰角横滚角方位角的方向需要执行以下操作 SensorManager getRotationMatrix float R float I float 重力 float 地磁 SensorMan
跨站脚本注入

我正在测试一个网络应用程序我想写一个XSS将显示警报的脚本 Hello 我写的第一个脚本是
VBA Word - 带有初始文件名的另存为对话框

我有一个 vba 宏可以对当前文档进行一些更改并确定应该用于该文档的文件名如果该文档没有保存为该文件名但应该提示用户这样做但应该能够更改默认设置我发现两种可能性都不完美我需要这两种的混合第一种方法 Application D
如何使用Airflow获取并处理mysql记录？

我需要 1 run a select query on MYSQL DB and fetch the records 2 Records are processed by python script 我不确定我应该采取什么方式 xcom 是
根据使用的发电机设置 QTDIR

我正在尝试设置一个 CMake 项目该项目由多个静态库和一个依赖于 QT 的主要可执行文件组成我希望在运行 cmake 构建时能够选择 MinGW 或 MSVC 构建我最近了解到如果满足以下条件 CMake 的 QT 特定部分将自动
如何设置 NSMenuItem 操作的发送者？

Apple 文档说传递给 NSMenuItem 操作的发送者可以设置为某个自定义对象但我似乎不知道如何执行此操作有没有我在文档中没有看到的方法我不确定您指的是哪一份文档链接会有所帮助您可以使用 setRepresentedObje
在 SQL Server 中创建相关矩阵

我试图在 SQL Server 中获取相关矩阵并且我的数据按以下方式存储在表中 RptLOB1 RptLOB2 Correlation AE AE 1 Bail AE 0 35 Commercial Bail 0 25 Commercia
K8s 失败rabbitmq-peer-discovery-k8s 集群

我正在尝试使用 Rabbitmq peer discovery k8s 插件在 Kubernetes 上启动 RabbitMQ 集群并且我总是只有一个 pod 运行并准备就绪但下一个总是失败我尝试对配置进行多次更改这就是至少一个 P

K8s 失败rabbitmq-peer-discovery-k8s 集群

K8s 失败rabbitmq-peer-discovery-k8s 集群 的相关文章

随机推荐

热门标签

K8s 失败rabbitmq-peer-discovery-k8s 集群的相关文章