Prometheus AlertManager - 根据路由向不同客户端发送警报

2024-03-22

我有2个服务A and B我想监控。我还有 2 个不同的通知渠道X and Y形式为receivers在 AlertManager 配置文件中。

我想发送通知X如果服务A出现故障并想要通知Y如果服务B下跌降落。我怎样才能实现这个我的配置?

我的 AlertManager YAML 文件是:

route:
  receiver: X

receivers:
  - name: X
    email_configs:

  - name: Y
    email_configs:

And alert.rule文件是:

groups:

- name: A
  rules:
    - alert: A_down
      expr: expression
      for: 1m
      labels:
         severity: critical
      annotations:
         summary: "A is down"

- name: B
  rules:
    - alert: B_down
      expr: expression
      for: 1m
      labels:
        severity: warning
      annotations:
        summary: "B is down"

配置应该大致如下(未经测试):

    route:
      group_wait: 30s
      group_interval: 5m
      repeat_interval: 2h

      receiver: 'default-receiver'

      routes:
      - match:
          alertname: A_down
        receiver: X
      - match:
          alertname: B_down
        receiver: Y

The idea is, that each [`route`](https://prometheus.io/docs/alerting/configuration/#%3Croute%3E) field can has a `routes` field, where you can put a different config, that gets enabled if the labels in `match` match the condition.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Prometheus AlertManager - 根据路由向不同客户端发送警报 的相关文章

  • 检查 Android 中的 VPN 连接是否处于活动状态?

    我的非 root Android 4 4 设备上有一个第三方 VPN 应用程序 并且想要编写一个后台服务来监视 VPN 连接并在 VPN 连接已断开时提醒用户 有没有办法做到这一点 我找不到任何使用 VPNService API 的方法 感
  • 带有正则表达式的标签-普罗米修斯

    我正在尝试使用正则表达式添加新标签 名称实例是pr na01 na02 A我试图只得到pr na01 所以我这样做了 source labels meta ec2 tag Name regex target label test repla
  • Prometheus 查询在一段时间内计算唯一标签

    我需要计算给定时间范围内普罗米修斯指标的唯一标签集的数量 例如 过去 7 天内的某个时刻有多少个唯一标签集的值为 1 我调查过使用count and count over time but count仅对即时向量进行操作 这意味着我可以及时
  • Delphi XE中如何监控目录中的文件? [复制]

    这个问题在这里已经有答案了 可能的重复 文件更新时的 Delphi 通知 https stackoverflow com questions 3418562 delphi notification when a file gets upda
  • tee 和 script 本质上是等价的吗?

    在我想要捕捉的上下文中stdout文件中进程的一个 但仍希望在终端中显示此输出 我可以选择script and tee 在这种情况下 这些工具本质上是等效的 还是有一个 可能是微妙的 理由来选择其中一个而不是另一个 节目script and
  • 每次出现错误时使用 prometheus 创建警报

    我是普罗米修斯和警报系统的新手 我开发了一个微服务并添加了指标代码 以便在出现错误时获取增量总数 现在我正在尝试创建一个警报 以便每当错误增加时 它应该标记出来并发送邮件 但我无法针对这种情况形成正确的查询 我使用了诸如 error tot
  • 进程监控 CreateProcessNotifyRoutineEx

    我正在开发一个用于监视进程创建的驱动程序 我编写了一个简单的代码来完成它 我用PsSetCreateProcessNotifyRoutineEx 但这行不通 我完全遵循微软的帮助在这个链接上 http msdn microsoft com
  • Prometheus 中的最小 scrape_interval 是多少?

    我想知道普罗米修斯的最短时间是多少scrape interval范围 根据普罗米修斯文档 https prometheus io docs prometheus latest configuration configuration 此参数的
  • 打开查询日志文件时出错” file=/prometheus/queries.active err="open /prometheus/queries.active: 权限被拒绝

    尝试使用非root用户运行prometheus并尝试了许多建议后https github com prometheus prometheus issues 5976 https github com prometheus prometheu
  • 监控显卡使用情况[关闭]

    Closed 这个问题是与编程或软件开发无关 help closed questions 目前不接受答案 当我运行某个应用程序时 如何监控显卡的使用情况 我想查看我的应用程序使用 GPU 的情况 如果您在 Visual Studio 201
  • Prometheus AlertManager - 根据路由向不同客户端发送警报

    我有2个服务A and B我想监控 我还有 2 个不同的通知渠道X and Y形式为receivers在 AlertManager 配置文件中 我想发送通知X如果服务A出现故障并想要通知Y如果服务B下跌降落 我怎样才能实现这个我的配置 我的
  • Kubernetes Prometheus CrashLoopBackOff / OOMKilled 谜题

    我定期看到容器状态 已终止 OOMKilled 退出代码 137 但调度到内存充足的节点 k get statefulset n metrics NAME READY AGE prometheus 0 1 232d k get po n m
  • 如何在 SQL Server 2016+ 中使用查询存储查找哪个程序或用户执行了查询

    启用查询存储后 如何查找执行查询的人 例如 在跟踪收集的情况下 有 TRC 文件将获取主机名和程序详细信息以供查询 而在扩展事件的情况下 我们有 XEL 文件将获取主机名和程序详细信息 我们尝试了代码 SELECT des program
  • 如果过去 60 分钟的交易量小于 x,如何在 Seyren with Graphite 中发出警报?

    我正在使用 Graphite Statsd 带有 Python 客户端 从 Web 应用程序收集自定义指标 成功交易的计数器 假设计数器是stats transactions count 还有一个每秒速率指标stats transactio
  • Prometheus - 监控容器中的命令输出

    我需要监控 eks 集群中具有 nfs 挂载路径的许多旧容器 使用 nfs client helm 图表映射容器 i 中的 nfs 目录 我需要监视我的安装路径何时由于某种原因丢失 而我发现做到这一点的唯一方法是在容器中执行命令 bin b
  • Spark流吞吐量监控

    有没有办法监控 Spark 集群的输入和输出吞吐量 以确保集群不会被传入数据淹没和溢出 就我而言 我在 AWS EC2 上设置了 Spark 集群 所以我正在考虑使用AWS 云观察来监控网络输入 and 网络输出对于集群中的每个节点 但我的
  • 获取 Prometheus 中两个自定义时间戳之间的增量

    我有一个名为的普罗米修斯指标device number 我想要的是显示现在与一天 一周 一个月等之前的价值差异 这意味着减去具有两个不同时间戳的两个值 环顾四周 我没有找到任何关于如何执行此操作的有用文档 我想做但不起作用的是 sum de
  • PromQL:查询警报是否被静音

    我已成功消除了当前已关闭节点的警报 并且在我们有时间物理替换它之前会持续一段时间 虽然我认为沉默会阻止警报在 Slack 通道中重新出现 但我也想在我们在 Prometheus 之上运行的 Grafana 仪表板上删除它 这是对 grafa
  • Inotify linux 监视子目录

    是否可以以这种模式监视目录 storage data usernames Download gt storage data Download 我需要监视每个用户的下载文件夹中是否进行了更改 也许我需要创建所有路径的列表 将其放入数组中 并在
  • 将矩阵与 SUM 相乘

    我想将一个指标与另一个指标之和的结果相乘 我想尝试做的事情 MeticOne SUM MetricTwo Thanks 假设你有MetricOne带标签id and name 你有MetricTwo还有标签id and name 然后你就得

随机推荐

  • 通过 SOCKS 代理使用 Hadoop?

    所以我们的Hadoop集群运行在一些节点上 并且只能从这些节点访问 您可以通过 SSH 连接到它们并完成您的工作 因为这很烦人 但 可以理解 没有人会尝试配置访问控制 以便某些人可以从外部使用它 我正在尝试下一个最好的方法 即使用 SSH
  • Javascript - 如何查找希伯来语?

    我正在尝试查找字符串是否以 RTL 语言 希伯来语开头 第一个字母 有任何想法吗 这将找到编码在以下内容中的希伯来字母Hebrew http www alanwood net unicode hebrew htmlUnicode 代码点范围
  • 对 numpy.c_ 文档和示例代码感到困惑

    我多次阅读有关 numpy c 的文档 但仍然感到困惑 据说 将切片对象转换为沿第二轴的串联 在下面的文档中 谁能在下面的示例中澄清什么是切片对象 什么是第二轴 我看到它们都是一维的 并且混淆了第二轴的来源 在 Windows 上使用 Py
  • PHP $_SERVER['SERVER_NAME'] 正确使用

    菜鸟问题在这里 我正在使用 php 构建一个交互式网站 并且我决定制作一个交互式菜单 嗯 我的菜单包含一个名为 menu php 的文件 我不知道为什么 但是当我点击这个链接时 它看起来像这样 http localhost mysite 本
  • SEGMENT_START("text-segment", 0x400000) 代表什么?

    我正在学习可执行二进制文件的布局 我的最终目标是分析特定可执行文件中可以重构 在其源代码中 以减少编译输出大小的内容 我一直在使用https www embeddedlated com showarticle 900 php https w
  • Django 检查相关对象是否存在错误:RelatedObjectDoesNotExist

    我有一个方法has related object在我的模型中需要检查相关对象是否存在 class Business base name models CharField max length 100 blank True null True
  • cocos2d v3 在应用程序使用过程中重新定向屏幕

    所以在 cocos2d 中 我相信我使用的是 v2 1 我这样做是为了锁定和设置方向 AppDelegate delegate AppDelegate UIApplication sharedApplication delegate con
  • 条目 Xamarin Forms PCL 上的边框半径

    有没有办法在 Xamarin 的 XAML 中的条目上设置边框半径 或者使用自定义渲染器或其他东西 到目前为止我尝试过的所有方法都没有效果 但对于我的应用程序来说 如果我有圆形边框会更好 预先感谢您的答复 PS 我查过了这个帖子 https
  • 如何“取消观看”表达式

    假设我有一个带有大数组的 ng repeat 当 ng repeat 运行时 它会将该数组的每个元素添加到一个隔离的作用域中 并将数组本身包含在一个作用域中 这意味着 digest 检查整个数组的更改 最重要的是 它检查每个单独的元素在该数
  • 如何将 tf.metrics.__ 与估计器模型预测输出一起使用

    我尝试遵循tensorflow API 1 4文档来实现我在学习过程中所需要的 我现在在这个阶段 可以生成一个预测对象 例如 classifier tf estimator DNNClassifier feature columns fea
  • JSF GAE:托管 bean 方法中的值更新问题

    我有以下一段简单的代码h outputText指向一个int and a p commandLink设置一个值
  • 使用backbone.marionette和requireJs的Web应用程序的循环依赖关系

    我处于以下情况 我正在使用 requireJs 加载模块 并且不想使用全局变量 main js 负责加载路由器 然后路由器加载应用程序 应用程序加载几个子应用程序 一切都初始化后 子应用程序需要router制作router navigate
  • 从扩展程序读取和写入 iOS 应用程序文档文件夹

    我正在开发一个具有操作扩展的 Objective C iOS 应用程序 加载操作扩展时 我需要从主机应用程序的文档目录中读取一些文件 然后将文件写入主机应用程序文档目录 我创建了一个应用程序组 并且应用程序和扩展程序都设置了该应用程序组 但
  • 使用参数从 PowerShell 调用 Excel 宏

    使用 Powershell 从脚本调用 Excel 宏相当容易 例如使用如下脚本this http blogs technet com b heyscriptingguy archive 2009 01 13 how do i run an
  • 仅在悬停时显示 d3 节点文本

    我试图仅在鼠标悬停时显示节点文本 当我将鼠标悬停在节点上时 svg 圆的不透明度发生变化 但仅显示第一个节点的文本 我发现这是因为我如何使用 select 元素 但我不知道如何为我悬停的节点提取正确的文本 这是我目前所拥有的 node ap
  • 如何在 Spotfire 分析中链接 CSS 样式表?

    我可以在 Spotfire 页面中创建 Javascript 但我不知道如何添加 CSS 文件 请问有什么建议吗 这并未得到 Spotfire 工程部门的批准 但您可以使用 JQuery 注入托管在运行 Spotfire 的计算机 即您的本
  • 什么是感知均匀色彩空间以及 LAB 色彩空间如何实现感知均匀? [关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 什么是感知均匀的色彩空间 Lab 色彩空间如何在感知上一致且与设备无关 slhck 是正确的 感知均匀的色彩空间确保两种颜色之间的差异 人
  • 使用 FileHelper 设置属性格式

    文件助手 http www filehelpers com 有一个很好的字段日期转换器 FieldConverter ConverterKind Date MM dd yyyy public DateTime MyDate 但 FieldC
  • iPhone 模拟器上的日历

    如何在 iPhone 模拟器上访问日历 我正在使用 Titanium 制作一个应用程序 并且创建了一个事件 它应该有效 现在我想测试它是否正确保存在日历中 谁能告诉我如何打开它 Thanks Tjekkles 狮子更新 要进入用户库文件夹
  • Prometheus AlertManager - 根据路由向不同客户端发送警报

    我有2个服务A and B我想监控 我还有 2 个不同的通知渠道X and Y形式为receivers在 AlertManager 配置文件中 我想发送通知X如果服务A出现故障并想要通知Y如果服务B下跌降落 我怎样才能实现这个我的配置 我的