禁用对特定主机的警报，同时对所有其他主机发出警报

2024-04-23

我有数百台主机向普罗米修斯服务器报告。我的每个主机有很多出口商。我希望能够列出我不希望收到警报的主机列表。我仍然需要对这些主机进行普罗米修斯监控。

我尝试过匹配没有接收器的路线。这不起作用。我究竟做错了什么？或者说，我应该怎么做？

我的路线规则。我希望第一个匹配能够匹配可忽略的实例并停止解析。我仍然收到警报。 :-(

route:
  receiver: 'team-ops-mails'
  group_by: ['alertname', 'cluster']
  group_wait: 30s
  group_interval: 2m
  repeat_interval: 2h 
  routes:
  - match_re:
      instance: "int-pg-01:.*"
    continue: false
  - match:
      nopage: true
    receiver: team-mattermost
    repeat_interval: 24h
  - match:
      severity: hwerror
    receiver: hwerror-receiver
    repeat_interval: 24h
  - match:
      role: worker
    receiver: team-mattermost 
  - match:
      role: ven-entrance
    receiver: team-mattermost

报警规则 https://prometheus.io/docs/prometheus/latest/configuration/alerting_rules/允许您基于普罗米修斯表达式语言定义更改条件。

警报规则示例：

groups:
- name: example
  rules:
  - alert: HighRequestLatency
    expr: job:request_latency_seconds:mean5m{job="myjob"} > 0.5
    for: 10m
    labels:
      severity: page
    annotations:
      summary: High request latency

解决问题的一种可能方法是添加一个额外的标签，例如enableAlert在指标中。在定义警报规则时，您可以通过定义忽略某些主机的触发警报expr像下面这样：

- name: example
  rules:
  - alert: DemoAlert
    expr: <metric-name> {... ..., enableAlert = "true"} > ref_value

Set enableAlert = "false"对于那些您不想触发警报的情况。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Prometheus

prometheusalertmanager

禁用对特定主机的警报，同时对所有其他主机发出警报的相关文章

如何使用 prometheus Alertmanager 在工作时间之外抑制警报？

我们的应用程序依赖于仅在工作时间内活跃的数据源我们在普罗米修斯中设置了警报以便在溪流干涸时通知我们但是我们不希望在工作时间之外收到错误警报我跟着这个帖子 https medium com tom fawcett time of
使用 golang prometheus testutil 进行单元测试

我们可以断言使用以下方法注册和收集指标testutil CollectAndCount and testutil CollectAndCompare等等但是有没有办法通过指标名称和标签来收集指标如果是 CounterVec 以供参考ht
运行 pod 和节点的 Kubernetes prometheus 指标？

我已经设置了 prometheus 通过遵循 prometheus 来监控 kubernetes 指标文档 https github com prometheus docs blob master content docs operatin
如何在 Prometheus 或 Grafana 上编写“或”逻辑运算符

我需要编写一个使用我定义的任何不同作业的查询 job traefik OR job cadvisor OR job prometheus 是否可以编写逻辑二元运算符普罗米修斯有一个or逻辑二元运算符但您在这里问的是向量选择器您可以为此
按指标值过滤普罗米修斯结果，而不是按标签值

Because Prometheus topk 返回的结果超出预期 https stackoverflow com questions 38783424 prometheus topk returns more results than e
通过 Kafka 报告 (prometheus) 指标

我正在寻找一种将 Prometheus 与应用程序解耦的方法通过在中间放置 Kafka 来实现如下目标 Application metrics gt Kafka gt Prometheus 为了解决这个问题我有两个问题是否有任何 Jav
普罗米修斯动态metrics_path

Prometheus 允许我从 json 文件动态加载带有 file sd config 的目标如下所示 prometheus yaml job name kube metrics file sd configs files target
您是否尝试使用 kubernetes/configMap 将目录挂载到文件上（或反之亦然）？

我关注了这个帖子Kubernetes configMap 只有一个文件 https stackoverflow com questions 44325048 kubernetes configmap only one file将配置文件传递
如何使用gin作为服务器编写prometheus导出器指标

这是官方的prometheus golang client示例 package main import log net http github com prometheus client golang prometheus github c
按标签过滤和选择

如何通过选择和忽略标签来获取最新的指标例如以下查询 last over time application version site NYC instance Test id 1h 返回以下项目 application version i
如何在 Prometheus 中执行具有两个指标的查询？

我正在使用 Prometheus 查询 Apache Flink 的指标我想测量 Map 函数每秒输入和输出的记录数当我在 Prometheus 中查询两个不同的指标时图表仅显示其中之一 flink taskmanager job t
邮递员到普罗米修斯和马车“\r”？第 1 行中的文本格式解析错误：预期浮点数作为值，得到“1\r”

只是试图通过邮递员向普罗米修斯添加新的指标但是得到第 1 行中的文本格式解析错误预期浮点数作为值得到 1 r 度量就像 test metric 1 不带引号为什么会发生这种情况以及如何将其从邮递员的请求中删除原因在于之间的差异
Akka Stream 和 Kamon-Prometheus 不返回任何指标，但加载空页面

我尝试将 kamon prometheus 与 akka Stream 项目集成但在http 本地主机 9095 http localhost 9095 它加载一个空页面在控制台中我可以看到一条消息表明指标信息可在http 本地主机
使用 Helm 安装后 Prometheus 服务器处于挂起状态

我是 k8s 的新手正在尝试为 k8s 设置 prometheus 监控我用了 helm install 来设置普罗米修斯现在 two pods are still in pending state 普罗米修斯服务器普罗米修斯警报管
Prometheus 中的最小 scrape_interval 是多少？

我想知道普罗米修斯的最短时间是多少scrape interval范围根据普罗米修斯文档 https prometheus io docs prometheus latest configuration configuration 此参数的
如何为 Prometheus 检测 Java 应用程序代码指标

我正在尝试将 Java 应用程序的自定义值指标导出到 Prometheus 我读到可以使用 Push Gateway 来完成下面是我使用下一个方法的示例 static void executeBatchJob throws Excepti
为什么prometheus Operator无法启动

我正在尝试在全新的 k8s 集群中使用操作符创建 prometheus 我使用以下文件我正在创建一个命名空间监控应用这个文件就可以正常工作了 apiVersion apps v1beta2 kind Deployment metada
Prometheus（在 Docker 容器中）无法在主机上抓取目标

Prometheus 在 docker 容器内运行版本 18 09 2 内部版本 6247962 docker compose xml如下并且抓取目标已打开localhost 8000它是由 Python 3 脚本创建的失败的抓取目标
使用 Puppet 配置远程规则集

我正在尝试使普罗米修斯自动化node exporter和我的普罗米修斯服务器为了node exporter我已经编写了一个模块来安装所有需要的软件包设置 ipaddress基于facter还有更多现在我想确保收集到的信息 hostna
如何解决错误：java.lang.ClassNotFoundException：io.netty.util.concurrent.GenericFutureListener？

昨天我第一次尝试用 Java 制作 Prometheus 客户端从 Python 开始最后是 GoLang 是否找到示例 import io prometheus client Counter import io prometheus

随机推荐

Android WebViewClient url重定向（Android URL加载系统）

我尝试使用以下方法拦截 webview 请求 ShouldInterceptRequest 里面我用了HttpUrlConnection为了从服务器获取数据我将其设置为遵循重定向这对 webviewclient 是透明的这意味着当我返
HTML5 文本画布在文本宽度大于允许的最大宽度时旋转

朋友们我发现旋转文本画布对象有点棘手问题是我正在绘制一个图形但有时每个条形的宽度小于该条形的值所以我必须将值评定为 90 度在大多数情况下它都会起作用我正在做以下事情 a function x y text maxWid
何时在 struts2 中使用重定向和链接结果类型

在我的 struts 2 项目中当使用重定向操作时我丢失了所有值例如操作错误和字段错误我在网上查了一下发现有2个选项链条这个用得不多我不知道为什么 MessageStoreInterceptor 这需要放置在每个操作中那么
Python检测关键字

我正在做的应用程序执行以下操作 1 如果麦克风检测到一些噪音它就会开始录制音频直到检测不到噪音之后音频被录制到 wav 文件中 2 我必须检测上面的一些文字只有 5 到 10 个单词需要检测到目前为止我的代码只执行第一部分检
在 GAME 上使用 Spring 3 MVC + Maven 2 找不到映射

我在尝试将 Spring MVC 和 Maven 集成到 Google AppEngine Web 应用程序中时遇到了一个奇怪的问题这是我的 web xml
是否可以在不安装的情况下使用 MSBuild 扩展包？

有没有一种方法可以将 MSBuild 扩展包与本地引用一起使用而不需要运行安装程序换句话说您能否将目标存储在解决方案项目文件夹中以便每个开发人员都不必安装它你必须申报财产扩展任务路径在任务的导入语句之前例如看一下
如何避免 WCF 中的大量通信类？

我的理解是所有合约实现代码都必须位于单个类中显然该类可能会变得非常大我该如何避免这种情况我真的更喜欢让几个小班来完成与客户沟通的一部分而不是一个庞大的班级我能想到的唯一想法是使用由单个类分割实现的多个接口partial 但我认
使用 Django 会话存储登录用户

我正在创建一个以 REST 为中心的应用程序它将针对大多数特定于域的模型使用某种 NoSQL 数据存储对于我打算围绕 REST 数据框架构建的主站点我仍然希望对用户计费信息和域数据模型范围之外的其他元数据使用传统的关系数据库有人告
我可以从带时间戳的图像创建 VFR 视频吗？

首先我对图像制作视频的经验几乎为零我拥有的是一组带有 BMP 时间戳的图像我想从中生成视频由于时间戳的间隔不相等我不能简单地使用从图像创建恒定帧速率视频的软件一个可能的解决方案是在固定的时间间隔创建人造图像但如果我无法制作 V
我必须在哪里以及为什么必须放置“template”和“typename”关键字？

在模板中我必须在哪里以及为什么要放置typename and template关于从属名称到底什么是从属名称我有以下代码 template
如何在没有 Eclipse 的情况下构建 apk 或使用配置文件修改 apk 构建？

我想从 xml 文件构建一个具有一些大型配置的 apk 我想知道是否有任何方法可以控制 apk 的构建过程或者是否有任何方法可以根据我们的配置 xml 文件对我们的源进行一些修改从我们的源创建 apk 或者任何其他方式来构建apk文件
无法向 Kafka 发送大消息

我想从生产者向 Kafka 发送一条大消息因此我更改了以下属性代理服务器属性 replica fetch max bytes 317344026 message max bytes 317344026 max message byt
PHP return_var 代码？

我正在测试 php exec 命令 http php net exec http php net exec 我得到的结果代码是 127 我的 PHP 代码是
列表作为 python 类的成员，为什么它的内容在该类的所有实例之间共享？

我定义了一个类Listener并创建了一本字典Listener对象每个听众都有一个id来识别它们以及一个列表artists他们听 artists 添加一些东西到artists列表将其添加到的所有实例Listener类而不是引用的实例
将数据库导入 MATLAB 错误

我正在尝试将表导入到我的 MATLAB 工作区但它一直向我抛出错误 Undefined function or method fetch for input arguments of type struct 这是我尝试执行的代码 dyn
递归使用 scp 但排除某些文件夹

假设有一些具有这些结构的文件夹 bench1 1cpu p 0 image bench1 1cpu p 0 fl 1 bench1 1cpu p 0 fl 1 bench1 1cpu p 0 fl 1 bench1 1cpu p 0 fl
如何使用 PJSIP 为 iOS 客户端应用程序捕获并翻译其他语言的传入音频流？

我想在基于 VoIP 的 iOS 客户端应用程序中集成语言转换器该应用程序将根据用户选择将实时传入音频流翻译为其他选定的语言我正在使用 PjSip 开源库来支持 VoIP 呼叫对于语言翻译我想使用语音到文本和文本到语音开源库现在我
Windows 上的 PHP mail()：没有错误，电子邮件未发送

我目前正在尝试调试一个基于 Elgg 的网站我没有开发它我想直接从本地开发计算机 WinXP 发送电子邮件我正在使用 Apache 2 2 11 和 PHP 5 3 0 运行 WAMP 经过一番搜索后我遇到的最简单的解决方案是使用假
分阶段加载 spring 上下文

这是人们会问的奇怪问题之一为什么所以我将从我为什么要这样做开始然后讨论这个问题我想更好地控制 spring 上下文的加载方式例如我不想同时加载域和web api 这将使资源在其依赖项准备好之前可用也可能我需要检查某些东西的状态
禁用对特定主机的警报，同时对所有其他主机发出警报

我有数百台主机向普罗米修斯服务器报告我的每个主机有很多出口商我希望能够列出我不希望收到警报的主机列表我仍然需要对这些主机进行普罗米修斯监控我尝试过匹配没有接收器的路线这不起作用我究竟做错了什么或者说我应该怎么做我的路线规则

禁用对特定主机的警报，同时对所有其他主机发出警报

禁用对特定主机的警报，同时对所有其他主机发出警报 的相关文章

随机推荐

热门标签

禁用对特定主机的警报，同时对所有其他主机发出警报的相关文章