夜莺(Flashcat)V6监控(二):夜莺页面全网最详细功能介绍及案列

2023-10-26

目录

(一):如何把数据转发给多个时序库

(二):监控仪表盘的配置

(三):告警的配置管理 

          (1):告警规则

①: 基础配置

②:规则配置:分为Metric和Host机器类型的告警

③: 生成配置

④:通知配置

  (2): 内置规则

  (3) 屏蔽规则

  (4) 订阅规则

  (5) 活跃告警

  (6) 历史告警

(三):时序指标

(四):日志分析

(五):链路追踪

(六):基础设施

(七):告警自愈

(八):人员组织

(九):系统配置

(1)数据源:

(2)通知设置:

(十):对接邮箱告警案列配置

  (1) 创建告警规则

  (2)配置邮箱SMTP进行告警

  (3)触发告警


(一):如何把数据转发给多个时序库

        上一期讲了整个夜莺中心式搭建的单节点部署流程 ,这一期讲一下具体的用法,页面功能,夜莺的实际功能用法 

        首先说一下怎么把数据转发给多个时序库,比如victoria-metrics,Prometheus等等

    打开n9e的配置文件 (config.toml)文件然后找到[[Pushgw.Writers]]数据字段

    这里的Url就是时序库地址,现在图上的时序库地址是一个victoria-metrics的单机版的地址,如果要再添加一个Prometheus的时序库,这里只需要把这段[[Pushgw.Writers]]的整个数据字段复制粘贴一段,然后再添加Prometheus的地址

再重启一下n9e就添加完成了 

(这里再补充一下怎么添加多台主机监控)

    假如现在我有主机A 主机B ,我现在也想监控主机B,只需要把categraf的安装包放主机B解压,然后打开配置文件,把下面两个字段的url改为n9e的IP地址,然后启动就可以了

    并且如果你的这台主机B安装了victoria-metrics并且端口跟n9e的时序数据库的端口一样并且在n9e的web页面已经添加过同类型的时序数据库,他就会自动识别,直接在web可视化页面查看查询即可

 

(二):监控仪表盘的配置

    接下来就是逐一介绍夜莺的功能,从可视化仪表盘开始

   首先点击仪表盘的内置仪表盘进行配置添加监控收集的的数据,这里我们选linux主机监控,夜莺有很多可以监控的,分类一栏所有服务都可以做仪表盘的配置

 

   这里可以查看仪表盘大盘信息,第一个是用Prometheus Exporter收集的数据,第二个是Telegraf收集,第三个是Categraf收集的,因为我们配置监控的只是两台linux主机的信息 ,所以点击查看Telegraf和Gategraf的仪表盘就可以看见仪表盘的信息内容

 

 

 

 

 

 当然也可以自定义监控的数据或者是想要的仪表盘

 

(三):告警的配置管理

    告警规则分为几个小板块,告警规则,内置规则,屏蔽规则,订阅规则,活跃规则,历史告警

 

(1):告警规则

    告警规则顾名思义就是制定告警的规则,制定自己需要的规则来触发告警的条件来监控服务的状态,分为几大板块:基础配置,规则配置,生成配置,通知配置

①: 基础配置

规则名称: 自定义你的规则的名字

附加标签:这个标签是key=value的格式,你如果打了一个标签,比如servce=dream,那么在后续的规则处理中过滤

备注:告警规则的附加备注

②:规则配置:分为Metric和Host机器类型的告警

(1): Metirc类型的告警

关联数据源: 配置的数据源时序库数据库

告警条件:当服务主机到达这个条件就会发生告警警报

PromQL:用于Prometheus监控系统的查询语言,用于从Prometheus存储中检索和聚合指标数据。PromQL是一种非常灵活和可扩展的查询语言,可以支持各种不同类型的指标数据分析和检索。这里我们写一个触发条件,比如mem_available_percent < 50他就会触发报警

触发告警:这里有三个等级,最严重优先级最高的就是一级报警,依次往后。当然也可以添加其他的告警条件,这里是可以添加多个告警条件来触发告警

这里如果把级别限制打开后,那么高级别的告警就会直接抑制低级别的告警,不会重复报警打扰我们处理

(2): 机器类型告警

 机器告警有三个规则: 机器失联,机器集群失效,机器时间偏移

机器失联: 就是机器失去连接,连接状态出问题,或者机器死机情况

机器时间偏移: 机器时间时钟的监控,监控对时间有要求,如果时间偏移大了,会影响数据的同步查看

机器集群失联:设置集群失联比例,比如一个机器集群如果有百分之60的机器都失联了,那么就会发出告警。

机器的筛选:

业务组: 就是一个项目组一个组里面的机器,或者说一个项目组集群筛选

标签:在基础设施里面给我们监控的机器打上特定的标签来筛选

机器标识:就是具体的某一台主机筛选或多台主机筛选

机器类型告警这里也是可以进行多个告警条件的设置,级别压制

执行频率:告警多久执行一次

持续时长:满足告警条件多少秒后告警

③: 生成配置

生效的时间:什么时候给我发出告警

④:通知配置

 

通知媒介通知告警的方式,比如钉钉,emall,手机等等

告警接受组:哪个业务组接受这些告警

启动恢复通知:告警恢复了,是否通知

留观时长:如果告警出现的问题在留观时长没有到之前,偶尔的恢复正常,还是不算已经恢复告警,只有超过留观时长,运行的错误没有出现后,才会恢复正常,不然还是会告警。比如这里的留观时长我设置5分钟,如果我的cpu占有率突然到达了百分之80以上并且符合我的告警条件,如果在我处理告警错误的时间中,5分钟之内这个cpu占有率偶尔下降到了正常值,但是一会儿又升高了,那么这个告警就不会恢复,如果这个cpu占有率5分钟之后还是正常值,那么这个告警就恢复

重复通知间隔通知的间隔,告警通知一次后,60分钟后再给我发送告警通知

最大发送次数:给我发送通知的最大次数,不会一直给我们发。

回调地址:如果发生故障告警,那么他就把故障回调给一些故障处理平台进行处理,然后我们会收到告警的内容,比如我的磁盘满了,告警,我这里回调地址了一个平台,或者说就是夜莺的告警自愈平台,他就会去那个故障处理平台,收到告警内容,然后做相应的处理,清理磁盘等等

附加信息:分为预案链接,仪表盘链接,描述。预案连接就是如果发生此类的告警,我们事先做了一个预案来解决这个故障,那么就可以把那个预案的链接贴上。 仪表盘链接:故障的机器的仪表盘链接。描述:备注这个告警规则

(2): 内置规则

夜莺平台提供的写好的一些告警规则,如果你是新手或者嫌麻烦自己创建,可以直接在这里克隆规则到业务组进行规则设置

 这里也有多个收集器的告警规则的选择

克隆好告警规则后在告警规则里查看本业务组设置的告警规则并且启动

 

(3) 屏蔽规则

    当我们收到告警之后,在处理故障的时候,我们不想他一直给我们推送告警信息来打扰我们,那么我们就可以设置屏蔽规则来屏蔽这个告警,不让他打扰我们处理事件

假如我们有这样一条告警,我们想要他不再告警,屏蔽,直接点屏蔽设置

 然后就可以设置这个告警屏蔽的时间,屏蔽的标签,屏蔽的数据内容时间等

 还有一种屏蔽告警的场景就是,比如我们要部署或者升级一个服务,要更改主机的设置,或者会让主机进行关机等等,就是我们将要做的一些事件会触发这个告警条件,那么我们可以新建设置一个屏蔽告警的规则,来让他自动屏蔽掉这个告警,

屏蔽时长: 比如这里我们要升级变更服务1个小时 那么这里屏蔽时长就可以设置为1个小时

屏蔽事件标签:比如我们有几个规则打了标签,比如service=dream,那么在这里屏蔽规则声明屏蔽标签后,他就会把有这个标签的告警规则都屏蔽掉,屏蔽一个小时

 (4) 订阅规则

第一种应用场景:比如在一个公司,小王在运维部门,小李在开发部门。小王能就专门负责收集这些业务告警处理。有一天小李开发上线了一个自己业务叫Dream-stack,想要亲自查看获取这个业务的告警,但是这个告警规则什么的权限都是小王掌握的,并且配置告警规则的时候,告警接受组也是小王的运维团队,但是因为小王跟小李平时关系很好,这个时候小王就开启了夜莺的订阅规则,把只要是关于Dream-stack标签的告警规则的告警都转发告警接受组为小李,这个时候小李也能实时收到这个业务的告警信息了。

 

 这样就把这个Dream-stack的告警都订阅转发给了小李开发团队的人并且使用的媒介是用电子邮箱通知他们告警信息,并且也能更改告警的级别,回调地址,把关于Dream-stack的告警都转发订阅给了小李团队的业务组

第二种应用场景:在一家公司,小李在开发部门,小王在运维部门。有一天,上线的一个服务业务突然告警故障,并且那个告警的规则接受是小李团队,这时候小李收到告警后,就开始处理故障,结果越搞越砸,故障越来越多,而且一直没有解决,小李就焦虑,想着如果这个故障处理不了就把锅甩给小王,他想毕竟都是亲兄弟,小王工资高一点扣一点无所谓,然后小李就把这个订阅告警的订阅持续时长超过字段改为了10分钟,如果10分钟这个告警还没有解决,就把这个告警通过一级别的告警级别推送给小王背锅,

  (5) 活跃告警

 活跃告警就是告警产生后,我们能实时看有哪些告警没有恢复,还有那些故障还在持续

 

  (6) 历史告警

历史告警顾名思义就是总共发生多少条告警故障,方便我们总结查看

(三):时序指标

即时查询:就是查看像普罗米修斯一样输入PromQL语句来查询想要的数据

快捷视图:夜莺内置的一些PromQL语句你可以直接点击查询想要的数据字段。

(四):日志分析

对接日志分析组件,这里直接系统设置,数据源添加Elasticsearch的数据源,就可以在这里实时查看日志

 

(五):链路追踪

跟日志分析一样,先配置jaeger数据源,然后这里添加数据源直接就可以查看使用了

还可以支持拓扑分析

 

(六):基础设施

查看监控的主机有哪些,机器列表状态等等

(七):告警自愈

    告警自愈这个功能很强大,可以自动处理告警规则,可以自己创建一些自愈脚本来处理解决故障 我们创建一个自愈脚本,这个脚本可以自己根据实际环境编写,对运维来说很友好,因为可以使用shell脚本等等

 

 这里面大多数字段都有介绍,比如这里我们写了一个查看端口的命令脚本,来解决告警,如何使用这个告警自愈功能呢,我们现在打开我们的告警规则设置,并且要注意我们这里创建的自愈脚本的ID为2

打开告警规则配置,找到回调地址

 这些填写${ibex}/2 前面的${ibex}/是固定的格式,2是我们的自愈脚本的ID号,这样添加设置后,这个告警规则触发后,它就会自动执行我们的自愈脚本里面的任务,这里的${ibex}可以在后面的系统配置的通知设置里面自定义格式

(八):人员组织

这里就是一些用户的创建,业务组的创建,团队的创建,权限管理这几个模块

用户创建完成后,可以分配到指定的团队里面,团队也可以进去某一个业务组里面,然后权限管理就是对应创建不同的角色,每个角色分配不同的权限进行管理

角色是在创建用户的时候赋予的角色权限

 

 这里还可以把用户直接绑定到钉钉机器人,或者企业wx什么的进行发送告警推送

 

这里的联系方式的添加在下面的系统配置里面给大家介绍 

(九):系统配置

系统配置也是分为几块模块:数据源,通知设置,通知模板,单点登陆,告警引擎 ,系统版本

(1)数据源:

数据源就是用来配置添加一些数据源的接收信息,接收地址,常用的呢比如添加Prometheus的数据源,victor-metrics的数据源,Elasticsearch的日志分析等等,添加完成后,就可以通过夜莺的时序指标、日志分析或者链路追踪来实时查看监控

 (2)通知设置:

通知设置也分为几块小模块:

回调地址:就是前面告警规则里面配置的处理告警故障的平台,也可以做全局回调

通知脚本:配置自定义的一些通知媒介,比如手机通知告警,短信等等,也可以直接使用本地的文件路径

 

通知媒介:告警通知的方式,可以自定义进行添加手机,emall,钉钉等通知渠道

 

联系方式: 控制每个角色用户的联系方式,比如手机号,钉钉机器人,上面人员组织栏中的用户创建的联系方式就是在这里自定义添加机器人或者其他的联系手段。

 

SMTP:是用于邮箱告警的声明配置,对接的邮件网关

 

告警自愈:上面我们使用的告警规则里面的告警自愈的那个地址(${ibex}/2 )就是在这里申明配置自定义的。

(十):对接邮箱告警案列配置

这里我们做一个小小的实验来验证夜莺的告警推送和规则触发,我们使用QQ邮箱来做通知媒介来进行告警通知

(1) 创建告警规则

我们这里创建一个叫test的告警规则,告警配置是当机器失联断开超过5秒就触发报警,并且告警的通知媒介为email,回调地址为我们上面创建的自愈脚本ID为2的脚本

 

 (2)配置邮箱SMTP进行告警

 先打开qq邮箱的SMTP功能

接下来打开夜莺的SMTP设置配置

 格式为:

Host = "smtp.qq.com"    # 这里固定的
Port = 465              #  这里端口也要固定
User = "2369831769@qq.com"     # 这里为你qq邮箱地址
Pass = ""      # 这里为你刚刚qq邮箱开启smtp功能的密钥
From = "2369831769@qq.com"     # 这里也为你qq邮箱的地址
InsecureSkipVerify = true     # 默认不变
Batch = 5           # 默认不变

然后保存设置 

  (3)触发告警

这里我们本地有两台主机,我们告警的规则设置的是机器失联触发,这里我们去linux上把这台主机关掉,然后等5秒就回收到邮箱告警通知

 

第二次夜莺讲完了,搞了一晚上,可以说全网最详细的面板教程了,观众老爷们多点点赞转发一下这个国产之光夜莺!了解过的都说牛逼, 而且我觉得夜莺的优点就是能把多个数据监控都统一到夜莺n9e这一个监控模板上面查看,巨方便我们查看,而且告警自愈的功能也是十分的强大,后面还会继续持续更新这个系列,下一期讲讲mysql的监控还有一些其他的关于夜莺的功能,一周之内更新!♥

 

 

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

夜莺(Flashcat)V6监控(二):夜莺页面全网最详细功能介绍及案列 的相关文章

随机推荐

  • U-Net: Convolutional Networks for Biomedical Image Seg-mentation

    Abstract 深度网络的成功训练需要数千个带注释的训练样本 这是一个很大的共识 在本文中 我们提出了一种网络和训练策略 它依赖于数据增强的强大使用 以更有效地使用可用的带注释的样本 该体系结构由捕获上下文的收缩路径和支持精确本地化的对称
  • 纯源码程序的执行

    QT Creator本身是个IDE安装的时候根据自己需要配置的又有对应的编译器 因此编写普通的程序也不再话下 选择Non Qt Project工程 并在右侧根据自己的需要选择C 应用还是C应用 新工程中工程管理文件和代码如下 执行结果如下
  • 表与表之间的关系

    一 表关系的概念 现实生活中 实体与实体之间肯定是有关系的 如 学生和老师 学生和课程 部门和员工 每个人和自己的身份证号码等 在设计表的时候 就应该体现出来表与表之间的这种关系 表与表之间的三种关系 一对多 最常用的关系 如部门和员工 多
  • 在ubuntu下如何搜索文件?

    1 whereis 文件名 特点 快速 但是是模糊查找 例如 找 whereis mysql 它会把mysql mysql ini mysql 所在的目录都找出来 我一般的查找都用这条命令 2 find name 文件名 特点 准确 但速度
  • 从端到端打通模型端侧部署流程(MNN)

    从端到端打通模型端侧部署流程 MNN MNN框架 MNN的官方介绍 MNN的架构 问题解决 MNN使用样例 MNN部署 一般流程 创建会话 运行会话 获取输出 流程汇总 总结 MNN框架 MNN的官方介绍 官方文档 有疑问一定要先查这里 M
  • 西门子 SCL 语言 模拟量转换小例程

    软硬件平台 软件是博图 TIA v15 硬件是西门子300系列 PLC 简介 使用scl语言编写一个FC子程序 对模拟量进行处理 对模拟数据进行转换 详细介绍 添加新块 添加一个FC块 语言选择scl 添加变量 输入型变量5个 一个运算后输
  • 信息学奥赛一本通 1177:奇数单增序列

    题目链接 http ybt ssoier cn 8088 problem show php pid 1177 include
  • 二进制思想及其应用

    两个经典面试题 二进制思想 1 你让工人为你工作7天 回报是一根金条 这个金条平分成相连的7段 每工作1天的回报就是1段 每天结束的时候 工人都有可能会向你要金条 如果只允许你两次把金条弄断 你如何给你的工人付费 2 有1000个苹果 将它
  • VTM配置并使用VTM对YUV视频帧进行编解码(基于windows系统)

    一 下载安装VTM H 266 VCC 参考软件VTM下载网址 https vcgit hhi fraunhofer de jvet VVCSoftware VTM 这里我选择的Tags是VTM 9 0 根据自己想用的VTM版本进行选择 然
  • 基于遗传算法的柔性生产调度研究(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现 1 概述 摘要 针对传统作业车间调度存在加工设备功能
  • Linux的时间函数

    2023年7月19日 周三下午 我今天基于GitHub搭建了自己的博客网站 欢迎大家来我的个人博客网站阅读我的博客 巨龙之路的GitHub个人博客 julongzhilu github io 目录 time 函数原型 使用方法 ctime
  • IIC接口介绍

    IIC接口介绍 本章节主要介绍IIC接口工作原理 what 简单介绍 a 术语定义 b 基本概念 why 优点 how 过程 可能出现的问题 a 以下情况 会出现无应答信号 NACK 的情况 本章节主要介绍IIC接口工作原理 what 简单
  • [创业之路-54] :CTO的主要职责与工作内容

    概述 首席技术官 外语词全称chief technology officer 外语词缩略语CTO 是技术资源的行政管理者 其职责是制订有关技术的愿景和战略 把握总体技术方向 监督技术研究与发展 R D 的活动 并对技术选型和具体技术问题进行
  • iava redis工具类

    redis工具类 package com customerNoPlatform configs import java util List import java util Map import java util Objects impo
  • docker的安装和卸载

    docker的卸载 1 先停止docker服务 执行命令 systemctl stop docker 2 删除docker的安装包 先查找docker的安装包 执行命令 yum list installed grep docker 然后删除
  • Vue Quill富文本自定义上传音频/视频

    有时候项目中可能需要在富文本中上传音频 所以 环境 Asp Net Core 文件上传服务 本文不提供 框架很多 Vue 2 0 功能 自定义图片上传 自定义视频上传 自定义音频上传 效果 代码 从若依框架中把Editor index vu
  • 如何查看 gradle 插件的版本号和 gradle 的版本号的对应关系

    地址是 对应关系图
  • 如何实现自适应

    如何实现自适应 利用视口单位实现适配布局 响应式布局的实现依靠媒体查询 Media Queries 来实现 选取主流设备宽度尺寸作为断点针对性写额外的样式进行适配 但这样做会比较麻烦 只能在选取的几个主流设备尺寸下呈现完美适配 即使是通过
  • 英文常见姓氏列表

    写论文时需要统一参考文献格式 外国人的名字经常分不清姓和名 这里汇总了大部分的外国人姓 美国人 1 史密斯 Smith 这一姓氏源自一种职业 是从事金属加工业的男士的姓氏 smith本身有铁匠或锻工之意 金属加工是最初几个对专业能力有特定要
  • 夜莺(Flashcat)V6监控(二):夜莺页面全网最详细功能介绍及案列

    目录 一 如何把数据转发给多个时序库 二 监控仪表盘的配置 三 告警的配置管理 1 告警规则 基础配置 规则配置 分为Metric和Host机器类型的告警 生成配置 通知配置 2 内置规则 3 屏蔽规则 4 订阅规则 5 活跃告警 6 历史