分布式监控系统——Zabbix(3)配置

2023-11-07

分布式监控系统——Zabbix(3)配置

一、监控项

1.定义一个不带参数的监控项

更新即可,事实上,需要关注的指标有很多种,一一添加进来即可。以上定义的监控项是很简单的,制定一个key即可,但是有些监控项是带有参数的,这样一来,监控项就更有灵活性。

2.定义一个带参数的监控项

  • []就是需要参数的意思,里面的值即为参数。
  • <>为不可省略的。

例:if表示是接口名;表示是哪种模式,包括但不限于:packets(包)、bytes(字节)、errors(错误)、dropped(丢包)、overuns等等(上述内容通过ifconfig查看)。

设置一个监控值:

通过命令行来查看:

查看网页的显示情况:

3.删除监控项

如果有一个监控项,用不上了,就可以删除掉。但是如果你直接删除的话,默认数据是会留下的,所以要先清楚数据,然后再删除,具体步骤如下:

4.监控项存储的值

对于监控项的值,老一点的版本只有以下三种方式:

  1. AS is:不对数据做任何处理(存储为原始值)。
  2. Delta:(simple change变化),本次采样减去前一次采样的值的结果。
  3. Delta:(speed per second速率),本次采样减去前一次采样的值,再除以经过的时长。

在3.4版本之后有了更多的表现形式:

二、触发器

1.简介

当采集的值定义完了以后,就可以来定义触发器了。触发器的定义是:界定某特定的item采集到的数据的非合理区间或非合理状态。通常为逻辑表达式。逻辑表达式(阈值):通常用于定义数据的不合理区间,其结果如下:

  • OK(不符合条件):正常状态——》较老的zabbix版本叫FALSE。
  • PROBLEM(符合条件):非正常状态——》较老的zabbix版本叫TRUE。

评定采样数值是否为合理区间的比较稳妥的方法是一一根据最后N次的平均值来判定结果;这个最后N次通常有两种定义方式:

  • 最近N分钟所得结果的平均值
  • 最近N次所得结果的平均值

触发器存在可调用的函数:

函数 描述
nodata() 是否采集到数据,采集不到则为异常
last() 最近几次
date() 时间,返回当前时间,格式YYYYMMDD
time() 返回当前时间,格式HHMMSS
now() 返回距离Epoch(1970年1月1日00:00:00UTC)时间的秒数
dayofmonth() 返回当前是本月的第几天

注:能用数值保存的就不要使用字符串

2.触发器表达式

基本的触发器表达式格式如下所示

{<server>:<key>.<function>(<parameter>)}<operator><constant>
  • server:主机名称

  • key:主机上关系的响应监控项的key

  • function:评估采集到的数据是否在合理范围内时所使用的函数,其评估过程可以根据采集的数据,当前时间及其他因素进行

  • 目前触发器所支持的函数有avg、change、dayofweek、delta、diff、iregexp、last、max、min、nodata、now、sum等

  • parameter:函数参数;大多数数值函数可以接受秒数为其参数,而如果在数值参数之前使用“#”作为前缀,则表示为最近几次的数值,如sum(300)表示300秒内所有取值之和,而sum(#10)则表示最近10次取值之和

  • 此外,avg、count、last、min和max还支持使用第二个参数,用于完成时间限定;例如max(1h,7d)将返回一周之前的最大值

  • 表达式所支持的运算符及其如下图所示:

3.定义一个触发器

查看一下aaa监控项的值,并以其为标准确定我们的非正常的值:

添加成功后再去最新数据里面查看图形,可以看到里面就有了一根线,就是定义的值:

超过线的即为异常状态,看起来非常直观。现在即使超过了这根线,也仅仅会产生一个触发器时间而不会做其他任何事。因此,需要去定义一个动作(action)

4.触发器的依赖关系

触发器彼此之间可能会存在依赖关系的,一旦某一个触发器被触发了,那么依赖之歌触发器的其余触发器都不需要再报警。

多台主机是通过交换机的网络连接来实现被监控的。如果交换机出了故障,我们的主机自然也无法继续被监控,如果此时,所有主机统统报警,要解决这样的问题,就是定义触发器之间的依赖关系,当交换机挂掉,只有自己报警就可以了,其他的主机就不要再报警了。这样也更易于我们判断真正故障所在。

注意:目前zabbix不能够直接定义主机间的依赖关系,其依赖关系仅能通过触发器来定义。

定义一个依赖关系:打开任意一个触发器,上面就有依赖关系,我们进行定义即可:

触发器可以有多级依赖关系,比如:

5.定义动作(action)

1.简介

  • 需要去基于一个对应的事件为条件来指明该做什么事,一般就是执行远程命令或者发警报。
  • 有一个告警升级的机制,所以,当发现问题的时候,一般是先执行一个远程操作命令,如果能够解决问题,就会发一个恢复操作的讯息给接收人,如果问题依然存在,则会执行发警报的操作,一般默认的警报接收人是当前系统中有的zabbix用户,所以当有人需要收到警报操作的话,我们则需要把它加入我们的定义之中。
  • 每一个用户也应该有一个接收告警信息的方式,即媒介,就像我们接收短信需要有手机号一样。
  • 每一个监控主机,能够传播告警信息的媒介有很多种,就算我们的每一种大的媒介,能够定义出来的实施媒介也有很多种,而对于一个媒介来说,每一个用户都有一个统一的或者不同的接收告警信息的端点,我们称之为目标地或者目的地。

综上为了能够发告警信息

  • 第一,我们要事先定义一个媒介
  • 第二,还要定义这个媒介上用户接收信息的端点(当然,在用户上,也称之为用户的媒介)。

系统内建的媒介类型:

这只是基本的媒介类型,里面还有更多的细分,已Email为例:

而同一个类型也可以定义多个,以Email为例,可以定义一个腾讯的服务器,一个网易的服务器等等。

2.定义一个媒介(media)

以Email为例:

定义后更新就可以了,媒介定义好了还需要让用户接收到邮件:

  • 进入管理——》用户——》Admin——》报警媒介
  • 添加一条进来:

PS:一个用户可以添加多个接收的媒介类型。

3.定义一个动作(action)

动作是在某些特定条件下触发的,比如:某个触发器被触发了,就会触发动作。现在基于redis来定义一个动作。

#在agent端安装并启动redis
[root@node1 ~]# yum -y install redis
[root@node1 ~]# systemctl start redis
[root@node1 ~]# ss -nutlp|grep redis

定义监控项:配置——主机——node1——监控项——创建监控项

填写完毕后添加即可,此时可以查看值:

定义触发器:

手动关闭redis服务来检测一下:

[root@node1 ~]# systemctl stop redis

创建动作:

需要在虚拟机上进行两项操作:

  • 修改sudo配置文件使zabbix用户能够临时拥有管理员权限
  • 修改zabbix配置文件使其允许接收远程命令
[root@node1 ~]# visudo
     91 ## Allow root to run any commands anywhere
     92 root    ALL=(ALL)       ALL
     93 zabbix  ALL=(ALL)       NOPASSWD:ALL	#添加此行
[root@node1 ~]# vim /etc/zabbix/zabbix_agentd.conf 
EnableRemoteCommands=1							#73行取消注释改为1。允许接收远程命令
LogRemoteCommands=1								#82行取消注释改为1。把接收的远程命令记入日志
[root@node1 ~]# systemctl restart zabbix-agent.service

添加了第一步需要做的事情,需要重启服务,如果重启不成功怎么办呢?就需要来添加第二步:

测试(关闭redis):

如上图,提示警告,再看redis服务又被远程命令拉了起来:

END

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

分布式监控系统——Zabbix(3)配置 的相关文章

  • 运维的本质是什么?阿里“无人化”智能运维平台的演进

    差不多在两年前 阿里内部出现了很多运维中台 研发中台等等 那有没有后台呢 不好意思 我们只有中台 没有后台 会在中台上构建与业务相关的各个前台 目前阿里的业务几乎覆盖了所有行业 有着很多业务线 如果业务线的前台到中台全部都是我们自己去建设
  • 门禁管理:我才知道这个技术,可以如此高效!

    随着社会的发展和科技的进步 门禁监控技术在各类场所得到了广泛的应用 门禁监控系统不仅仅是简单的出入口管理 更是对安全和隐私的重要保障 客户案例 企业办公大楼 在现代企业办公环境中 对于办公大楼的安全管理显得尤为重要 通过部署泛地缘科技推出的
  • 服务器3M固定带宽什么意思?够用吗?

    云服务器3M固定带宽是什么意思 速度快吗 3M固定带宽是指云服务器的公网带宽 用于在外网提供服务的 3M带宽的下载速度是384KB 秒 上传速度是1280KB 秒 对于个人博客或流量不多的企业官网速度还是挺快的 阿里云服务器网aliyunf
  • 制作本地yum仓库

    root 192 cd etc yum repos d root 192 yum repos d ls redhat repo root 192 yum repos d vim rpm repo base name baseos gpgch
  • Linux ls命令

    目录 一 配置项 1 1 ls l 1 2 ls a 1 3 ls lrt 1 4 ls ld 二 案例 2 1 查看指定文件夹下文件的数量
  • 消耗服务器带宽的因素有哪些

    消耗 服务器 带宽的因素有 1 网站布局更改使网站页面大小增加 用户获取数据时会加大带宽的消耗 2 网站访客增加使浏览页面数据增加 从而加大对带宽的消耗 3 网页数量增加导致服务器带宽消耗加快 4 突然引起流量峰值 导致带宽使用量增加 5
  • TeslaMate特斯拉神器本地Docker部署实现无公网远程访问

    文章目录 1 Docker部署TeslaMate 2 本地访问TeslaMate 3 Linux安装Cpolar 4 配置TeslaMate公网地址 5 远程访问TeslaMate 6 固定TeslaMate公网地址
  • Spark 中 BroadCast 导致的内存溢出(SparkFatalException)

    背景 本文基于 Spark 3 1 1 open jdk 1 8 0 352 目前在排查 Spark 任务的时候 遇到了一个很奇怪的问题 在此记录一下 现象描述 一个 Spark Application Driver端的内存为 5GB 一直
  • 考虑极端天气线路脆弱性的配电网分布式电源配置优化模型【IEEE33节点】(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
  • 【复现】遗传算法求解分布式电源选址定容问题并考虑环境因素研究【IEEE33节点】(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
  • Jenkins 插件下载速度慢、安装失败了!我教你怎么解决!

    Jenkins部署完毕 如果不安装插件的话 那它就是一个光杆司令 啥事也做不了 所以首先要登陆管理员账号然后点击系统管理再点击右边的插件管理安装CI CD必要插件 但是问题来了 jenkins下载插件速度非常慢 而且经常提示下载插件失败 真
  • CAP与BASE理论

    CAP与BASE理论 CAP 一个分布式系统最多只能同时满足一致性 Consistency 可用性 Availability 和分区容错性 Partition tolerance 这三项中的两项 C一致性 状态的一致性 缓存 数据库 集群等
  • Kubernetes (十一) 存储——Secret配置管理

    一 简介 从文件创建 echo n admin gt username txt echo n westos gt password txt kubectl create secret generic db user pass from fi
  • Redis分布式锁--java实现

    文章目录 Redis分布式锁 方案 SETNX EXPIRE 基本原理 比较好的实现 会产生四个问题 几种解决原子性的方案
  • Kubernetes (十三) 存储——持久卷-动静态分配

    一 简介 二 NFS持久化存储步骤 静态分配 1 集群外主机用上次nfsdata共享目录中创建用来测试的pv 1 3 目录 用来对三个静态pv 2 创建pv的应用文件 vim pv yaml apiVersion v1 kind Persi
  • 短信系统搭建主要因素|网页短信平台开发源码

    短信系统搭建主要因素 网页短信平台开发源码 随着移动互联网的快速发展 短信系统已成为企业和个人进行信息传递的重要工具 建立一个高效可靠的短信系统对于企业来说非常重要 下面我们将介绍一些影响短信系统搭建的主要因素 1 平台选择 在搭建短信系统
  • UI自动化测试之Jenkins配置

    背景 团队下半年的目标之一是实现自动化测试 这里要吐槽一下 之前开发的测试平台了 最初的目的是用来做接口自动化测试和性能测试 但由于各种原因 接口自动化测试那部分功能整个废弃掉了 其中和易用性有很大关系 另外 也和我们公司的接口业务也有关
  • SpringCloud Config分布式配置中心

    文章目录 代码地址 简介 与GitHub整合配置 项目整合 测试 Config客户端配置与测试 测试 Config客户端之动态刷新 测试
  • 【安全-SSH】SSH安全设置

    今天发现自己的公有云服务器被攻击了 在这里插入图片描述 https img blog csdnimg cn direct cafdca04646f4b8b838400ec79ac282f png 然后查看了登录日志 如上图 ls sh va
  • 如何读取硬盘S.M.A.R.T.属性?

    我会监控 Windows 7 客户端上的智能 HDD 我希望在不使用任何 vbs 文件或现成工具的情况下获得 HDD 智能属性 只需使用 WMI 或 PowerShell 我将使用 Zabbix 监控服务器聚合该数据 使用zabbix se

随机推荐

  • JavaScript图片转base64格式

    function changeBase64 var imgSrc share png 图片本地路劲 写自己本地图片地址 var image new Image image setAttribute crossOrigin anonymous
  • Docker Compose:Docker Compose部署nacos初始化MySQL

    Docker Compose Docker Compose部署nacos初始化MySQL 找初始化sql文件 nacos初始化mysql schema sql文件内容 docker compose yml 上传到挂载目录 运行docker
  • java常用工具类总结

    1 Java自带工具方法 1 1 List集合拼接成以逗号分隔的字符串 如何把list集合拼接成以逗号分隔的字符串 a b c List
  • 不安装oracle客户端,用plsql连接oracle

    首先安装32位和64位的Oracle客户端 在很多Oracle安装介绍中 都有提到设置2点 一 e 1 环境变量 NLS LANG SIMPLIFIED CHINESE CHINA ZHS16GBK 2 TNS ADMIN D app pr
  • 跨域问题Response to preflight request doesn‘t pass access control check: No ‘Access-Control-Allow-Origin

    场景 前端跟后台联合开发的时候 在局域网内 浏览器访问别人的地址可以获取数据 但是通过接口请求 就会跨域 解决方法 现在是vue项目 用axios请求 前端这边单独解决这个问题 不需要后端处理 第一 找到config index js 设置
  • 蓝牙Mesh开发四 TLSR8258 ble mesh通信测评

    前言 TLSR是由泰凌微电子设计的一款低功耗蓝牙芯片 8258芯片方案已经支持SigMesh协议栈 符合BLE5 0协议规范 跑下Demo来做下SIG Mesh的测试 如有异议 欢迎留言指正 特性 32 Bit RISC V 处理器 最高主
  • 深度学习损失函数之——L1 L2 SmoothL1(范数、损失函数、正则化)

    L1 L2以及Smooth L1是深度学习中常见的3种损失函数 这3个损失函数有各自的优缺点和适用场景 首先给出各个损失函数的数学定义 假设 x x x 为预测值与Ground Truth之间的差值 L1 loss表示预测值和真实值之差的绝
  • Redis查看订阅的模式串详细内容

    问题描述 pubsub channels可以查看Redis中被订阅的频道 channel pubsub numpat可以查看被订阅的模式 pattern 数量 redis cli pubsub numpat integer 3 问题 除了查
  • A,B,C , D, E类地址的划分及子网划分汇总的详解

    一 A类地址 1 A类地址第1字节为网络地址 其它3个字节为主机地址 它的第1个字节的第一位固定为0 2 A类地址范围 1 0 0 1 126 255 255 254 3 A类地址中的私有地址和保留地址 10 X X X是私有地址 所谓的私
  • 联想电脑如何启动BIOS并开启CPU虚拟化功能

    联想电脑如何启动BIOS并开启CPU虚拟化功能 首先 打开设置 gt 系统 gt 更新与安全 gt 恢复 gt 高级启动 gt 立即重新启动 进入后选择疑难解答 再点击高级选项 再在高级选项中选择UEFI固建设置后进入BIOS 进入BIOS
  • C++ 城市路径

    include
  • 全网最新最全的jmeter接口测试,压力测试

    一 前言 jmeter是apache公司基于java开发的一款开源压力测试工具 体积小 功能全 使用方便 是一个比较轻量级的测试工具 使用起来非常简单 因 为jmeter是java开发的 所以运行的时候必须先要安装jdk才可以 jmeter
  • pandas6:DataFrame非值数据(Nan)的处理

    Pandas中有哪些非值数据 1 NaN 是什么 NaN是被遗失的 不属于任何类型 from numpy import NaN nan print nan nan print NaN True print NaN False print N
  • 2023蓝桥杯考前整理

    目录 python接收数据的方法 python内置方法 python字符串方法 python模块 python接收数据的方法 接收一个元素 s input 接收一个字符串 n int input 接收一个整数 接收两个或三个元素 以空格隔开
  • 【软考】-高项-质量管理-子过程ITTO记忆技巧

    质量管理 贵管控 规划质量管理 1 记忆口诀 需求 干系 风险记住清 组织质量体系 策略盈 标杆成本质量流 思维测试 计划留 质量测量指标出 管理计划 记心头 2 故事 在一个叫做 需求城 的地方 有三个重要的公民 需求文件先生 干系人登记
  • Markdown中图片对齐方式及尺寸设置

    在markdown编辑模式下导入图片默认尺寸会很大 不符合预期效果 有时候需要对图片的对齐方式和尺寸大小进行调整 1 直接上传图片的原始效果 添加图片后默认尺寸很大 会占满整个宽度 2 图片尺寸及对齐方式调整 添加图片之后 图片底部 CSD
  • java对于Excel进行快速处理的框架EasyExcel(SpringBoot集成)

    一 EasyExcel介绍 EasyExcel是阿里巴巴开源的一个excel处理框架 以使用简单 节省内存著称 EasyExcel能大大减少占用内存的主要原因是在解析Excel时没有将文件数据一次性全部加载到内存中 而是从磁盘上一行行读取数
  • Anchor-Free based目标检测

    CornerNet 预测左上角和右下角来得到最后的bounding boxes 所以最基本的需要两个feature map表示对应的Corner 称为heatmap top left 和 bottom right 将属于同一个object的
  • C++中template(模版)的使用

    我们在编程的时候总是会遇到一些类似的模块 只是模块中的形参的数据类型不同 导致我们要不断的去更改模块的 这里就涉及到重载的知识点了 例如以下的几种情况 函数1 int max int x int y return x gt y x y 函数
  • 分布式监控系统——Zabbix(3)配置

    文章目录 分布式监控系统 Zabbix 3 配置 一 监控项 1 定义一个不带参数的监控项 2 定义一个带参数的监控项 3 删除监控项 4 监控项存储的值 二 触发器 1 简介 2 触发器表达式 3 定义一个触发器 4 触发器的依赖关系 5