智能监控:业务监控新选择,效率提升新动力

2024-01-09

前言

随着科技的飞速发展,企业对于业务的稳定性和连续性要求越来越高。传统的监控方式虽然在一定程度上能够保证业务的正常运行,但在面对复杂多变的业务场景和日益增长的数据量时,往往显得力不从心。为了解决这一问题,观测云在提供全面的可配置的监控器同时,结合最新的智能算法和技术,推出了 智能监控 功能,帮助企业轻松应对更多业务挑战, 也使观测云可观测性系统更加完善。

强大的智能监控

智能监控 综合使用 ADTK (Anomaly Detection Toolkit)中异常检测算法(Detector)以及一些常用算法和处理函数,智能化检测时间序列数据中的异常值,对于业务分析、用户行为的分析、以及出现故障的根因分析能力,提供了一套快速定位异常节点的机制;高效地帮助用户主动地发现问题并生成事件报告。在对原本的智能巡检功能优化和升级后,全新的智能监控的优势也十分明显,具体有以下几项:

  • 更加快速定位异常节点 :通过分析场景构建对多维指标做关键维度的定位;在定位到业务的维度范围后,围绕着微服务中服务的调用,服务的资源依赖,快速定位分析异常,大大提高了故障排查的效率。
  • 完美掌控波动性强的指标 :为用户预制检测规则,适用于波动性较强的业务类及其他数据指标,能够更好地应对数据的快速变化和异常波动,提供实时事件分析报告并及时告警,帮助运维人员及时关注并解决问题。
  • 精准识别与预测异常数据 :基于强大的智能检测算法,智能监控能够自动识别异常数据并预测未来走势,为企业提供更加及时、准确的故障预警和排查支持。
  • 灵活简捷的监控配置 :与传统监控方式相比,智能监控无需复杂的阈值和触发规则配置,只需设定检测范围及通知人即可一键开启监控,这种简化的设置方式使得更多企业能够减少大量的时间成本和使用门槛。

丰富的检测类型

观测云智能监控目前支持 4 种智能检测规则,不同的规则覆盖不同数据范围以及多种指标,如下列表:

规则名称 数据范围 检测频率 基本描述
主机智能检测 指标(M) 30 分钟 通过智能算法自动检测主机,发现主机 CPU、内存异常情况。
日志智能检测 日志(L) 60 分钟 通过智能算法自动检测日志中的异常,检测指标包含日志数量,错误日志数。
应用智能检测 链路(T) 30 分钟 通过智能算法自动检测应用中的异常,检测指标包含应用请求数量,错误请求数,以及请求延迟。
用户访问智能检测 用户访问数据(R) 60 分钟 通过智能算法自动检测网站/APP 中的异常,包含页面性能分析,错误分析,相关检测指标有 LCP、FID、CLS、Loading Time等。

主机智能检测

主机智能检测基于智能检测算法,定期对主机的 CPU、内存进行智能检测。通过对出现 CPU、内存异常的主机进行根因分析,确定该主机是否存在突增/突降/区间性上升的异常情况,从而监控主机的运行状态及稳定性。适用于对稳定性和可靠性要求较高的业务主机的监控,支持对产生的异常事件提供分析报告,不仅可以看到主机的相关详情,还能对异常情况做较为全面的分析。

日志智能检测

日志智能检测基于智能检测算法,监控工作空间内采集器产生的日志数据。智能识别日志数量的突增 / 突降、错误日志突增的异常数据,及时发现不符合预期的异常状态。多适用于在 IT 监控场景下,通过事件异常总结和错误分析,对代码异常或任务调度检测等数据进行更深层次的下钻分析。

应用智能检测

应用智能检测基于智能检测算法,智能识别应用请求数量的突增 / 突降、错误请求数量的突增、请求延迟的突增 / 突降 / 区间上升等异常情况。通过应用程序服务异常指标来自动进行异常分析,您可以根据异常总结以及资源分析,快速定位故障点并恢复,有效确保服务平稳运行状态。

用户访问智能检测

用户访问智能检测基于智能检测算法,智能检测用户访问 Web / APP 的性能异常和错误突增情况。基于检测指标进行性能和错误两个方面的异常分析,并触发告警,高效地帮助您监测网站或应用程序的运行情况以及用户使用情况。相关的指标及预设阈值如下:

  • 性能分析指标预设阈值: LCP(>= 2.5 s)、INP (>= 200 ms)、FID (>= 100 ms)、CLS (> 0.01);

基于性能分析指标,统计检测区间受影响用户占比,设置告警级别阈值:Critical > 76.2% 、 Warning > 47.4% 、 error > 59.8% ;

  • 错误检测指标:会话错误数、页面错误数、动作错误数。

其事件分析报告的异常总结会显示查看用户访问服务标签、分析报告详情、异常分布情况统计;同时您还能够根据具体情况进行页面性能或错误分析,即关联用户访问页面仪表板,分析页面 LCP、FCP、页面错误率等指标趋势。

简单的配置过程

  • 不同于传统形式的监控器需要配置复杂的阈值和触发规则,您只需要简单设置筛选数据的检测范围或自定义添加所需的属性字段作为筛选项,即可锁定更加精准的智能监控数据检测范围。

  • 智能监控会在发现异常后由算法自动生成事件报告并通知相关人员,帮助您及时发现异常情况并快速定位分析。您还可以自定义配置 事件通知 使接受人更清楚的了解事件内容;或将同步 创建 Issue 异常追踪 进行高效地统一管理。

  • 好用的 告警配置 能够根据所设置的不同事件等级、通知对象、以及告警聚合规则在该智能监控满足触发条件后,立即发送告警消息给指定的通知对象。值得注意的是,智能监控触发的事件等级为 重要 ,您可以重点关注 重要 等级中的通知对象,以便高效管理告警通知。

配置告警策略,详情参见: 机智的告警策略,完善监控系统的重要一环

完成创建智能监控后,监控器会获取所筛选后的各类数据,识别出现异常情况时,会生成相应的事件,您可以 事件>智能监控 列表中查看对应异常事件详情和分析报告,从而进一步分析并快速解决故障。

值得关注的是,分析报告是采用了仪表板模式做绑定的,如下图(以主机检测事件报告为例);在异常总结中,您可以查看异常点的具体分析数据以及相应主机的情况。同时,您可以直接跳转至该仪表板视图模版进行下钻分析,更加快速找到问题原因并解决。若您需要更加个性化的分析报告仪表板,观测云还支持您创建同名视图,更新分析看板则将覆盖现有事件分析报告,帮助您大大提升分析效率。

最后

通过本文的介绍,相信您已经了解如何快速使用智能监控,并体会到了观测云智能监控的强大优势和魅力。丰富的检测类型能够帮助各行各业的企业进行数字化改革,搭配常规的监控器使用,不仅能够全面覆盖企业的数据监控场景,还能够有效地降低各类成本。

观测云智能监控功能的上线,无疑是一次可观测系统智能化一次质的飞跃。它不仅提升了监控的智能化水平,更在业务稳定性、连续性和安全性等方面为企业提供了强有力的保障。通过运用这一功能,企业将能够更好地洞察业务运行的全貌,及时发现并解决潜在问题,从而确保业务的持续、稳定运行。我们相信,观测云智能监控功能将成为企业数字化转型道路上的得力助手;未来智能监控的持续升级也值得我们共同期待!

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

智能监控:业务监控新选择,效率提升新动力 的相关文章

  • 系列一、 单例设计模式

    一 单例设计模式 1 1 概述 单例模式 Singleton Pattern 是Java中最简单的设计模式之一 这种类型的设计模式属于创建者模式 它提供了一种创建对象的最佳方式 这种模式涉及到一个单一的类 该类负责创建自己的对象 同时确保只
  • 【计算机开题报告】 网上茶叶销售平台设计与开发

    一 选题依据 简述国内外研究现状 生产需求状况 说明选题目的 意义 列出主要参考文献 1 研究背景 随着社会经济的迅速发展和科学技术的全面进步 以计算机与网络技术为基础的信息系统正处于蓬勃发展的时期 随着经济文化水平的提高 近年来 随着科学
  • 基于springboot+vue实现街球社区网站项目设计与演示【附项目源码+论文说明】

    基于springboot实现街球社区网站项目设计与演示 摘要 本文主要讲述了基于SpringBoot Vue模式的街球社区网站的设计与实现 这里所谓的街球社区网站是通过类似于百度贴吧之类的网上论坛使得所有的街球爱好者有一个可以互相交流的平台
  • Java版企业电子招投标系统源代码,支持二次开发,采用Spring cloud技术

    在数字化时代 采购管理也正经历着前所未有的变革 全过程数字化采购管理成为了企业追求高效 透明和规范的关键 该系统通过Spring Cloud Spring Boot2 Mybatis等先进技术 打造了从供应商管理到采购招投标 采购合同 采购
  • AI动作冒险电影《角斗士2:破晓之争》(上)

    AI动作冒险电影 角斗士2 破晓之争 上 在罗马帝国的疆域上 角斗士竞技场一直是民众热议的焦点 然而 当权者为了利益 将角斗士的生死视作儿戏 将人民视为取乐的工具 罗马帝国的野心在和平时期逐渐膨胀 终于引来了内战与分裂 角斗士2 破晓之争
  • 华为认证 | HCIP和HCIE难度差多了?

    许多有志于在ICT领域发展的人士 都希望获得华为的HCIP或HCIE认证 那么 考取这些认证到底 需要多少钱 HCIP和HCIE的 难度又存在怎样的差异 下面将为您揭晓答案 01 考华为HCIE多少钱 考试费用 华为HCIE认证考试的费用主
  • 【python、pytorch】

    什么是Pytorch Pytorch是一个基于Numpy的科学计算包 向它的使用者提供了两大功能 作为Numpy的替代者 向用户提供使用GPU强大功能的能力 做为一款深度学习的平台 向用户提供最大的灵活性和速度 基本元素操作 Tenors张
  • 弹窗找不到iutils.dll是怎么回事?需要怎么解决呢?分享多种方法

    在计算机使用过程中 我们经常会遇到一些错误提示 其中之一就是 iutils dll丢失 iutils dll是一款系统的动态链接库文件 主要用于支持某些软件和游戏的启动和运行 如果开机提示iutils dll丢失 可能会导致相关软件和游戏无
  • 如何查看崩溃日志

    目录 描述 思路 查看ipa包崩溃日志 简单查看手机崩溃信息几种方式 方式1 手机设置查看崩溃日志 方式2 Xocde工具 方式3 第三方软件克魔助手 环境配置 实时日志 奔溃日志分析 方式四 控制台资源库 线上崩溃日志 线上监听crash
  • 工程管理系统功能设计与实践:实现高效、透明的工程管理

    在现代化的工程项目管理中 一套功能全面 操作便捷的系统至关重要 本文将介绍一个基于Spring Cloud和Spring Boot技术的Java版工程项目管理系统 结合Vue和ElementUI实现前后端分离 该系统涵盖了项目管理 合同管理
  • 2.4G SOC收发芯片XL2412P,适用于无线键鼠,遥控器等多种场景

    XL2412P芯片是 款高性能低功耗的SOC集成无线收发芯片 集成MO核MCU 工作在2 400 2 483GHz世界通用ISM频段 该芯片集成了射频接收器 射频发射器 频率综合器 GFSK 调制器 GFSK解调器等功能模块 并且支持一对多
  • 2024年全球网安行业趋势预测TOP20 | FreeBuf年度盘点

    2023年 全球网络安全态势和2022年相比未见好转 在勒索攻击领域更是愈发严重 大量巨头型企业遭遇勒索攻击 勒索赎金金额也在持续上升 据网络安全公司Crowdstrike Holdings数据显示 针对大公司 银行 医院或政府机构的勒索攻
  • 软件测试/测试开发全日制|Pytest结合yaml实现数据驱动

    前言 我们之前介绍过pytest的参数化 我们使用了 pytest mark parametrize argnames argvalues 来实现批量传送参数的目的 但是我们不进行数据驱动的话 我们一旦对数据进行变更 就需要在代码里对我们的
  • MySQL中设置自增主键id从1开始

    可能遇到过这种问题 当你只想新增一条数据时 发现使用Insert语句后 发现id并不是从1开始的 握草 怎么回事 其实很简单 通过执行一下SQL 对应你的表就可以解决 ALTER TABLE user AUTO INCREMENT 1 具体
  • 题解 | #链表中的节点每k个一组翻转#C++暴力遍历解法

    求大家投下我们腾讯吧 发的一堆sp被鸽了 大数据面试题 Hive 华为14A还是保研华中科技大学 求大家投下我们腾讯吧 发的一堆sp被鸽了 终极 2024校招八股文 MySQL索引 第一篇 招芯片验证实习生 碰到渣导悲哀3年 给秋招画个句号
  • 锚定「中央计算+区域控制」,确定性机遇已凸显!

    中央计算 区域控制 的新一代整车电子架构 已经成为车企继电动化 智能化后的新竞争焦点 有关整车计算与域控 业界普遍认为将过去在不同域 座舱 智驾等 功能转移到集中的计算平台 可以更容易地进行整车OTA 以及灵活部署新功能 同时 基于通用操作
  • Web测试是在测什么?容易被忽视的小细节总结!

    2024软件测试面试刷题 这个小程序 永久刷题 靠它快速找到工作了 刷题APP的天花板 CSDN博客 文章浏览阅读2 2k次 点赞85次 收藏11次 你知不知道有这么一个软件测试面试的刷题小程序 里面包含了面试常问的软件测试基础题 web自
  • 网页bug怎么都测不出来?赶紧进来看看吧

    2024软件测试面试刷题 这个小程序 永久刷题 靠它快速找到工作了 刷题APP的天花板 CSDN博客 文章浏览阅读2 2k次 点赞85次 收藏11次 你知不知道有这么一个软件测试面试的刷题小程序 里面包含了面试常问的软件测试基础题 web自

随机推荐

  • Vue:通过ref获取DOM元素

    一 场景描述 我们在页面的开发过程中 经常需要操作 dom 元素 来实现我们需要的效果 以往 js 中 我们是通过给 dom 添加 id 然后 通过 js 代码 document 来获取这个 dom 简写代码案例 h2 这里是h2标签 h2
  • 【计算机开题报告】基于JSP的服装店销售管理系统

    1 选课目的意义 21世纪是一个信息化时代 随着中国经济的发展和人民生活水平的提高 服装商场的普及程度日益增大 竞争也在逐渐白炽化 为了进一步提高服装商场的经营效率 在服装店销售管理中引入计算机管理系统成为了必然的选择 由于中国环境的特殊性
  • 软件测试开发/全日制/测试管理丨用户端 Web 自动化测试

    随着Web应用的普及和不断发展 用户端Web自动化测试成为确保Web应用质量的重要手段 这种测试方法不仅提高了测试效率 也帮助团队及时发现和解决潜在问题 确保用户体验的连贯性和稳定性 工具选择 用户端Web自动化测试的第一步是选择适当的工具
  • 【计算机开题报告】二手车交易平台

    一 选题依据 简述国内外研究现状 生产需求状况 说明选题目的 意义 列出主要参考文献 选题目的 意义 如今时代网络技术正在快速发展 电子商务技术也以极为强势的姿态闯入人们的视野之中 随着人们生活质量的提升 为了对身边二手物品进行回收利用 二
  • 如何用CHAT写新能源颗粒报告?

    问CHAT 写一份新能源颗粒报告 CHAT回复 新能源颗粒 也就是生化质能源颗粒 以其清洁 可再生的特性 在环保能源市场上拥有越来越广泛的应用 以下为对于新能源颗粒行业的一份报告 1 行业概述 新能源颗粒来源广泛 主要包括农业废弃物 林业废
  • springboot git配置文件自动刷新失败问题排查

    http ip port refresh 说明 springBoot版本是1 5 9 接口路径与2 x 不同 路径区别 refresh VS actuator refresh 用postman调用refresh接口刷新git配置 报错如下
  • 系列六、IO流 - 节点流 & 处理流

    一 节点流 处理流 1 1 节点流概述 节点流可以从一个特定的数据源读写数据 例如FileReader FileWriter 1 2 处理流概述 处理流 包装流 是连接在已存在的流之上 为程序提供更为强大的读写功能 例如BufferedRe
  • RT-Thread 内核基础(六)

    RT Thread内核配置示例 RT Thread的一个重要特性是高度可裁剪性 支持对内核进行精细调整 对组件进行灵活拆卸 配置主要是通过修改工程目录下的rtconfig h文件来进行 用户可以通过打开 关闭该文件中的宏定义来对代码进行条件
  • 软件测试开发/全日制/测试管理丨Docker容器技术

    Docker 是一种轻量级的容器技术 通过将应用程序及其所有依赖项封装到一个可移植的容器中 实现了应用程序的便携性 可部署性和可伸缩性 下面是关于 Docker 容器技术的主要概念和优势 主要概念 容器 Container 容器是一个轻量级
  • MySQL 通用表空间的这几个选项你会用么?

    在 MySQL 数据库中有效管理存储和性能至关重要 通用表空间为实现这一目标提供了灵活性 本文讨论通用表空间并探讨其功能 优点和实际用法 并附有说明性示例 什么是通用表空间 与默认保存系统表的单个系统表空间不同 通用表空间是用户定义的多个
  • 【计算机开题报告】智能社区管理系统

    一 设计目的及意义 随着经济的发展 人们生活水平的提高 工作和日常事务繁忙 人们对服务就有了更深入 更精细的要求 而计算机技术的迅猛发展 使得这种需求变为可能 传统的社区服务业也与互联网技术结合更加密切 这是社会发展的必然趋势 为解决社区中
  • HttpRunner(22):httprunner设置代理及请求证书验证

    httprunner设置代理 httprunner 库本身没有提供设置代理的接口 但是底层使用了urllib requests 等库 可以设置HTTP PROXY 和HTTPS PROXY 环境变量 常用的网络库会自动识别这些环境变量 日常
  • PostMan进行并发压测流程

    需求 两个记账接口在同一时间大量处理同一账户账务时 锁表顺序不同导致死锁 在修改完代码后模拟生产记账流程进行测试 需要对两个接口进行并发测试 在进行压测的时候 需要对流水号进行递增 处理流程 1 新建Collections 2 设置全局变量
  • 软件测试/测试开发全日制培训|Pytest的异常处理

    前言 在断言一些代码块或者函数时会引发意料之中的异常或者其他失败的异常导致程序无法运行时 使用 raises 捕获匹配到的异常可以让代码继续运行 Python的异常处理 try except else finally 示例如下 try pr
  • Python自动化测试面试题分享(含答案)

    1 如果页面元素经常发生需求变化 你是如何做 利用po模式 业务逻辑和测试逻辑相分离 当某个页面经常发生变化只需要维护页面 包括元素定位表达式 封装业务方法 不需要修改测试逻辑 页面经常变化正是自动化测试的痛点 我们改不了需求 目前利用po
  • 14:00面试,14:06就出来了,问的问题有点变态。。。

    从小厂出来 没想到在另一家公司又寄了 到这家公司开始上班 加班是每天必不可少的 看在钱给的比较多的份上 就不太计较了 没想到9月一纸通知 所有人不准加班 加班费不仅没有了 薪资还要降40 这下搞的饭都吃不起了 还在有个朋友内推我去了一家互联
  • 从8295“卷”到互联、AI娱乐,智能座舱“火拼”再升级!

    智能座舱已经进入 万物互联 跨界融合 的新竞争周期 下一个技术变革时代已经开启 现下 智能座舱的交互 通信 域控等各大板块还处于比较 割裂 的状态 但要打造极致的用户体验 驱动智能座舱迈向第三生活空间 必须要深度融合驾驶 网关 通信等领域的
  • 【计算机毕设任务书】荣皓房屋租赁平台的设计与开发

    1 本毕业设计 论文 课题应达到的目的 1 训练学生文献资料查阅 项目调研与分析能力 2 训练学生用所学知识解决实际问题的能力 3 加强对学生的专业知识进行综合训练 4 熟悉项目开发的一般方法和步骤 5 提高学生团队合作能力 2 本毕业设计
  • 提升口才:掌握技巧,展现自信

    口才 是现代社会中不可或缺的一种能力 无论是在职场 社交场合还是日常生活中 良好的口才都能为我们带来更多的机会和成功 然而 很多人却因为缺乏自信或者技巧不足而无法充分发挥自己的口才 那么 如何提升口才呢 下面就让我们一起来探讨这个问题 如果
  • 智能监控:业务监控新选择,效率提升新动力

    前言 随着科技的飞速发展 企业对于业务的稳定性和连续性要求越来越高 传统的监控方式虽然在一定程度上能够保证业务的正常运行 但在面对复杂多变的业务场景和日益增长的数据量时 往往显得力不从心 为了解决这一问题 观测云在提供全面的可配置的监控器同