自动化运维一体化

2023-05-16

运维一体化中的平台一体化,指的是运维一体化与平台一体化,其中运维一体化是数据中心在运维方面的运营体系,它包括三方面:人员组织一体化、流程一体化、平台一体化。

一、转型:

和目前大部从运维团队一样,我们的运维团队也打着“救火”、“背锅”、“低价值”等标签,团队的特点归纳下有四个特点:1、被动救火式,以被动保障业务系统运行,日常计划性工作容易被打断、搁置;2、问题驱动式,以系统可用性、可靠性、业务请求等问题驱动运维工作;3、操作运维,重复性、操作类点主要工作量的运维模式;4、经验式运维,由人工经验驱动的运维模式,尤其是一些经验丰富的老员工的离职在短期内会对运维质量带来一定的冲击。所以目前运维主要工作有持续交付部署,技术支持支撑,信息安全审计,运维开发可视化。

针对上面四个特点我们提出了四个转型,分别是从被动救火式向主动精细化转型,主动分析,主动优化,驱动开发,促进DEVOPS的落地;从问题驱动向价值驱动转型,以业务体验、服务满意度、促进业务更好发展;从操作运维向运维开发转型,通过为运维人员提供运维开发平台,降低运维开发门槛,快速落地一些紧迫的运维工具,降低操作性、重复性的运维工作;最后一个转型是从依靠经验向智能化驱动运维转型,结合数据分析、知识库、机器学习技术促进运维智能化。

在现有人力维持不变,运维质量要求还要提升的背景下,要实现上述面四个转型目标,我们首先要解放生产力,解决生产力当前最主要的手段是自动化,所以下面再说说我们自动化方面遇到的3个困难:

-如何更好:虽然运维体系比较完整,但工具主要以商业软件为主,以烟囱式建设,信息无法互联互通,无法实现1+1>2的效果;

-如何更快:运维工具拿来较多,自主研发少,无法快速满足自身运维需求,还是存在较多人肉运维的工作;

-如何更重要:运维职业危机,传统的运维操作为主的方式注定会成为历史,取而代之的是精细化运营,如何既解决职业危机,又能创造更大的价值,是难题;

针对上面提到的四个转型目标,以及自动化目前遇到的困难,我们制定了相关的技术及管理的改进方案:运维一体化。

二、一体化

在讲一体化思路前,我先讲讲促进一体化思路形成的一些思路来源:

-《架构即未来》这本书里提到的组织、流程、架构的三位一体和我们运维一体化很吻合;

-腾讯蓝鲸、云霁科技在运维自动化方面的整体解决方案引导着我制定平台一体化的方案;

-google sre高逼格的运维运营模式,促进我在运维开发方面的解决思路形成;

如上图所示,我们的运维一体化的核心是组织、流程、工具三位一体,具体来讲是以CMDB为基础,结合运维统一门户、运维分析平台、云平台、监控平台、流程平台、操作平台、审计归档平台,构建运维工具一体化(即平台一体化),并在工具一体化的同时,结合流程一体化,最终构建组织、流程、工具三位一体的运营一体化的运营体系。运维一体化以运维向主动精细化运维、价值驱动、运维开发、智能化转型为目标,为实现上述目标首要的工作是需要解放运维生产力,通过“监管控”运维自动化提高工作效率,通过自主的开发平台实现敏捷的开发能力,通过运维分析实现运维智能化,辅助运维决策。

再重点讲讲今天分享的重点:平台一体化,平台一体化的思路是:6平台 +1门户 + 4原则。

-6平台是:云平台、监控平台、归档审计平台、流程平台、操作平台、分析平台这6个平台分别对标我们身体的骨、眼、神经系统、循环系统、手、脑。其中监控平台、归档审计平台、流程平台、操作平台又组成了我们常规讲到的自动化中的“监、管、控”。这6个平台中每一个平台又组成相关技术体系,具体每个平台包括的体系内容及技术架构这里因时间问题不做深入解释。

-1门户是:统一门户是运维可视化的关键,它集成了工具的可视化层,提供多维用户、多种展示形式、以运维场景驱动建设等作用。

-4原则是:自主化,工具化、服务化、可视化,这4个原则后面会进一步介绍。

通过归纳这个6平台+1门户+4原则的平台一体化思路,并将这个思路推广到数据中心工具建设团队中,使我们能否快速达成共识,提高协作效率。

三、建设原则

平台一体化规划重点解决各技术平台间的信息互联互通、统一展现和紧密联动,对于各个平台工具有着几个原则“服务化、可视化、自主化、工具化”,即:

-自主化:构建运维开发平台降低运维工具开发门槛,促进平台工具开发更加自主可控,更加敏捷;

-工具化:在运维团队中建设工具建设文化,促进运维开发文化建设;

-服务化:拒绝推倒重建,整合好存量自动化工具,引入新的工具,实现工具间的互联互通,数据共享;

-可视化:通过更加统一、清晰的可视化建设促进平台的效益的产生;

下面对这4个原则,结合我们目前工具建设阶段性的成效来做进一步的分享。

1、原则

1:自主化

自主化包括开发能力自主化与架构自主化。

1)开发能力的自主化,我们主要是通过建立运维开发平台,这个开发平台具有所见即所得的开发能力,它们具备这些特点:

-所见即所得的脚本开发能力:

脚本开发环境(含环境、测试、部署,以及日志、权限、代码管理、脚本执行统计等一篮子解决方案);

标准组件化脚本可供调用,运维人员在开发过程中可以不写具体的脚本,采用组件的方式在可视化界面上组合多个现成的脚本为一个脚本。

-所拖即所得的可视化开发能力:

实现运维工具的可视化展示(提供HTML5风格可视化运维工具控件的拖拉生成统一风格的代码,运维开发人员无需关注HTML标签代码与CS风格S);

实现可视化工具流程的配置能力,即工具上事件所需要的页面流;

设计标准组件提高可视化开发效率;

-运维一体化下的开发能力:

标准化脚本的服务化能力;

服务化脚本的接口注册;

2)架构自主化,我们在平台建设过程中引入了互联网分布式的架构,开源的技术架构能让我们对技术架构更有可控性。以集中监控系统为例,我们对原有的应用主备、数据库主备的架构改造为分布式架构,现在这个系统采用WEB、应用分布式,通过MYCAT分布式数据库中间件实现数据库分布式,采用ZK实现数据库主节点的选取,通过MYSQL实现读写分离,目前我们的数据库由17台MYSQL组成,数据存储由原来了一个月,到现在的一年以上,支持多指标、多形式、多并发的监控、分析的运维场景需要。

整体的架构

我们的平台一体化对于工具及技术主要以开源、国产为主,以下这张PPT是截止目前我们平台的主要技术栈。

2、原则

2:工具化

我们将工具分为重量型工具和轻量型工具,大致以这个思路区分:

-重量型工具:包括监控类系统(集中监控、性能监控、基础监控、网络安全监控等)、自动化部署、日志系统、业务批次调度等等这些需要开发工作量比较大的系统;

-轻型工具:包括应用服务启停工具、数据维护工具、数据查询工具、业务运营活动实时报表等和运维日常操作工作结合比较紧密且相对简单的工具;

对于这两类工具,我们综合人员能力、投入产出等客观因素求个平衡点,其中重量型工具以引入成熟系统进行二次开发为主,轻量型工具逐步以自主开发工具为主。

下面针对上面两类工具分别举例。

首先是重量型工具,以集中监控为例,监控架构见这张PPT,集中监控的建设思路主要是以“不漏报、不误报”加强“监”的能力,通过监控分析、学习能力补充 自动化“控”的能力, 实现智能化的主动预测、故障自愈、无人值守。目前我们的监控体系己覆盖从基础设施、服务器存储、系统软件(含虚拟化、容器、系统软件等)、应用可用性、客户体验五个层次的对象,这些监控对像由不同的监控工具实现监控数据的采集与事件分析。在监控工具之上,由集中监控实现监控数据整合、事件整合、子系统接入、统一可视化、数据源采集、智能学习、智能基线、事件协同处理、事件联动分析、新技术平台监控等平台能力。后续需要在平台能力之上建立智能学习型监控,实现主动预测故障、故障自愈、无人值守。

下面图中我取了几张我们监控有特色的几个功能,分别是:

-集中的可视化,具备多用户视角、多系统整合展示、多形式展示(WEB端、大屏,以及目前在开发的手持端监控)

-体系化整合,整合存量系统(比如基础监控、性能监控、应用监控等)、整合数据、整合事件等。

-将监控能力下探到分行,可以实现分行终端的的监控管理,模拟柜面终端的操作回放。

-深度关联分析,相似事件统一汇总,比如我们在CMDB的基础之上,建设应用配置库,应用配置库除了应用服务、版本、程序等CI项外,还将应用的纵向与横向关系通过可视化拖拉的方式实现。

-利用好监控数据,比如将监控数据用于一键巡检,业务运营活动自定义报表等。

-其它,比如这个事件丰富,我们将事件的信息展示,还将涉及的系统配置信息、关联事件、事件具体数据、事件应急、工单情况、涉及OS的资源、性能、事件处理情况、事件应急工具等信息集中在一个视图,以促进事件的快速定位与应急恢复。

讲完重量型工具,现在举例讲讲轻型工具,下面这张应用工厂的界面可以很好的解释我们的建设思路。参考APPSTORE,在团队中建立工具开发文化,管理员可以开发工具,并发布到应用工厂并供其它管理员使用,其它管理员可以对工具提建议或打分,这些打分可以作为该工具欢迎度进行奖励。

下面这几张图我以轻量型工具中的服务启停为例,这个工具可以满足关机维护、应用投产、故障应急等场景,支持单个或多个服务的环境保存、进程常规情况下的启停、异常情况下启停、启停后多重形式的检查方法。

这些小工具的建设一方面提高了团队运维工作效率与标准化的落实,另一方面也有助于一些有想法、有能力的同事增加工作成就感。

3、原则

3:服务化

服务化是为了实现工具间通讯的互联互通,服务化一方面要求各工具对外提供API接口;另一方面是通过统一开发一个服务集成模块实现工具监控API接口的注册、发现、鉴权。

这个服务集成有2个主要功能:

-服务通讯总线,相当于一个轻量型的ESB,工具间的通讯需要经过服务集成模块;

-服务注册与发现,提供可视化的界面为各个工具进行接口注册,为调用起提供接口入参说明、调用说明等功能;

这个服务集成还提供多种通讯方式,RPC、MQ队列等,可根据不同的通讯需要进行调用。

4、原则

4:可视化

可视化方面我们主要以统一门户为载体,在技术上我们选择了以H5加CSS3(为移动端化作准备),提供以下3个特性:

-提供指定服务:统一门户提供所有工具菜单、生成访问用TOKEN;

-页面适应性改造:统一风格,并分步对存量工具进行风格改造

-访问适应急改造:快速跳转、多标签单点登录、浏览器兼容;

在功能上,我们提供多种用户视角,专业团队视图、管理视图、业务视图,下在这张界面是我们统一门户待办的视图,它将不同用户角色所关心的指标集中在这个视图,作为用户控制台。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

自动化运维一体化 的相关文章

  • 关于四舍五入的一点思考

    思考来源 xff1a 做时间的四舍五入 例如将时间近似到最近的半小时 xff0c 如10 xff1a 20近似到10 30 10 10分近似到10 00 常规做法 xff0c 查 xff0c 查到了将dataframe中的时间使用round
  • WIN7下WIFI共享上网教程

    原文地址 xff1a http itbbs pconline com cn mobile 11590200 html 用Connectify这个软件搞了N久 xff0c 经常都会出现不能获取IP的情况 泡了很久论坛 xff0c 终于找到了几
  • Android:在Fragment中,onClick失效的解决方法

    平时习惯写onclic方法 xff0c 但是有时候不是在Activity中 xff0c 比如 xff1a Fragment中用onclick无效 xff0c 只能用 id 跳转或者弹框 xff1a 比如按钮 Button 或者 Lineay
  • Spring框架使用流程

    Spring框架使用流程 一 过程简单梳理二 Spring的基本配置及用法1 Maven项目中Spring框架的依赖引入2 配置Spring配置文件的三种方式 xff08 1 xff09 纯xml文件配置 xff08 application
  • 在指定目录下寻找文件

    find命令用来在指定目录下查找文件 任何位于参数之前的字符串都将被视为欲查找的目录名 如果使用该命令时 xff0c 不设置任何参数 xff0c 则find命令将在当前目录下查找子目录与文件 并且将查找到的子目录和文件全部进行显示 语法fi
  • i386/libawt_xawt.so: libXext.so.6: cannot open shared object file

    运行jenkins war失败 xff1a i386 libawt xawt so libXext so 6 cannot open shared object file 查看centos 版本 cat etc redhat release
  • MongoDB简介,架构,功能和示例

    什么是MongoDB xff1f MongoDB是面向文档的NoSQL数据库 xff0c 用于大量数据存储 MongoDB功能 每个数据库都包含集合而集合又包含文档 xff0c 文档可以具有不同数量的字段 xff0c 每个文档的大小和内容可
  • 如何理解深度学习中的端到端(End-to-end)概念

    在最近的论文阅读中 xff0c 又一次见到作者提到 端到端 xff08 End to end 这个概念 xff0c 但是在专业课的学习和以往查的资料中 xff0c 这个名词并没有被特意地强调过 端到端 xff0c 是相对于 非端到端 而言的
  • 亮屏流程 - 安卓R

    PhoneWindowManager响应电源键 首先按下power键后调用frameworks base services core java com android server policy PhoneWindowManager jav
  • Ubuntu:系统分区

    在系统分区之前 先进行磁盘分区 这里针对的是window10系统下安装ubuntu双系统 需要在window10下进行磁盘分区来安装ubuntu系统 一 磁盘分区 win10系统下 右击此电脑 xff0c 点击管理就进入磁盘管理 这时候可以
  • Android Studio 编译通过,无法运行(RUN灰色,类文件图标为红色J)

    Error描述 xff1a Android Studio版本 xff1a 3 4 1 代码编译通过 xff0c 但是Run按钮呈灰色 2 所有类图标都是红色J 3 点击Run左边的 Edit Configutation 后出现如下界面 解决
  • DataFrame中包含列表元素的深度复制以及关于数据复制的一点思考

    文章目录 DataFrame中包含列表元素的深度复制关于深浅复制的一点思考 DataFrame中包含列表元素的深度复制 思想 xff1a 将DataFrame进行序列化 xff0c 使内部数据和索引之间失去关联 xff0c 达到深度复制的目
  • SpringMVC异常页面跳转

    SpringMVC异常处理 1 首先导入SpringMVC包 创建SpringMVC工程 xff08 简单创建 xff09 span class hljs tag lt span class hljs title dependency sp
  • 创建linux_gnome软件快捷方式简单方法

    之前在一些博客中看到的都比较麻烦 笔者是一名初学者 所以推荐用最简单的方法 有问题欢迎指正 原理 我们只需要在linux系统存放桌面图标的目录下 创建一个空白桌面图标文件 并将后文中的代码引入 步骤 1 在usr share applica
  • twm图形模式以及恢复

    虚拟机VMare8安装Redhat企业版5 xff0c 由于虚拟机崩溃gnome环境被破坏 xff0c 进入后进入twm图形模式 TWM 是TabWindow Manager for the X WindowSystem的简称 xff0c
  • 若依 从下载到成功运行及打包

    官网 xff1a http www ruoyi vip 目录 一 下载并运行项目 二 关于 若依 接口地址配置 2 1 若依的跨域代理介绍 2 2 配置跨域代理 xff0c 调用后台接口 2 2 1 配置 后台 ip 地址 2 2 2 页面
  • ESLint 的使用和.eslintrc.js配置

    使用 ESLint ESLint 详尽使用参见 官方文档 http eslint org docs user guide configuring 配置 ESLint 可以通过以下三种方式配置 ESLint 使用 eslintrc 文件 xf
  • python实现文件传输

    发送者 xff1a send file py span class token keyword def span span class token function send file span span class token punct
  • 那一年读过的技术经典书

    转载请注明 xff1a http blog csdn net xinzhangyanxiang article details 10199757 大学刚毕业 xff0c 总结起来读过的书并不算多 xff0c 而且主要集中在大四的时期读的 x

随机推荐

  • 安装Ubuntu 13.04后要做的六件事

    Raring Ringtail Ubuntu 13 04正式发布了 xff0c 作为幕后开发Ubuntu Linux的公司 xff0c Canonical在为全新安装的系统设置一系列默认值方面已经做得很到位 xff0c 但你可能还是想在几个
  • 快速排序结构体golang

    实现功能说明 列出当前目录的所有文件的修改时间 xff0c 和文件名称 定义的结构体 span class token keyword type span info span class token keyword struct span
  • 代码检视九句箴言

    老东家代码检视的箴言 xff0c 还抽查过背诵 xff0c 这么久了 xff0c 我还记得 xff0c 俗话说 xff0c 好记性比不上烂笔头 xff0c 所以就写在这里了 xff0e 看见了If xff0c 就想Else 看见malloc
  • 关于散列、检索的总结

    文章目录 字典线性表线性表存储顺序线性表存储 散列散列函数内消解开地址法和探查序列检索和删除 外消解溢出区方法桶散列 散列表的性质扩大存储区 xff0c 空间换时间负载因子和操作效率可能的技术和实用情况 本文着重讨论静态字典检索相关的散列问
  • 一份用动画演示操作系统的各个过程的资料

    Animationfor OS ProcessDescription and Control Thedynamic state of a process CPUswitching between processes as a result
  • grep 搜索不包含关键字的行

    核心内容 grep v down v 是不显示匹配上的内容 xff0c 显示不包含down的内容 需求引入 做主机扫描的时候 方便查看在线的主机 dotheright span class hljs variable 64 dotherig
  • 打开一个网页,需要用到多少协议?

    系统环境 xff1a OS xff1a Linux ubuntu 2 6 32 46 generic 105 Ubuntu SMP Fri Mar 1 00 08 49 UTC 2013 i686 GNU Linux 抓包软件 xff1a
  • git从远程仓库中拉取指定分支

    若本地分支不存在的情况 git checkout span class hljs attribute b span 本地分支名称 origin span class hljs subst span 远程分支名称 使用该方式会在本地新建分x
  • linux下 find 文件内容

    功能描述 xff1a 从当前目录里面找到 CUDA VERSION相关信息 第一种实现方法 xff1a find 43 exec 43 grep find span class hljs built in span span class h
  • vim删除包含特定字符串的行

    命令如下 xff1a g str d xff1a 表示后面输入的是vim命令参数 g 表示范围是全局 str 是匹配上的字符串 d delete 表示删除
  • centOS7系统盘扩容

    使用centos7 4 1708 iso安装的virtualbox虚拟机 xff0c 设置的硬盘空间是1T xff0c 安装完成之后 xff0c df h 看到 系统文件容量挂载点 dev mapper centos root50G dev
  • git http-backend基于centos7 httpd

    需要用户名密码的访问 网上已经有人分享了 如果想看 需要用户名密码的访问请出门右转 https www cnblogs com badwood316 p 6398616 html 这里的配置是一种不需要用户名密码 同时可以glone的方式
  • 【ZABBIX】zabbix监控软件5.0版本的安装和使用

    文章目录 一 关闭selinux和防火墙二 下载并安装Zabbix三 测试验证四 添加监控主机 xff08 实例 xff1a crond 43 出图 xff09 警告 微信 钉钉 前言 xff1a zabbix服务器需关闭SELinux 开
  • Mariadb(MySql)开启SSL简明教程

    1 生成CA root 64 www genrsa 2048 gt ca key pem root 64 www openssl req new x509 nodes days 365000 key ca key pem out ca ce
  • Katex、Latex语法手册

    莱斯Rice大学的一个语法手册 xff0c 手册链接 网盘地址 xff1a 链接 xff1a https pan baidu com s 1baoNr XBP oGEfbbqcEPA 提取码 xff1a ob47
  • 工单管理系统otrs

    CentOS7 4安装配置ORTS工单系统 环境 IP 系统 服务 数据库 账户 密码 172 20 17 95 Centos7 4 ORTS root root WEB地址 xff1a 172 20 17 95 otrs index pl
  • 画图工具汇集

    技术传播的价值 xff0c 不仅仅体现在通过商业化产品和开源项目来缩短我们构建应用的路径 加速业务的上线速率 xff0c 也体现在优秀工程师的工作效率提升 产品性能优化和用户体验改善等经验方面的分享 xff0c 以提高我们的专业能力 接下来
  • 常见数据库版本

    SQL Server安装包 考虑到好些新手同学不知道怎么下载自己所需的数据库软件安装包 xff0c 特分享一些我收藏的安装包 现分享SQL Server的一些安装包给大家 根据自身需求下载 xff0c 新手朋友建议下载SQL Server
  • 思维导图工具集

    浏览所有国外资源时使用可以实时网页翻译的浏览器 例如Google Chrome QQ浏览器 360浏览器 Firefox浏览器等 xmind 功能 XMind 一个功能齐全的思维导图和头脑风暴工具 旨在产生想法 激发创造力 提高工作和生活的
  • 自动化运维一体化

    运维一体化中的平台一体化 xff0c 指的是运维一体化与平台一体化 xff0c 其中运维一体化是数据中心在运维方面的运营体系 xff0c 它包括三方面 xff1a 人员组织一体化 流程一体化 平台一体化 一 转型 xff1a 和目前大部从运