prometheus和node_exporter部署

2023-05-16

监控体系

前面一篇文章对prometheus作了简单的入门了解,在安装prometheus和node_exporter之前先对监控体系做一下梳理,更直观的讲可以分为iaas,paas,saas三个维度来说

自底向上

系统层监控

系统监控

 cpu、load、memory、swap、disk io、process、kernel parameters 等

网络监控

 网络设备、工作负载、网络延迟、丢包率

中间件及基础设施类系统监控

消息中间件

 Kafka、RocketMQ和RabbitMQ

Web服务器

 Tomcat和Jetty等

数据库及缓存系统

  Mysql、PostgreSQL、MongoDB、ElasticSearch和Redis等

数据库连接池

 ShardingSpere等

存储系统

  Ceph等

应用层监控

用于衡量应用程序代码的状态和性能

业务层监控

用于衡量应用程序的价值,例如电子商务网站上的销售量

QPS、DAU日活、转化率

业务接口:登录数、注册数、订单量、搜索量和支付量等

部署prometheus

两种方式

一种是通过源码

下载最新的组件

直接解压启动即可

解压

tar xvfz prometheus-*.tar.gz
cd prometheus-*

启动

指定启动配置文件

# Start Prometheus.
# By default, Prometheus stores its database in ./data (flag --storage.tsdb.path).
./prometheus --config.file=prometheus.yml

另一种是通过容器方式

建议使用容器方式部署,简单快捷且还可以自定义镜像

指定端口和映射配置文件

docker run \
    -p 9090:9090 \
    -v /path/to/prometheus.yml:/etc/prometheus/prometheus.yml \
    prom/prometheus

自定义镜像my-prometheus

FROM prom/prometheus
ADD prometheus.yml /etc/prometheus/
docker build -t my-prometheus .
docker run -p 9090:9090 my-prometheus

部署node_exporter

可以理解为指标暴露器

应用服务下载

安装运行,默认端口为9100

wget https://github.com/prometheus/node_exporter/releases/download/v*/node_exporter-*.*-amd64.tar.gz
tar xvfz node_exporter-*.*-amd64.tar.gz
cd node_exporter-*.*-amd64
./node_exporter

修改指定端口,并指定后台启动
nohup ./node_exporter --web.listen-address=":9101"  2>&1 & 

获取采集信息

curl http://localhost:9100/metrics

 客户端查看

配置 prometheus实例

global:
  scrape_interval: 15s

scrape_configs:
- job_name: node
  static_configs:
  - targets: ['localhost:9100']

查看图形界面,表示端点实例被集成进来了,UP表示正常运行状态

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

prometheus和node_exporter部署 的相关文章

  • 在 Prometheus 中添加两个值

    我们需要在 Prometheus 中添加两个查询的结果 片段如下 probe ssl earliest cert expiry job SSL expiry time lt 86400 738 1000 node time seconds
  • 使用来自另一个部署的指标的 Kubernetes HPA

    我目前正在尝试使用普罗米修斯和普罗米修斯适配器运行自动缩放演示 我想知道是否有一种方法可以根据普罗米修斯从另一个部署中抓取的指标来自动缩放我的一个部署 我现在拥有的是 2 个不同的部署 kafka consumer application
  • 有没有办法使用 prometheus 监控 kube cron 作业

    有没有办法监控 kube cronjob 我有一个 kube cronjob 它在我的集群上每 10 分钟运行一次 有没有一种方法可以在每次我的 cronjob 由于某些错误而失败时收集指标 或者在我的 cronjob 在一定时间后尚未完成
  • 如何在 Prometheus 或 Grafana 上编写“或”逻辑运算符

    我需要编写一个使用我定义的任何不同作业的查询 job traefik OR job cadvisor OR job prometheus 是否可以编写逻辑二元运算符 普罗米修斯有一个or逻辑二元运算符 但您在这里问的是向量选择器 您可以为此
  • 如何覆盖 Apache Flink 中的配置值?

    我正在尝试将 Apache Flink 的指标收集到 Prometheus 中 Flink 文档说我需要将以下行添加到我的 flink conf yaml 中 metrics reporter promgateway class org a
  • Prometheus中将两个不同的指标分组后如何划分?

    我目前正在尝试对可用区内的 Kubernetes Pod 堆叠发出警报 我成功地使用了两种不同的指标 可以看到应用程序有多少个 pod 正在特定的可用区域上运行 但是 由于扩展 我希望警报基于百分比 因此 当某个可用区上运行特定百分比的 P
  • prometheus grafana mysql监控配置使用

    文章目录 前传 bitnami mysqld exporter 0 15 1镜像 出现了问题 my cnf 可以用这个 prom mysqld exporter v0 15 0 镜像 重要的事情 mysql监控效果 外传 前传 promet
  • 普罗米修斯上的多个目标

    我已经在Centos上配置了prometheus 版本详细信息如下 prometheus 2 5 0 linux 386 我在 prometheus yml 配置文件中添加了两个目标 所有服务器节点导出器都在运行 配置如下 scrape c
  • 我可以找到最后一次值更改的时间戳吗

    给定一个时间序列 是否可以找到最后一个值变化的时间戳 例如 一个 cron 作业每晚运行 它首先运行 rsync 作业 然后计算目标目录的大小 实际的指标值并不是那么重要 但我想验证它实际上每天晚上都会发生变化 是否可以创建一个返回标量值以
  • 如何在 Prometheus 中执行具有两个指标的查询?

    我正在使用 Prometheus 查询 Apache Flink 的指标 我想测量 Map 函数每秒输入和输出的记录数 当我在 Prometheus 中查询两个不同的指标时 图表仅显示其中之一 flink taskmanager job t
  • Alertmanager,不同的警报规则有不同的间隔

    我正在使用alertmanager来获取prometheus指标的警报 我对不同的指标有不同的警报规则 是否可以为每个警报规则设置不同的时间间隔 例如对于metric1 我有rule1 我需要每天检查此规则间隔 对于 metric2 我有规
  • 每次出现错误时使用 prometheus 创建警报

    我是普罗米修斯和警报系统的新手 我开发了一个微服务并添加了指标代码 以便在出现错误时获取增量总数 现在我正在尝试创建一个警报 以便每当错误增加时 它应该标记出来并发送邮件 但我无法针对这种情况形成正确的查询 我使用了诸如 error tot
  • 为什么prometheus Operator无法启动

    我正在尝试在全新的 k8s 集群中使用操作符创建 prometheus 我使用以下文件 我正在创建一个命名空间监控 应用这个文件 就可以正常工作了 apiVersion apps v1beta2 kind Deployment metada
  • Kubernetes Prometheus CrashLoopBackOff / OOMKilled 谜题

    我定期看到容器状态 已终止 OOMKilled 退出代码 137 但调度到内存充足的节点 k get statefulset n metrics NAME READY AGE prometheus 0 1 232d k get po n m
  • PromQL if then 语句等效

    我有一个执行计数的简单 PromQL 查询 sum up container name my container environment name env 这是 Grafana 仪表板的一部分 允许从下拉菜单中选择 env 我想根据环境执行
  • prometheus 节点实例列表

    是否可以使用 prometheus 获取节点实例列表 我有一个节点导出器 但我没有看到这样的指标 我们应该添加一个新的运算符吗 您可以使用kube 状态指标 https github com kubernetes kube state me
  • 如何使用 Prometheus Alert Manager 在 Kubernetes 中触发警报

    我在集群中设置了 kube prometheus https github com coreos prometheus operator tree master contrib kube prometheus https github co
  • 如何解决错误:java.lang.ClassNotFoundException:io.netty.util.concurrent.GenericFutureListener?

    昨天我第一次尝试用 Java 制作 Prometheus 客户端 从 Python 开始 最后是 GoLang 是否找到示例 import io prometheus client Counter import io prometheus
  • 将矩阵与 SUM 相乘

    我想将一个指标与另一个指标之和的结果相乘 我想尝试做的事情 MeticOne SUM MetricTwo Thanks 假设你有MetricOne带标签id and name 你有MetricTwo还有标签id and name 然后你就得
  • 将 Apache Camel 执行器指标发送到 Prometheus

    我正在尝试转发 添加 Actuator Camel 指标 actuator camelroutes 将交换 交易数量等指标 发送到 Prometheus Actuator 端点 有没有办法让我配置 Camel 将这些指标添加到 Promet

随机推荐