proxmox ve6+influxdb+grafana 集群监控

2023-05-16

pve支持将自身运行状态发送至第三方服务器

0 环境介绍

root@pve143:~# pveversion -v
proxmox-ve: 6.2-1 (running kernel: 5.4.34-1-pve)

软件部署环境:Centos7.8
influxdb 1.8
Grafana 7.0

1 安装&配置influxdb

1.1官网下载&安装:https://portal.influxdata.com/downloads/

wget https://dl.influxdata.com/influxdb/releases/influxdb-1.8.0.x86_64.rpm
sudo yum localinstall influxdb-1.8.0.x86_64.rpm

1.2 配置influxdb

#编辑influxdb配置,添加proxmox数据库,并设置8089接收pve数据:
#vim /etc/influxdb/influxdb.conf

[meta]
    dir = "/var/lib/influxdb/meta"
[data]
    dir = "/var/lib/influxdb/data"
    wal-dir = "/var/lib/influxdb/wal"
[http]
    # The bind address used by the HTTP service.
    # bind-address = ":8086"
[[udp]]
    enabled = true
    bind-address = "0.0.0.0:8089"
    database = "proxmox"
    batch-size = 1000
    batch-timeout = "1s"

1.3 重启并验证influxdb是否正常

#设置开机启动及重启数据库

systemctl enable influxdb
systemctl restart influxdb

#验证数据库

[root@centos7 ~]# influx
Connected to http://localhost:8086 version 1.8.0
InfluxDB shell version: 1.8.0
> use proxmox
Using database proxmox
> show measurements
name: measurements
name
----
blockstat
cpustat
memory
nics
system

2 安装&配置grafana

2.1官网下载&安装:https://grafana.com/grafana/download

wget https://dl.grafana.com/oss/release/grafana-7.0.1-1.x86_64.rpm
sudo yum install grafana-7.0.1-1.x86_64.rpm

1.2 重启并验证grafana是否正常

#设置开机启动及重启数据库

systemctl enable grafana-server
systemctl restart grafana-server

#验证web,启动后可以直接在浏览器访问:http://ip:3000
#首次登陆修改密码,默认用户名/密码:admin/admin

3 配置Proxmox VE

#新建配置,配置pve上报的数据库相关配置,按照以下配置如实修改后保存退出:
#vim /etc/pve/status.cfg

influxdb:proxmox
    server 192.168.31.88 #(influxdb server)
    port 8089 #(1.2前面配置的端口)

#如果是通过telegraf监控的可以考虑加下以下配置(可选)

#安装硬盘监控软件
apt-get install hddtemp
systemctl enable hddtemp
systemctl start hddtemp
#安装ipmitool
apt-get install ipmitool
#编辑配置文件规则
#vim /etc/udev/rules.d/52-telegraf-ipmi.rules  #添加以下内容
KERNEL=="ipmi*", MODE="660", GROUP="telegraf"
#给telegraf赋权
chown :telegraf /dev/ipmi*
chmod g+rw /dev/ipmi*

4 grafana配置

4.1 grafana创建Data Sources

#根据下图配置,并保存退出
在这里插入图片描述

4.2 import dashboard

#选择导入模板 10048,并点击load
在这里插入图片描述
#填写选择刚刚创建的datasource, dashboard name随便设置,点击import
在这里插入图片描述

4.3 验证最终效果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

proxmox ve6+influxdb+grafana 集群监控 的相关文章

  • grafana与prometheus实现监控可视化

    1 Grafana基础知识 Grafana是一个开源的指标监测和可视化工具 官方网站为 Grafana The open observability platform Grafana Labs 常用于展示基础设施的时序数据和应用程序运行分析
  • prometheus + grafana 实时监控 Windows性能

    Prometheus 实时监控 Windows性能 Prometheus 简介 Prometheus 具有以下特点 Prometheus 组件 Prometheus功能特性 在业务层用作埋点系统 在应用层用作应用监控系统 在系统层用作系统监
  • Grafana如何正确配置数据源

    Grafana配置数据源的步骤如下 1 首先选择设置 点击数据源 再选择添加数据源 2 根据需要选择对应的数据库类型 3 输入对应的数据库信息 4 测试数据是否连接成功 5 若发现出现如上错误 更改Encrypt值为disable后 再次测
  • Prometheus 远程读写 Influxdb

    Prometheus 远程读写 Influxdb Influxdb InfluxDB 是一款开源的时序数据库 是InfluxData 是一个公司 提供时序平台 下的一个产品 使用Go语言开发 时序数据库 Time Series Databa
  • Linux环境安装开发grafana插件(一)试水

    继续我们探索grafana结合Skywalking 为了更加灵活的应用图表 尝试开发grafana的panel插件 但试水并不顺利 所以把第一步目标缩小到安装一个自定义插件 参考了不少文章 终于成功 但各类参考要么比较碎片化 要么有些地方过
  • Prometheus 中的 container="POD" 标签是什么?为什么大多数示例都排除它?

    我读过很多指南 展示了如何使用 Prometheus 监控 Kubernetes 中 pod 的 cpu 和内存使用情况 其中大多数看起来像这样 rate container cpu usage seconds total pod comp
  • Grafana划分2系列

    我试图将两个系列分开以获得它们的比率 例如 我的网站 a com b com c com 为 所有网站 他们每个人都有总部分数和发生错误的统计数据 我想将每个站点的错误 部分显示为条形错误 部分 其中部分 gt 错误到该站点的每个错误 在这
  • 在 Grafana 仪表板中嵌入网站

    我运行 Grafana 7 2 0 开源版 需要将网站嵌入仪表板本身 也就是说 我需要一排或两排常用的图表面板 并在它们下面嵌入一个需要定期重新加载的外部网站 我怎样才能实现这个目标 貌似没有相关插件https grafana com gr
  • 更新与 InfluxDB 中的条件匹配的多个字段值

    在InfluxDB测量中 如何更新与查询匹配的点的字段值 这还是吗从 v1 6 开始不容易实现 https github com influxdata influxdb issues 2575 正如 GitHub 票证中的示例所建议的 实现
  • Promtail 错误管道阶段只能包含一个键

    尝试设置 Promtail 时出现以下错误 level error ts 2020 11 27T06 10 30 310583Z caller main go 104 msg 创建 promtail 时出错 error 无法创建文件目标管理
  • Grafana 仪表板根据变量值显示/隐藏行

    因此 我有一个 Grafana 仪表板来显示主机内运行的各种服务的日志 现在 我对不同的服务有不同的行 因为指标和标题是特定于服务的 例如对于 Apache 服务 我们有基于 HTTP 状态代码的日志指标 对于 Oracle 数据库服务 我
  • 从 prometheus-node-exporter 导出的指标中查找准确的 CPU 百分比

    我用node cpu seconds total为此的指标 基本上 我想减去mode idle 从总CPU使用率中得出结果 然后取平均率 然后计算百分比 我尝试过类似的东西 100 avg rate node cpu seconds tot
  • influxdb:计算布尔事件的持续时间?

    我的 influxdb 数据库中有来自门传感器的数据 这是一个布尔传感器 门是否打开 值为false 或者它被关闭 值为true 表格如下所示 name door time value 1506026143659488953 true 15
  • prometheus grafana linux服务器监控

    文章目录 前传 node exporter安装 配置promethues监控node节点 grafana操作 查看监控 外传 前传 prometheus grafana的安装使用 https nanxiang blog csdn net a
  • 如何使用prometheus获取pod的CPU和内存使用百分比

    我想使用 promql Prometheus 以以下格式显示 pod 详细信息 此外 我想使用 promql 以以下格式显示应用程序 组件的 CPU 和内存利用率 promql 查询 sum container memory working
  • Linux 容器上使用 screen -x 命令时出现“必须连接到终端错误”

    我正在使用带有 Proxmox 4 的 Linux 容器 当我连接到 Ubuntu 16 04 容器时 pct enter
  • 显示grafana点悬停的详细信息

    我使用 Influxdb 作为 grafana 的来源 在每个数据点的时间序列上 我有几个值和标签 如何将鼠标悬停在折线图中的特定数据点上显示相关数据点 或者 我可以调用一些 API 传递一些值来填充悬停时出现的工具提示 截至撰写本文时 还
  • 从 CLI 查询 InfluxDB 时显示本地时区的时间

    我使用 UTC 将点存储在 InfluxDB 中 但是从命令行 https docs influxdata com influxdb v1 6 tools shell influx precision rfc3339 我想在所有查询中以本地
  • 使用 prometheus 和 grafana 跟踪事件

    有一篇文章 跟踪每个版本 https codeascraft com 2010 12 08 track every release 它讲述了如何在每个代码部署的图表上显示一条垂直线 他们正在使用石墨 我想用 Prometheus 2 2 和
  • 将矩阵与 SUM 相乘

    我想将一个指标与另一个指标之和的结果相乘 我想尝试做的事情 MeticOne SUM MetricTwo Thanks 假设你有MetricOne带标签id and name 你有MetricTwo还有标签id and name 然后你就得

随机推荐