公司 Ceph 集群从 v12 升级到 v14 后,今天某个 CephFS 的集群收到一个 HEALTH_WARN
的告警,具体的 Warning 的信息为 1 pools have many more objects per pg than average。
很明显就是 pg 数目设置的过少,导致有些 pg 里的对象过多,估计是超过了默认的一个 Limit,所以产生了 Warning 的信息,解决的方法很简单,就是查看一下集群里所有 Pool 的 PG 数,看看哪个少的,按照公式大概加一下就好了。
ceph osd pool set cephfs_metadata pg_num 64
ceph osd pool set cephfs_metadata pgp_num 64
变更完后 Ceph 集群的状态变为 HEALTH_OK
。