是否可以根据 Kubernetes 集群内发生的事件以某种方式发送警报(到电子邮件/slack)?
特别是,如果 Pod 意外重新启动或 Pod 无法启动,那么获取警报将非常有用。同样,了解 Pod 的 CPU 使用率是否超过特定阈值并获取警报也很有用。
我们安装了 Heapster(带有 InfluxDB / Grafana 后端)。虽然这提供了有用的数据,但不幸的是它没有为我们提供警报。
Both sysdig http://thenewstack.io/sysdig-adds-kubernetes-container-monitoring-cloud/ and Datadog http://docs.datadoghq.com/integrations/kubernetes/也提供此功能。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)