一文彻底搞懂 Alertmanager 的告警抑制与静默 您所在的位置:网站首页 静默的意思怎么解释 一文彻底搞懂 Alertmanager 的告警抑制与静默

一文彻底搞懂 Alertmanager 的告警抑制与静默

2024-07-11 06:45| 来源: 网络整理| 查看: 265

image-20230403153709093

目录 前言一、Prometheus 架构二、Prometheus 告警触发2.1 Prometheus 规则文件与字段解释2.2 规则文件检测2.3 重启/热加载 Prometheus 三、Alertmanager 告警通知3.1 基础环境3.2 接收 Prometheus 告警3.3 Alertmanager 发送告警消息3.4 Alertmanager 配置文件与字段解释3.5 重启 Alertmanager 服务 四、案例4.1 Prometheus 规则4.2 Alertmanager 告警与抑制4.3 Alertmanager 告警与静默4.3.1 访问 Web 端4.3.2 设置静默4.3.3 解除静默 总结

前言

前面提到了,Prometheus 数据指标采集 + Grafana 数据 Web 展示 + 钉钉告警消息通知,但是仅仅是做了一个实验,并没有深究其触发告警问题,那 Prometheus 到底是如何触发告警的?我们接着往下看。

一、Prometheus 架构

在搞清楚 Prometheus 是如何触发告警前,首先我们要清楚 Prometheus 的一个整体架构,其他部分我们先不看,我们就来看 Alertmanager 部分,从架构图中可看到它作为一个整体独立存在,Prometheus 以 Push 消息的方式与其通信,Alertmanager 最后再将 Prometheus 推送过来的告警信息经过其模板渲染后路由给指定用户&&接收端(邮件/钉钉/企业微信等),从而实现告警通知。

image-20230331164522715

沿用前两篇博客案例来逐步解释。

Prometheus - SSL 证书过期监控 | Rabcnops

Prometheus - SSL 证书过期监控 - 钉钉告警 | Rabcnops

二、Prometheus 告警触发 2.1 Prometheus 规则文件与字段解释

首先,来看 Prometheus 的告警规则:

cat /home/data/prometheus/rules/ssl_cert_alerts.yml groups: # 父分组 - name: "SSL证书过期提醒" # 子分组。该字段下可配置多个子分组(子分组名用name字段定义),也就是说Prometheus以组的形式进行告警配置。本案例中定义了名为“SSL证书过期提醒”的一个子分组。 rules: # 定义子分组的告警规则。 - alert: "证书过期时间


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有