18章アラート
「1.1 モニタリングとは何か」で述べたように、アラートはモニタリングの構成要素のひとつで、問題が起きたときに人間に通知を送れるようにする機能である。Prometheusは、継続的に評価されるPromQL式という形でアラートの条件を定義できるようにしており、PromQL式から得られた時系列データがアラートの内容になる。この章では、Prometheusでアラート(alert)を設定する方法を説明する。
「2.4 アラート」の例でも示したように、Prometheusは、メール、チャットメッセージ、オンコール呼び出しなどの通知(notification)を送信しない。これらの仕事をするのはAlertmanager(アラートマネージャ)である
Prometheusでは、何がアラートに値し、何がそうでないかを判断するロジックを定義する。Prometheusでアラートが発火(fire)すると、それはAlertmanagerに送られる。Alertmanagerは、多数のPrometheusサーバのアラートを引き受けられる。Alertmanagerはアラートを分類してグループにまとめ、抑制された形で通知を送る(図18-1参照)。
図18-1に示したようなアーキテクチャにより、柔軟性を確保できるだけでなく、複数の異なるPrometheusサーバからのアラートに基づいてひとつの通知を送ることができる。たとえば、すべてのデータセンタへの配信データの転送に問題がある場合、アラートのグルーピングを設定して、ひとつの通知だけが送られてくるようにできる。それによって各データセンタから通知がスパムのように飛び込んでくるのを避けられるのだ。 ...
Get 入門 Prometheus ―インフラとアプリケーションのパフォーマンスモニタリング now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.