hobbit/xymonのアラームメールは、結構細かいところに手が届きます。
始めはこんな設定で運用していました。
HOST=%^abc* COLOR=red,yellow MAIL xxxxx@yyyy.zzz
「abc」で始まる名前のホストについて、何らかのアラーム(yellow)、パニック(red)状態になったら、xxxxx@yyyy.zzzにメールを送るという設定です。
運用を開始しましたが、ntpのエラーメールが頻繁に送られました。
しかし、実際は何も問題なく、要は問題が発生してすぐに解決しているのです。
この場合はメールを送りたくないので、ntpに関しては10分以上問題が続いた場合のみメールを送信する設定にしました。
HOST=%^abc* COLOR=red,yellow SERVICE=ntp DURATION>10m MAIL xxxxx@yyyy.zzz HOST=%^abc* COLOR=red,yellow EXSERVICE=ntp MAIL xxxxx@yyyy.zzz
新しい設定を追加しました。
SERVICE=ntp : 対象サービスはntp
DURATION>10m : 10分以上続いた場合
さらに、今までの設定からはntpを抜きました。
EXSERVICE=ntp : ntpは除く
書き忘れましたが、この設定は下記ファイルに書きます。
hobbit: server/etc/hobbit-alert.cfg
xymon: server/etc/alerts.cfg