監視入門

はじめに

ここでは監視の基本について情報をまとめています。

サーバやネットワーク、システムが正常に稼働しているかを監視したいけど何を監視すべきなのか、なぜ監視すべきなのか、どうやって監視するのかと悩まれる方は多いです。そのような方に向けてできるだけわかりやすいコンテンツを作成していきます。

監視とは

監視とは、あるシステムやそのシステムのコンポーネントの振る舞いや出力を観察しチェックし続ける行為です。

監視においては「正常に動いているか」が重要です。例えばCPU使用率が閾値を超えた時、対応は必要でしょうか?何かしらの処理によってCPU使用率が高くなるのはよくあることです。それにCPU使用率が高くても業務に影響がなければ問題はないと思います。

つまりCPU使用率のような低レベルのメトリクスではなく、「正常に動いているか」を基準にアラートを送ることが有益ということです。

ですが、低レベルのメトリクスが役に立たないといっているわけではありません。パフォーマンスに影響を与える負荷やトレンドを確認できるので診断やパフォーマンス分析をする場合は必要になります。

そのため、監視する目的を十分に考えた上で何が必要かを決めなければなりません。障害対応するための監視なのか、障害予防も含むのか、パフォーマンスを分析をするための監視なのかなど、目的に応じて検討していく必要があります。

サーバ監視

CPU

  • CPU使用率
  • ロードアベレージ

メモリ

  • メモリ使用率
  • スワップ

ディスク

  • ディスク容量
  • ディスクI/O

ネットワーク

  • トラフィック

ネットワーク監視

タイトルとURLをコピーしました