CPUを監視する

はじめに

CPUの負荷を確認します。CPUに負荷がかかる原因としては、CPUの処理能力不足やアプリケーションの処理が効率的でないことが考えられます。

このコンテンツをテストするには、事前に以下の設定が必要です。1番から順番に実施して下さい。
ホストグループの作成 → ②ホストの登録

環境

OS:CentOS 7.7.1908
WebServer:Apache/2.4.6
PHP:7.2.28
MySQL:8.0.19
Zabbix:4.0.18

監視内容

CPUの監視項目は、1分/5分/15分の平均値を監視できます。

監視項目アイテムキー説明
usersystem.cpu.util[,user,avg1]ユーザレベルでCPUが消費された時間の割合
nicesystem.cpu.util[,nice,avg1]優先度(ナイス値)によるユーザーレベルでCPUが消費された時間の割合
systemsystem.cpu.util[,system,avg1]システムレベル(kernel)でCPUが消費された時間の割合
iowaitsystem.cpu.util[,iowait,avg1]CPUがディスクI/O待ちのためにアイドル状態で消費した時間の割合
stealsystem.cpu.util[,steal,avg1]XenなどのOSの仮想化を利用している場合に、ほかの仮装CPUの計算で待たされた時間の割合
idlesystem.cpu.util[,idle,avg1]CPUのアイドル時間の割合(ディスクI/Oの待機時間は除く)
ロードアベレージ(1m)system.cpu.load[,avg1]CPUに処理してもらうのを待っているプロセスがいくつかるかの指標(1分間の平均)
ロードアベレージ(5m)system.cpu.load[,avg5]CPUに処理してもらうのを待っているプロセスがいくつかるかの指標(5分間の平均)
ロードアベレージ(15m)system.cpu.load[,avg15]CPUに処理してもらうのを待っているプロセスがいくつかるかの指標(15分間の平均)

アイテムの作成

user

  • 名前:05.CPU使用率(user)
  • タイプ:Zabbixエージェント
  • キー:system.cpu.util[,user,avg1]
  • データ型:数値(浮動小数)
  • 単位:%

nice

  • 名前:10.CPU使用率(nice)
  • タイプ:Zabbixエージェント
  • キー:system.cpu.util[,nice,avg1]
  • データ型:数値(浮動小数)
  • 単位:%

system

  • 名前:15.CPU使用率(system)
  • タイプ:Zabbixエージェント
  • キー:system.cpu.util[,system,avg1]
  • データ型:数値(浮動小数)
  • 単位:%

iowait

  • 名前:20.CPU使用率(iowait)
  • タイプ:Zabbixエージェント
  • キー:system.cpu.util[,iowait,avg1]
  • データ型:数値(浮動小数)
  • 単位:%

steal

  • 名前:25.CPU使用率(steal)
  • タイプ:Zabbixエージェント
  • キー:system.cpu.util[,steal,avg1]
  • データ型:数値(浮動小数)
  • 単位:%

idle

  • 名前:30.CPU使用率(idle)
  • タイプ:Zabbixエージェント
  • キー:system.cpu.util[,idle,avg1]
  • データ型:数値(浮動小数)
  • 単位:%

ロードアベレージ(1m)

  • 名前:51.ロードアベレージ(avg1)
  • タイプ:Zabbixエージェント
  • キー:system.cpu.load[,avg1]
  • データ型:数値(浮動小数)

ロードアベレージ(5m)

  • 名前:52.ロードアベレージ(avg5)
  • タイプ:Zabbixエージェント
  • キー:system.cpu.load[,avg5]
  • データ型:数値(浮動小数)

ロードアベレージ(15m)

  • 名前:53.ロードアベレージ(avg15)
  • タイプ:Zabbixエージェント
  • キー:system.cpu.load[,avg15]
  • データ型:数値(浮動小数)

動作確認

アイテムの作成が完了したらデータが問題なく取得できているか確認します。
「監視データ」-「最新データ」をクリックします。
右上にあるホスト欄で、監視対象機器を選択します。
データが取得できているか確認します。

Zabbix Agentをインストールしている環境では、WindowsでもLinuxでも同じアイテムキーを使用できることが多いです。ただし、取得するアイテムによってはWindowsのみ、もしくはLinuxのみでしか使用できないキーもあります。更にOSのバージョンによっても差異があります。

CentOS

Windows Server2019

値が取得できていない項目は、WindowsOSでは対応していません。

設定例

サンプル1

  • CPU使用率は180秒ごとにデータを収集する。
  • CPU使用率の閾値は80パーセントとする。
  • 10回連続で閾値を超えたらアラートメールを送信する。
  • 閾値を超えている限り、2時間毎にアラートメールを送信する。

アイテムの作成

名前:CPU使用率
タイプ:Zabbixエージェント
キー:system.cpu.util[,system,avg1]
データ型:数値(浮動小数)
単位:%
監視間隔:180s

トリガーの作成

名前:CPU使用率
深刻度:警告
条件式:{sample_cpu1:system.cpu.util[,system,avg1].last(#10)}>80

アクションの設定

メールを送信する」の設定が完了しているものとします。

デフォルトのアクション実行ステップの間隔:2h

タイトルとURLをコピーしました