ZabbixでCPU使用率を監視する

スポンサーリンク

目的

Zabbixを使用してCPU使用率を監視します。

ネットワーク構成

環境

Zabbixサーバの環境です。

OSWebサーバデータベースPHPZabbix ServerZabbix Agent
CnetOS 7.8Apache 2.4.6MySQL 8.0.217.2.324.0.234.0.23

クライアントの環境です。

OSZabbix Agent
CnetOS 7.44.0.23
Windows Server 20194.0.23

監視設定

アイテムの設定

項目CentOS側の設定値Windows側の設定値
名前CPU使用率CPU使用率_PerformanceCounter
タイプZabbixエージェントZabbixエージェント
キーsystem.cpu.utilperf_counter[\Processor(_Total)\% Processor Time]

※Windowsは以下も使用可能です。system.cpu.util
データ型数値 (浮動小数)数値 (浮動小数)
単位%%
監視間隔1m1m
アプリケーションの作成CPUCPU

トリガーの設定

項目CentOS側の設定値Windows側の設定値備考
名前{HOST.NAME} CPU使用率の閾値超え{HOST.NAME} CPU使用率の閾値超え
深刻度警告警告
条件式{CentOS7-ZA4-1:system.cpu.util.min(#5)}>80

※CPU使用率が5回連続で80パーセントを超えたという意味です。
{Windows2019-1:perf_counter[\Processor(_Total)\% Processor Time].min(#5)}>80

※CPU使用率が5回連続で80パーセントを超えたという意味です。
min関数以外にもcount関数を使うことも可能です。

{….count(#5,80,gt)}=5
手動クローズを許可チェックをつけるチェックをつける

アクションの設定

項目設定値
デフォルトのアクション実行ステップの間隔1h
デフォルトの件名【ZBX】{TRIGGER.NAME}
デフォルトのメッセージOriginal event ID: {EVENT.ID}
障害発生時刻:{DATE} {TIME}
ホスト名:{HOST.HOST}
IPアドレス:{HOST.IP}
設置場所:{INVENTORY.LOCATION}
深刻度:{TRIGGER.SEVERITY}
障害内容:{TRIGGER.NAME}
最新値:{ITEM.LASTVALUE}
メンテナンス中の場合に実行を保留チェックをつける
実行内容アラートメールの宛先を設定

動作確認

最新データの状態です。正常時は以下の通りです。

ホスト名前最新のチェック時刻最新の値
CentOS7-ZA4-1CPU使用率2023/02/12 22:58:020.0835 %
Windows2019-1CPU使用率_PerformanceCounter2023/02/12 22:58:030 %

対象機器に負荷をかけます。
CentOSはstressコマンドを使用、WindowsはCpuStresツールを使用して下さい。

ホスト名前最新のチェック時刻最新の値
CentOS7-ZA4-1CPU使用率2023/02/13 00:01:0299.8007 %
Windows2019-1CPU使用率_PerformanceCounter2023/02/13 00:01:0385.0745 %

アラートメールが届いていることを確認します。

件名本文備考
【ZBX】CentOS7-ZA4-1 CPU使用率の閾値超えOriginal event ID: 433
障害発生時刻:2023.02.13 00:01:04
ホスト名:CentOS7-ZA4-1
IPアドレス:192.168.xxx.xxx
設置場所:UNKNOWN
深刻度:Warning
障害内容:CentOS7-ZA4-1 CPU使用率の閾値超え
最新値:99.8 %
閾値の80%を超えたのが23:57でした。障害発生時刻が00:01なのでトリガーの5回連続閾値超えが正常に機能しています。
【ZBX】Windows2019-1 CPU使用率の閾値超えOriginal event ID: 434
障害発生時刻:2023.02.13 00:01:04
ホスト名:Windows2019-1
IPアドレス:192.168.xxx.xxx
設置場所:UNKNOWN
深刻度:Warning
障害内容:Windows2019-1 CPU使用率の閾値超え
最新値:85.07 %
閾値の80%を超えたのが23:57でした。障害発生時刻が00:01なのでトリガーの5回連続閾値超えが正常に機能しています。