目的
Zabbixを使用してCPU使用率を監視します。
ネットワーク構成
環境
Zabbixサーバの環境です。
OS | Webサーバ | データベース | PHP | Zabbix Server | Zabbix Agent |
---|---|---|---|---|---|
CnetOS 7.8 | Apache 2.4.6 | MySQL 8.0.21 | 7.2.32 | 4.0.23 | 4.0.23 |
クライアントの環境です。
OS | Zabbix Agent |
---|---|
CnetOS 7.4 | 4.0.23 |
Windows Server 2019 | 4.0.23 |
監視設定
アイテムの設定
項目 | CentOS側の設定値 | Windows側の設定値 |
---|---|---|
名前 | CPU使用率 | CPU使用率_PerformanceCounter |
タイプ | Zabbixエージェント | Zabbixエージェント |
キー | system.cpu.util | perf_counter[\Processor(_Total)\% Processor Time] ※Windowsは以下も使用可能です。system.cpu.util |
データ型 | 数値 (浮動小数) | 数値 (浮動小数) |
単位 | % | % |
監視間隔 | 1m | 1m |
アプリケーションの作成 | CPU | CPU |
トリガーの設定
項目 | CentOS側の設定値 | Windows側の設定値 | 備考 |
---|---|---|---|
名前 | {HOST.NAME} CPU使用率の閾値超え | {HOST.NAME} CPU使用率の閾値超え | |
深刻度 | 警告 | 警告 | |
条件式 | {CentOS7-ZA4-1:system.cpu.util.min(#5)}>80 ※CPU使用率が5回連続で80パーセントを超えたという意味です。 | {Windows2019-1:perf_counter[\Processor(_Total)\% Processor Time].min(#5)}>80 ※CPU使用率が5回連続で80パーセントを超えたという意味です。 | min関数以外にもcount関数を使うことも可能です。 {….count(#5,80,gt)}=5 |
手動クローズを許可 | チェックをつける | チェックをつける |
アクションの設定
項目 | 設定値 |
---|---|
デフォルトのアクション実行ステップの間隔 | 1h |
デフォルトの件名 | 【ZBX】{TRIGGER.NAME} |
デフォルトのメッセージ | Original event ID: {EVENT.ID} 障害発生時刻:{DATE} {TIME} ホスト名:{HOST.HOST} IPアドレス:{HOST.IP} 設置場所:{INVENTORY.LOCATION} 深刻度:{TRIGGER.SEVERITY} 障害内容:{TRIGGER.NAME} 最新値:{ITEM.LASTVALUE} |
メンテナンス中の場合に実行を保留 | チェックをつける |
実行内容 | アラートメールの宛先を設定 |
動作確認
最新データの状態です。正常時は以下の通りです。
ホスト | 名前 | 最新のチェック時刻 | 最新の値 |
CentOS7-ZA4-1 | CPU使用率 | 2023/02/12 22:58:02 | 0.0835 % |
Windows2019-1 | CPU使用率_PerformanceCounter | 2023/02/12 22:58:03 | 0 % |
対象機器に負荷をかけます。
CentOSはstressコマンドを使用、WindowsはCpuStresツールを使用して下さい。
ホスト | 名前 | 最新のチェック時刻 | 最新の値 |
CentOS7-ZA4-1 | CPU使用率 | 2023/02/13 00:01:02 | 99.8007 % |
Windows2019-1 | CPU使用率_PerformanceCounter | 2023/02/13 00:01:03 | 85.0745 % |
アラートメールが届いていることを確認します。
件名 | 本文 | 備考 |
【ZBX】CentOS7-ZA4-1 CPU使用率の閾値超え | Original event ID: 433 障害発生時刻:2023.02.13 00:01:04 ホスト名:CentOS7-ZA4-1 IPアドレス:192.168.xxx.xxx 設置場所:UNKNOWN 深刻度:Warning 障害内容:CentOS7-ZA4-1 CPU使用率の閾値超え 最新値:99.8 % | 閾値の80%を超えたのが23:57でした。障害発生時刻が00:01なのでトリガーの5回連続閾値超えが正常に機能しています。 |
【ZBX】Windows2019-1 CPU使用率の閾値超え | Original event ID: 434 障害発生時刻:2023.02.13 00:01:04 ホスト名:Windows2019-1 IPアドレス:192.168.xxx.xxx 設置場所:UNKNOWN 深刻度:Warning 障害内容:Windows2019-1 CPU使用率の閾値超え 最新値:85.07 % | 閾値の80%を超えたのが23:57でした。障害発生時刻が00:01なのでトリガーの5回連続閾値超えが正常に機能しています。 |