Zabbixでプロセス監視する

スポンサーリンク

目的

Zabbixを使用してプロセス監視します。
Zabbixエージェント(zabbix-agent)を対象とします。

ネットワーク構成

環境

Zabbixサーバの環境です。

OSWebサーバデータベースPHPZabbix ServerZabbix Agent
CnetOS 7.8Apache 2.4.6MySQL 8.0.217.2.324.0.234.0.23

クライアントの環境です。

OSZabbix Agent
CnetOS 7.44.0.23
Windows Server 20194.0.23

監視設定

アイテムの設定

項目CentOS側の設定値Windows側の設定値
名前プロセス(Zabbix-agent)プロセス(Zabbix-agent)
タイプZabbixエージェントZabbixエージェント
キーproc.num[zabbix_agentd,,,/etc/zabbix/zabbix_agentd.conf]proc.num[zabbix_Agentd.exe]
データ型数値 (整数)数値 (整数)
監視間隔1m1m
アプリケーションの作成プロセスプロセス

トリガーの設定

項目CentOS側の設定値Windows側の設定値
名前{HOST.NAME} プロセスダウン(zabbix-agent){HOST.NAME} プロセスダウン(zabbix-agent)
深刻度警告警告
条件式{CentOS7-ZA4-1:proc.num[zabbix_agentd,,,/etc/zabbix/zabbix_agentd.conf].last()}=0 or {CentOS7-ZA4-1:proc.num[zabbix_agentd,,,/etc/zabbix/zabbix_agentd.conf].nodata(2m)}=1

※プロセス数が0、またはデータの取得が5分間できなくなったという意味です。
{WindowsServer2019:proc.num[zabbix_Agentd.exe].last()}=0 or {WindowsServer2019:proc.num[zabbix_Agentd.exe].nodata(5m)}=1

※プロセス数が0、またはデータの取得が5分間できなくなったという意味です。
手動クローズを許可チェックをつけるチェックをつける

アクションの設定

項目設定値
デフォルトのアクション実行ステップの間隔1h
デフォルトの件名【ZBX】{TRIGGER.NAME}
デフォルトのメッセージOriginal event ID: {EVENT.ID}
障害発生時刻:{DATE} {TIME}
ホスト名:{HOST.HOST}
IPアドレス:{HOST.IP}
設置場所:{INVENTORY.LOCATION}
深刻度:{TRIGGER.SEVERITY}
障害内容:{TRIGGER.NAME}
最新値:{ITEM.LASTVALUE}
メンテナンス中の場合に実行を保留チェックをつける
実行内容アラートメールの宛先を設定

動作確認

Zabbixエージェントが起動している状態です。

ホスト名前最新のチェック時刻最新の値
CentOS7-ZA4-1プロセス(Zabbix-agent)2023/04/16 02:13:381
Windows2019-1プロセス(Zabbix-agent)2023/04/16 02:13:391

Zabbixエージェントを停止します。
CentOSは「systemctl stop zabbix-agent」コマンドを実行します。
Windowsは「Zabbix Agent」サービスを停止します。

Zabbixエージェントサービスを停止させると値が取得できなくなります。

ホスト名前最新のチェック時刻最新の値
CentOS7-ZA4-1プロセス(Zabbix-agent)2023/04/16 02:13:381
Windows2019-1プロセス(Zabbix-agent)2023/04/16 02:13:391

5分後アラートメールが届いていることを確認します。

件名本文備考
【ZBX】CentOS7-ZA4-1 プロセスダウン(zabbix-agent)Original event ID: 578
障害発生時刻:2023.04.16 02:18:12
ホスト名:CentOS7-ZA4-1
IPアドレス:192.168.xxx.xxx
設置場所:UNKNOWN
深刻度:Warning
障害内容:CentOS7-ZA4-1 プロセスダウン(zabbix-agent)
最新値:1
トリガーのnodata(5m)が正常に機能しています。
【ZBX】WindowsServer2019 プロセスダウン(zabbix-agent)Original event ID: 579
障害発生時刻:2023.04.16 02:18:42
ホスト名:WindowsServer2019
IPアドレス:192.168.xxx.xxx
設置場所:UNKNOWN
深刻度:Warning
障害内容:WindowsServer2019 プロセスダウン(zabbix-agent)
最新値:1
トリガーのnodata(5m)が正常に機能しています。