先日、データベースサーバのバックアップが失敗しました。バックアップツールはArcserve UDP 7.0を使用しています。Arcserveのログを確認すると「ボリューム シャドウ コピー サービスでスナップショットがタイムアウトになりました ([1800000] ミリ秒)」が記録されています。
公式サイトをチェックしていると以下のページを見つけました。
https://support.arcserve.com/s/article/2020070702?language=ja
現象と対応手順が書かれているのですが、なんか腑に落ちない部分がありました。理由は以下の通りです。
- スナップショットは短時間で終わるイメージがある。
- 今まで問題なくバックアップできていた。
- デフォルトのタイムアウトは30分となっている。(つまり一般的に30分を超えることはない)
- 設定変更はレジストリを変更しなければならない(頻度が多ければ管理コンソールから設定できるはず。つまりこのような状況は例外的なパターンである)
ということで引き続きデータベースサーバ側のログをチェックしました。イベントログ(アプリケーション)にSQLWriter(Event ID:24583)のエラーが多数でていました。
さらに調べていると特定のデータベースはSQL Server Management Studioを使ってバックアップしており処理が実行中のままで正常に完了していないことが判明。処理を強制終了させました。この対応でArcserve自体のバックアップは取得できるようになりましたが、SQLWriterのエラーは発生し続けています。
再び調査の結果、以下のページを発見。
https://support.arcserve.com/s/article/209606286?language=ja
データベースサーバで「vssadmin list writers」コマンドを実行すると、「SqlServerWriter」がエラーになっていることを確認。「SQL Server VSS Writer」サービスを再起動しエラーが解消しました。もしサービスの再起動でエラーが解消しなければ、OSを再起動することになります。
いろいろと情報を収集して対応した良い事例だったので簡単にまとめておきます。
コメント