Azure 仮想マシンのバックアップが失敗した原因について調査




発生した現象

Azure ポータルにて、バックアップ画面の復元ポイント一覧をみると、以下 3 つの現象が発生していました。


・バックアップポリシーで指定した VM バックアップの保持期間分のバックアップが画面に表示されず、保持期間分より少ない数のバックアップが画面に表示された。


・バックアップ(スナップショット)がバックアップポリシーで指定したインスタンス回復スナップショットの保持数より多く表示された。


・バックアップ(コンテナ)がバックアップポリシーで指定したコンテナの数より少なく表示された。


※復元ポイント一覧の確認方法

Azure ポータル ホーム > 仮想マシン > 該当する仮想マシン > バックアップ


原因

VM バックアップが失敗していると思い、バックアップジョブのバックアップ実行結果( CSV ファイル )を確認しましたが、VM バックアップは成功していました。


※バックアップジョブ実行結果の確認方法

Azure ポータル ホーム > Recovery Services コンテナー > 該当するコンテナ > バックアップジョブ > フィルター をクリックして条件を指定して、ジョブのエクスポートをクリック


原因は、VM バックアップの失敗ではなく、仮想マシンのデータディスクサイズが大きいことが原因でした。


仮想マシンのデータディスクサイズが大きいことで、以下の事象が発生しました。


わたしの Azure 環境では、VM バックアップを毎日 18:00 に実行する設定にしていましたが、仮想マシンのデータディスクサイズが大きいことで、VM バックアップ処理の時間が長くなり、VM バックアップ処理完了までに 24 時間以上経過することがありました。その場合、翌日の VM バックアップが重複して実行され、重複して実行されたことで、VM バックアップ処理で実行されるはずのバックアップデータ(スナップショット)を Recovery Services コンテナーに転送する処理がスキップされ、スナップショットが削除されず、残ってしまいました。これにより、バックアップポリシーで指定した数より、バックアップ(スナップショット)の数が多く画面表示され、バックアップ(コンテナ)の数は少なく画面表示されていました。


※Azure では、VM バックアップ処理のなかで、バックアップデータ(スナップショット)を Recovery Services コンテナーに転送する処理を行っていますが、VM バックアップ処理が重複して実行されると、このスナップショットを転送する処理がスキップされ、さらに、スナップショットは削除されず、そのまま残ります。


さらに、転送処理がスキップされ、スナップショットが削除されず残ってしまうことで、バックアップポリシーで指定した数より多いスナップショットがバックアップデータとして残ります。その後に、VM バックアップ処理が実行され、スナップショットの削除処理が実行されるタイミングで、バックアップポリシーで指定したスナップショットの保持期間に基づいてスナップショットが削除されます。これにより、バックアップポリシーで指定した VM バックアップの保持期間分のバックアップより、バックアップデータが減ってしまい、復元ポイント一覧をみるとバックアップがバックアップポリシーで指定した数より少なく表示されるという事象が発生しました。


また、仮想マシンのデータディスクサイズが大きいことで、VM バックアップされたスナップショットのバックアップデータ量も大きくなり、バックアップ(スナップショット)を Recovery Services コンテナーに転送する処理に時間がかかっていました。転送中は、復元ポイント一覧にバックアップが画面表示されないため、画面をみるとバックアップがバックアップポリシーで指定した数より、少なく表示されているという事象も発生しました。


対応方法

対応方法は以下の方法などがあります。


・仮想マシンのデータディスクサイズを縮小する。


・内部でデータを置き換える処理が行われないようにして、VM バックアップ取得前後の対象サーバーのデータ変更量を少なくする。


・VM バックアップを実行するタイミングの間隔をあけて、VM バックアップ処理が重複して実行されないようにする。



スポンサーリンク

0 件のコメント :

コメントを投稿