VMware VM および物理サーバーのレプリケーション問題のトラブルシューティング

この記事では、オンプレミス VMware VM および物理サーバーを Site Recovery を使用して Azure にレプリケートする場合に発生する可能性がある、いくつかの一般的な問題と特定のエラーについて説明します。

手順 1:プロセス サーバーの正常性を監視する

Site Recovery はプロセス サーバーを使用して、レプリケートされたデータを受信して最適化し、それを Azure に送信します。

ポータルでプロセス サーバーの正常性を監視し、それらが正しく接続されて機能しており、レプリケーションがプロセス サーバーに関連付けられているソース マシンに対して進行していることを確認するようにお勧めします。

手順 2:接続性とレプリケーションの問題をトラブルシューティングする

初期や継続的に発生するレプリケーションの問題は、ソース サーバーとプロセス サーバーの間、またはプロセス サーバーと Azure の間の接続に関する問題が原因であることが少なくありません。

これらの問題を解決するために、接続性とレプリケーションのトラブルシューティングをします

手順 3:レプリケーションに使用できないソース マシンをトラブルシューティングする

Site Recovery を使用してレプリケーションを有効にするソース マシンを選択しようとした場合、次のいずれかの理由から、そのマシンが使用できないことがあります。

  • 2 つの仮想マシンのインスタンス UUID が同じ:vCenter で管理されている仮想マシンの 2 つが同じインスタンス UUID を持つ場合は、構成サーバーで最初に検出された方の仮想マシンが Azure portal に表示されます。 この問題を解決するには、インスタンス UUID が同じ仮想マシンが 2 つ存在しないようにします。 このシナリオは、バックアップ VM がアクティブになり、探索レコードにログインしているインスタンスでよく見られます。 解決するには、「Azure Site Recovery VMware-to-Azure:How to clean up duplicate or stale entries (Azure Site Recovery (VMware から Azure へ): 重複エントリまたは古いエントリのクリーンアップ方法)」を参照してください。
  • vCenter ユーザーの資格情報が正しくない:OVF テンプレートまたは統合設定を使用して構成サーバーを設定するときに追加した vCenter 資格情報が正しいことを確認します。 設定時に追加した資格情報を確認するには、自動検出のための資格情報の変更に関する記事を参照してください。
  • vCenter の特権が不足している:vCenter にアクセスするために提供されたアクセス許可に、必要なアクセス許可がない場合は、仮想マシンを検出できない場合があります。 「Prepare an account for automatic discovery (アカウントを自動検出のために準備する)」に記載されているアクセス許可が vCenter ユーザー アカウントに追加されていることを確認します。
  • Azure Site Recovery の管理サーバー:仮想マシンが、構成サーバー/スケールアウト プロセス サーバー/マスター ターゲット サーバー のいずれかまたは複数のロールを持つ管理サーバーとして使用されている場合、ポータルからその仮想マシンを選択することはできません。 管理サーバーはレプリケートできません。
  • Azure Site Recovery サービスによって既に保護されている、またはフェールオーバーされている:仮想マシンが Site Recovery によって既に保護されているかフェールオーバーされている場合、その仮想マシンは、ポータル内で保護対象として選択することはできません。 ポータル内で探している仮想マシンが他のユーザーや別のサブスクリプションでまだ保護されていないことを確認します。
  • vCenter に接続されていない:vCenter が接続状態であることを確認します。 確認するには、[Recovery Services コンテナー]、[Site Recovery インフラストラクチャ]、[構成サーバー] の順に移動し、該当する構成サーバーをクリックします。右側にブレードが開き、関連付けられているサーバーの詳細が表示されます。 vCenter が接続されているがどうかをチェックします。 「未接続」状態である場合は、問題を解決し、ポータルで構成サーバーを更新します。 その後、仮想マシンがポータルに表示されます。
  • ESXi の電源がオフになっている:仮想マシンが存在する ESXi ホストの電源がオフ状態の場合、 Azure portal にその仮想マシンは表示されないか、Azure portal で選択することはできません。 ESXi ホストの電源をオンにし、ポータルで構成サーバーを更新します。 その後、仮想マシンがポータルに表示されます。
  • 保留中の再起動:仮想マシンの保留中の再起動がある場合、Azure portal でそのマシンを選択することはできません。 保留中の再起動アクティビティが完了していることを確認し、構成サーバーを更新します。 その後、仮想マシンがポータルに表示されます。
  • IP が見つからないか、マシンに IP アドレスが割り当てられていない: 仮想マシンに関連付けられている有効な IP アドレスがない場合、Azure portal でそのマシンを選択することはできません。 有効な IP アドレスが仮想マシンに割り当てられていることを確認し、構成サーバーを更新します。 また、いずれかの NIC に関連付けられている有効な IP アドレスがマシンに存在しない場合にも、発生する可能性があります。 有効な IP アドレスをすべての NIC に割り当てるか、IP が割り当てられていない NIC を削除します。 その後、仮想マシンがポータルに表示されます。

ポータルでグレー表示されている保護された仮想マシンのトラブルシューティング

Site Recovery でレプリケートされる仮想マシンは、システム内に重複したエントリが存在する場合、Azure portal 内で使用できません。 古いエントリの削除と問題の解決について、詳細を確認してください

もう 1 つの理由は、マシンが複製されたことです。 マシンがハイパーバイザー間で移動し、BIOS ID が変更されると、モビリティ エージェントによってレプリケーションがブロックされます。 複製されたマシンのレプリケーションは、Site Recovery ではサポートされていません。

過去 'XXX' 分間に、VM で使用可能なクラッシュ整合性復旧ポイントはありませんでした

最も一般的な問題の一部を次に示します

初期レプリケーションの問題 [エラー 78169]

接続、帯域幅、時間同期に関係する問題がないことを確認するのに加えて、次の点を確認します。

  • ウイルス対策ソフトウェアが Azure Site Recovery をブロックしていない。 Azure Site Recovery で必要なフォルダーの除外について、詳細を参照してください。

ソース マシンのチャーン レートが高い [エラー 78188]

考えられる原因:

  • 仮想マシンの一覧上のディスクでのデータ変化率 (書き込みバイト/秒) が、レプリケーション ターゲットのストレージ アカウントの種類に対して Azure Site Recovery がサポートしている上限を超えている。
  • チャーン レートが突然急増した結果、大量のデータのアップロードが保留になっている。

この問題を解決するには:

  • ターゲットのストレージ アカウントの種類 (Standard または Premium) が、ソースのチャーン レート要件に従ってプロビジョニングされていることを確認します。
  • Premium マネージド ディスク (asrseeddisk タイプ) に既にレプリケートしている場合、Site Recovery 制限に従って、ディスクのサイズが、測定されたチャーン レートをサポートしていることを確認します。 必要に応じて、asrseeddisk のサイズを増やすことができます。 次の手順に従ってください。
    • 影響を受けたレプリケーション対象のマシンの [ディスク] ブレードに移動し、レプリカ ディスク名をコピーします
    • このレプリカ マネージド ディスクに移動します
    • [概要] ブレードに、SAS URL が生成されていることを示すバナーが表示される場合があります。 このバナーをクリックして、エクスポートをキャンセルします。 バナーが表示されない場合は、この手順を無視してください。
    • SAS URL が取り消されたらすぐに、マネージド ディスクの [構成] ブレードにアクセスし、Azure Site Recovery がソース ディスク上で測定済みチャーン レートをサポートできるように、サイズを増やします
  • 観察されたチャーンが一時的なものである場合は、保留中のデータ アップロード処理が進行し復旧ポイントが作成されるまで、数時間待機します。
  • ディスクに一時ログやテスト データなどの重要ではないデータが含まれている場合は、このデータを他の場所に移動するか、このディスクをレプリケーションから完全に除外することを検討してください
  • 問題が解決しない場合は、レプリケーションの計画に役立つ Site Recovery デプロイ プランナーを使用します。

ソース マシンにハートビートがない [エラー 78174]

これは、ソース マシンの Azure Site Recovery モビリティ エージェントが構成サーバー (CS) と通信していない場合に発生します。

この問題を解決するには、次の手順に従って、ソース VM から構成サーバーへのネットワーク接続を確認します。

  1. ソース マシンが動作していることを確認します。

  2. 管理者特権を持つアカウントを使用してソース マシンにサインインします。

  3. 次のサービスが実行中であることを確認します。実行されていない場合は、サービスを再起動します。

    • Svagents (InMage Scout VX Agent)
    • InMage Scout アプリケーション サービス
  4. ソース マシンで、エラーの詳細が保存されているログを確認します。

    C:\Program Files (X86)\Microsoft Azure Site Recovery\agent\svagents*.log

プロセス サーバーにハートビートがない [error 806]

プロセス サーバー (PS) からハートビートがない場合は、次を確認します。

  1. PS VM が稼働している。

  2. エラーの詳細に関する PS の次のログを確認します。

    C:\ProgramData\ASR\home\svsystems\eventmanager*.log
    および
    C:\ProgramData\ASR\home\svsystems\monitor_protection*.log

マスター ターゲット サーバーにハートビートがない [エラー 78022]

これは、マスター ターゲットの Azure Site Recovery モビリティ エージェントが構成サーバーと通信していない場合に発生します。

この問題を解決するには、次の手順に従ってサービスの状態を確認します。

  1. マスター ターゲット VM が動作していることを確認します。
  2. 管理者特権を持つアカウントを使用してマスター ターゲット VM にサインインします。
    • svagents サービスが実行中であることを確認します。 実行中の場合は、サービスを再起動します。

    • エラーの詳細が保存されているログを確認します。

      C:\Program Files (X86)\Microsoft Azure Site Recovery\agent\svagents*.log

  3. マスター ターゲットを構成サーバーに登録するには、フォルダー %PROGRAMDATA%\ASR\Agent に移動し、コマンド プロンプトで以下を実行します。
    cmd
    cdpcli.exe --registermt
    
    net stop obengine
    
    net start obengine
    
    exit
    

エラー ID 78144 - 過去 "XXX" 分間に、VM 使用可能なアプリ整合性復旧ポイントはありません

モビリティ エージェントのバージョン 9.23 および 9.27 では、VSS インストール エラーの動作を処理するための機能強化が行われています。 VSS の障害についてのトラブルシューティングの最適なガイダンスを得るには、確実に最新バージョンを使用します。

最も一般的な問題の一部を次に示します

原因 1:SQL Server 2008/2008 R2 での既知の問題

修正方法: SQL Server 2008/2008 R2 には、既知の問題があります。 サポート技術情報の「Azure Site Recovery Agent or other non-component VSS backup fails for a server hosting SQL Server 2008 R2 (SQL Server 2008 R2 をホストしているサーバーで Azure Site Recovery エージェントまたはその他の非コンポーネント VSS バックアップが失敗する)」を参照してください

原因 2:AUTO_CLOSE DB があるいずれかのバージョンの SQL Server インスタンスをホストするサーバーで Azure Site Recovery ジョブが失敗します

修正方法: サポート技術情報の記事を参照してください

原因 3:SQL Server 2016 および 2017 での既知の問題

修正方法: サポート技術情報の記事を参照してください

原因 4:Linux サーバーでアプリの整合性が有効になっていない

修正方法: Linux オペレーティング システム用の Azure Site Recovery では、アプリの整合性のためのアプリケーション カスタム スクリプトがサポートされています。 プリオプションとポストオプションを含むカスタム スクリプトが、アプリの整合性のために Azure Site Recovery の Mobility Agent によって使用されます。 これを有効にする手順は、こちらをご覧ください。

さらにトラブルシューティングを続けるには、ソース マシン上のファイルを確認して、失敗の正確なエラー コードを取得します。

C:\Program Files (x86)\Microsoft Azure Site Recovery\agent\Application Data\ApplicationPolicyLogs\vacp.log

ファイル内のエラーは、どのように探せば良いでしょうか。 エディターで vacp.log ファイルを開いて、"vacpError" という文字列を検索します

Ex: vacpError:220#Following disks are in FilteringStopped state [\\.\PHYSICALDRIVE1=5, ]#220|^|224#FAILED: CheckWriterStatus().#2147754994|^|226#FAILED to revoke tags.FAILED: CheckWriterStatus().#2147754994|^|

上の例では、2147754994 がエラー コードであり、以下のようなエラーについての情報を示しています

VSS ライターがインストールされていません - エラー 2147221164

修正方法: アプリケーション整合性タグを生成するために、Azure Site Recovery では Microsoft ボリューム シャドウ コピー サービス (VSS) が使用されます。 これによって、アプリ整合性スナップショットを作成する操作のために、VSS プロバイダーがインストールされます。 この VSS プロバイダーは、サービスとしてインストールされます。 VSS プロバイダー サービスがインストールされていない場合は、アプリケーション整合性スナップショットの作成が失敗し、エラー ID 0x80040154 "クラスが登録されていません" というエラーが発生します。
VSS ライターのインストールのトラブルシューティングに関する記事を参照してください

VSS ライターが無効です - エラー 2147943458

修正方法: アプリケーション整合性タグを生成するために、Azure Site Recovery では Microsoft ボリューム シャドウ コピー サービス (VSS) が使用されます。 これによって、アプリ整合性スナップショットを作成する操作のために、VSS プロバイダーがインストールされます。 この VSS プロバイダーは、サービスとしてインストールされます。 VSS プロバイダー サービスが無効になっている場合は、アプリケーション整合性スナップショットの作成が失敗し、エラー ID "指定したサービスは無効であるため、開始できません (0x80070422)" というエラーが発生します。

  • VSS が無効になっている場合は、
    • VSS プロバイダー サービスのスタートアップの種類が [自動] に設定されていることを確認します。
    • 次のサービスを再起動します。
      • VSS サービス
      • Azure Site Recovery VSS プロバイダー
      • VDS サービス

VSS PROVIDER NOT_REGISTERED - エラー 2147754756

修正方法: アプリケーション整合性タグを生成するために、Azure Site Recovery では Microsoft ボリューム シャドウ コピー サービス (VSS) が使用されます。 Azure Site Recovery VSS プロバイダー サービスがインストールされているかどうかを確認してください。

  • 以下のコマンドを使用して、プロバイダーのインストールを再試行します。
  • 既存のプロバイダーのアンインストール: C:\Program Files (x86)\Microsoft Azure Site Recovery\agent\InMageVSSProvider_Uninstall.cmd
  • 再インストール: C:\Program Files (x86)\Microsoft Azure Site Recovery\agent\InMageVSSProvider_Install.cmd

VSS プロバイダー サービスのスタートアップの種類が [自動] に設定されていることを確認します。 - 次のサービスを再起動します。 - VSS サービス - Azure Site Recovery VSS プロバイダー - VDS サービス

エラー ID 95001 - 不十分なアクセス許可

このエラーは、レプリケーションを有効にしようとしたときに、アプリケーション フォルダーに十分なアクセス許可がない場合に発生します。

修正方法: この問題を解決するには、IUSR ユーザーが以下のすべてのフォルダーに対する所有者ロールを持っていることを確認してください。

  • C\ProgramData\Microsoft Azure Site Recovery\private
  • インストール ディレクトリ。 たとえば、インストール ディレクトリが F ドライブの場合、以下に対する正しいアクセス許可を指定します。
    • F:\Program Files (x86)\Microsoft Azure Site Recovery\home\svsystems
  • インストール ディレクトリの \pushinstallsvc フォルダー。 たとえば、インストール ディレクトリが F ドライブの場合、以下に対する正しいアクセス許可を指定します。
    • F:\Program Files (x86)\Microsoft Azure Site Recovery\home\svsystems\pushinstallsvc
  • インストール ディレクトリの \etc フォルダー。 たとえば、インストール ディレクトリが F ドライブの場合、以下に対する正しいアクセス許可を指定します。
    • F:\Program Files (x86)\Microsoft Azure Site Recovery\home\svsystems\etc
  • C:\Temp
  • C:\thirdparty\php5nts
  • 以下のパスの下にあるすべての項目
    • C:\thirdparty\rrdtool-1.2.15-win32-perl58\rrdtool\Release*

レプリケートされたサーバーでの時間の変更に対するトラブルシューティングと処理

このエラーは、変更を修正するために、ソース マシンの時間が進み、その後短時間で戻る場合に発生します。 時間が非常に迅速に修正されるため、変更に気付かないことがあります。

解決方法: この問題を解決するには、システム時間がずれている未来時間を超えるまで待ちます。 もう 1 つの選択肢は、レプリケーションを無効化し、もう一度有効化することです。これは、フォワード レプリケーション (データがオンプレミスから Azure にレプリケートされる) の場合のみ実行でき、リバース レプリケーション (データが Azure からオンプレミスにレプリケートされる) には適用できません。

次のステップ

さらにサポートが必要な場合は、Azure Site Recovery に関する Microsoft Q&A 質問ページに質問を投稿してください。 弊社のアクティブなコミュニティを通じて、エンジニアがサポートいたします。