Udostępnij przez


Rozwiązywanie problemów z replikacją maszyn wirtualnych VMware i serwerów fizycznych

W tym artykule opisano niektóre typowe problemy i określone błędy, które mogą wystąpić podczas replikacji lokalnych maszyn wirtualnych VMware i serwerów fizycznych na platformę Azure przy użyciu usługi Site Recovery.

Krok 1. Monitorowanie kondycji serwera przetwarzania

Usługa Site Recovery używa serwera przetwarzania do odbierania i optymalizowania replikowanych danych oraz wysyłania ich na platformę Azure.

Zalecamy monitorowanie kondycji serwerów przetwarzania w portalu, aby upewnić się, że są one podłączone i działają prawidłowo, oraz że trwa replikacja dla maszyn źródłowych skojarzonych z serwerem przetwarzania.

Krok 2. Rozwiązywanie problemów z łącznością i replikacją

Problemy z łącznością między serwerem źródłowym a serwerem przetwarzania lub między serwerem przetwarzania a platformą Azure często powodują początkowe i trwające błędy replikacji.

Aby rozwiązać te problemy, zdiagnozuj łączność i replikację.

Krok 3. Rozwiązywanie problemów z maszynami źródłowymi, które nie są dostępne do replikacji

Podczas próby wybrania maszyny źródłowej w celu włączenia replikacji przy użyciu usługi Site Recovery maszyna może być niedostępna z jednego z następujących powodów:

  • Dwie maszyny wirtualne z tym samym identyfikatorem UUID wystąpienia: jeśli dwie maszyny wirtualne w systemie vCenter mają ten sam identyfikator UUID wystąpienia, na portalu Azure zostanie wyświetlona pierwsza maszyna wirtualna odnaleziona przez serwer konfiguracji. Aby rozwiązać ten problem, upewnij się, że żadna z maszyn wirtualnych nie ma tego samego unikalnego identyfikatora UUID instancji. Ten scenariusz jest często spotykany w wystąpieniach, w których maszyna wirtualna kopii zapasowej staje się aktywna i jest rejestrowana w naszych rekordach odnajdywania. Zapoznaj się z tematem Azure Site Recovery VMware-to-Azure: Jak wyczyścić zduplikowane lub nieaktualne wpisy, aby rozwiązać problem.
  • Nieprawidłowe poświadczenia użytkownika programu vCenter: Upewnij się, że dodano poprawne poświadczenia programu vCenter podczas konfigurowania serwera konfiguracji przy użyciu szablonu OVF lub ujednoliconej konfiguracji. Aby sprawdzić poświadczenia dodane podczas instalacji, zobacz Modyfikowanie poświadczeń na potrzeby automatycznego odnajdywania.
  • Niewystarczające uprawnienia programu vCenter: jeśli uprawnienia podane do uzyskiwania dostępu do programu vCenter nie mają wymaganych uprawnień, może wystąpić błąd odnajdywania maszyn wirtualnych. Upewnij się, że uprawnienia opisane w sekcji Przygotowywanie konta do automatycznego odnajdywania są dodawane do konta użytkownika programu vCenter.
  • Serwery zarządzające usługi Azure Site Recovery: Jeśli maszyna wirtualna działa jako serwer zarządzający pełniący jedną z następujących ról — serwer konfiguracji, serwer procesu w architekturze scale-out lub główny serwer docelowy, nie będzie można wybrać tej maszyny wirtualnej z portalu. Nie można replikować serwerów zarządzania.
  • Już chronione/przełączane w tryb failover za pośrednictwem usług Azure Site Recovery: jeśli maszyna wirtualna jest już chroniona lub przełączona w tryb failover za pośrednictwem usługi Site Recovery, maszyna wirtualna nie jest dostępna do wybrania ochrony w portalu. Upewnij się, że maszyna wirtualna, której szukasz w portalu, nie jest jeszcze chroniona przez żadnego innego użytkownika ani w ramach innej subskrypcji.
  • Program vCenter nie nawiązał połączenia: sprawdź, czy program vCenter jest w stanie połączenia. Aby sprawdzić, przejdź do magazynu usług Recovery Services > infrastruktura Site Recovery > Serwery konfiguracji > Kliknij na odpowiedni serwer konfiguracji > otworzy się blok po prawej stronie ze szczegółami skojarzonych serwerów. Sprawdź, czy program vCenter jest połączony. Jeśli jest w stanie "Nie połączono", rozwiąż problem, a następnie odśwież serwer konfiguracji w portalu. Po tym maszyna wirtualna przestaje być wyświetlana w portalu.
  • ESXi wyłączony: jeśli host ESXi, w którym znajduje się maszyna wirtualna, jest wyłączony, maszyna wirtualna nie jest wyświetlana na liście lub nie można jej wybrać w Azure Portal. Włącz hosta ESXi i odśwież serwer konfiguracji w portalu. Następnie maszyna wirtualna zostanie wyświetlona w portalu.
  • Oczekiwanie na ponowny rozruch: Jeśli na maszynie wirtualnej jest oczekujący ponowny rozruch, nie będzie można wybrać tej maszyny w Azure Portal. Upewnij się, że wykonasz oczekujące działania ponownego uruchomienia i odświeżysz serwer konfiguracji. Następnie maszyna wirtualna zostanie wyświetlona w portalu.
  • Nie można odnaleźć adresu IP lub maszyna nie ma adresu IP: jeśli maszyna wirtualna nie ma skojarzonego z nim prawidłowego adresu IP, nie możesz wybrać maszyny w witrynie Azure Portal. Upewnij się, że przypiszesz prawidłowy adres IP do maszyny wirtualnej i odśwież serwer konfiguracji. Może to być również spowodowane tym, że maszyna nie ma prawidłowego adresu IP skojarzonego z jedną z kart sieciowych. Przypisz prawidłowy adres IP do wszystkich kart sieciowych lub usuń kartę sieciową, która nie ma adresu IP. Następnie maszyna wirtualna zostanie wyświetlona w portalu.

Rozwiąż problem z wyszarzonymi chronionymi maszynami wirtualnymi w portalu

Maszyny wirtualne replikowane w usłudze Site Recovery nie są dostępne w witrynie Azure Portal, jeśli w systemie występują zduplikowane wpisy. Dowiedz się więcej o usuwaniu nieaktualnych wpisów i rozwiązywaniu problemu.

Innym powodem może być sklonowanie maszyny. Gdy maszyny przechodzą między hipernadzorcami, a jeżeli identyfikator BIOS zmienia się, agent mobilności blokuje replikację. Replikacja sklonowanych maszyn nie jest obsługiwana przez usługę Site Recovery.

Brak punktu odzyskiwania związanego z awarią dla maszyny wirtualnej w ciągu ostatnich "XXX" minut

Poniżej znajduje się lista niektórych typowych problemów:

Problemy z replikacją początkową [błąd 78169]

Oprócz zadbania o to, aby nie było problemów z łącznością, przepustowością ani synchronizacją czasu, upewnij się, że:

  • Żadne oprogramowanie antywirusowe nie blokuje usługi Azure Site Recovery. Dowiedz się więcej na temat wykluczeń folderów wymaganych w usłudze Azure Site Recovery.

Maszyny źródłowe z wysokim współczynnikiem zmian [błąd 78188]

Możliwe przyczyny:

  • Szybkość zmiany danych (liczba bajtów zapisu/s) na wymienionych dyskach maszyny wirtualnej jest większa niż limity obsługiwane przez usługę Azure Site Recovery dla typu docelowego konta magazynu replikacji.
  • Nagły wzrost współczynnika rezygnacji skutkuje tym, że duża ilość danych oczekuje na załadowanie.

Aby rozwiązać ten problem:

  • Upewnij się, że docelowy typ konta magazynu (Standardowy lub Premium) jest przypisany zgodnie z wymaganiami współczynnika rotacji w systemie źródłowym.

  • Jeśli już replikujesz do dysku zarządzanego w warstwie Premium (typ asrseeddisk), upewnij się, że rozmiar dysku obsługuje obserwowany współczynnik zmiany danych zgodnie z limitami usługi Site Recovery. W razie potrzeby można zwiększyć rozmiar dysku asrseed. Wykonaj te kroki:

    • Przejdź do bloku Dyski maszyny, której dotyczy problem, i skopiuj nazwę dysku repliki
    • Przejdź do tej repliki dysku zarządzanego
    • Możesz zobaczyć baner w zakładce Przegląd informujący, że został wygenerowany adres URL sygnatury dostępu współdzielonego. Kliknij ten baner i anuluj eksport. Zignoruj ten krok, jeśli nie widzisz baneru.
    • Po odwołaniu adresu URL SAS przejdź do zakładki Konfiguracja dysku zarządzanego i zwiększ rozmiar, aby usługa Azure Site Recovery obsługiwała obserwowane tempo zmian na dysku źródłowym.
  • Jeśli zaobserwowany współczynnik zmian jest tymczasowy, poczekaj kilka godzin na przekazanie oczekujących danych, aby nadrobić zaległości i utworzyć punkty odzyskiwania.

  • Jeśli dysk zawiera dane niekrytyczne, takie jak tymczasowe dzienniki, dane testowe itp., rozważ przeniesienie tych danych w innym miejscu lub całkowite wykluczenie tego dysku z replikacji

  • Jeśli problem będzie nadal występować, użyj planisty wdrażania usługi Site Recovery, aby zaplanować replikację.

Maszyny źródłowe bez pulsu [błąd 78174]

Dzieje się tak, gdy agent mobilności usługi Azure Site Recovery na maszynie źródłowej komunikuje się z serwerem konfiguracji (CS).

Aby rozwiązać ten problem, wykonaj następujące kroki, aby zweryfikować łączność sieciową ze źródłowej maszyny wirtualnej do serwera konfiguracji:

  1. Sprawdź, czy maszyna źródłowa jest uruchomiona.

  2. Zaloguj się do maszyny źródłowej przy użyciu konta z uprawnieniami administratora.

  3. Zweryfikuj, czy następujące usługi są uruchomione, a jeśli nie, uruchom ponownie te usługi.

    • Svagents (InMage Scout VX Agent)
    • Usługa aplikacji InMage Scout
  4. Na maszynie źródłowej sprawdź dzienniki w lokalizacji, aby uzyskać szczegółowe informacje o błędzie:

    C:\Program Files (X86)\Microsoft Azure Site Recovery\agent\svagents*.log

Serwer przetwarzania bez pulsu [błąd 806]

Jeśli z serwera przetwarzania nie ma sygnału pulsu, sprawdź, czy:

  1. Maszyna wirtualna serwera przetwarzania jest uruchomiona

  2. Sprawdź następujące dzienniki na serwerze przetwarzania, aby uzyskać szczegółowe informacje o błędzie:

    C:\ProgramData\ASR\home\svsystems\eventmanager*.log
    and
    C:\ProgramData\ASR\home\svsystems\monitor_protection*.log

Główny serwer docelowy bez sygnału [błąd 78022]

Dzieje się tak, gdy agent mobilności usługi Azure Site Recovery na głównym obiekcie docelowym nie komunikuje się z serwerem konfiguracji.

Aby rozwiązać ten problem, wykonaj następujące kroki, aby zweryfikować stan usługi:

  1. Sprawdź, czy główna maszyna wirtualna docelowa jest uruchomiona.

  2. Zaloguj się do głównej maszyny wirtualnej docelowej przy użyciu konta z uprawnieniami administratora.

    • Sprawdź, czy usługa svagents jest uruchomiona. Jeśli jest uruchomiona, uruchom ponownie usługę

    • Sprawdź dzienniki w lokalizacji, aby uzyskać szczegółowe informacje o błędzie:

      C:\Program Files (X86)\Microsoft Azure Site Recovery\agent\svagents*.log

  3. Aby zarejestrować główny obiekt docelowy na serwerze konfiguracji, przejdź do folderu %PROGRAMDATA%\ASR\Agent i uruchom następujące polecenie w wierszu polecenia:

    cmd
    cdpcli.exe --registermt
    
    net stop obengine
    
    net start obengine
    
    exit
    

Nie można pomyślnie włączyć ochrony dla maszyny wirtualnej [błąd 78253]

Ten błąd może wystąpić, jeśli zasady replikacji nie zostały prawidłowo skojarzone z serwerem konfiguracji. Może się to również zdarzyć, jeśli zasady skojarzone z serwerem konfiguracji są nieprawidłowe.

Aby potwierdzić przyczynę tego błędu, przejdź do magazynu odzyskiwania, a następnie zarządzaj infrastrukturą usługi Site Recovery, aby wyświetlić zasady replikacji dla maszyn VMware i fizycznych oraz sprawdzić stan skonfigurowanych zasad.

Aby rozwiązać ten problem, możesz skojarzyć zasady z używanym serwerem konfiguracji lub utworzyć nowe zasady replikacji i skojarzyć je. Jeśli polityka jest nieprawidłowa, możesz ją rozłączyć i usunąć.

Identyfikator błędu 95001 — znaleziono niewystarczające uprawnienia

Ten błąd występuje podczas próby włączenia replikacji, a foldery aplikacji nie mają wystarczających uprawnień.

Obejście: Aby rozwiązać ten problem, upewnij się, że użytkownik IUSR ma rolę właściciela dla wszystkich następujących folderów —

  • C\ProgramData\Microsoft Azure Site Recovery\private
  • Katalog instalacyjny. Jeśli na przykład katalog instalacyjny to dysk F, podaj odpowiednie uprawnienia:
    • F:\Program Files (x86)\Microsoft Azure Site Recovery\home\svsystems
  • Folder \pushinstallsvc w katalogu instalacyjnym. Jeśli na przykład katalog instalacyjny to dysk F, podaj odpowiednie uprawnienia do —
    • F:\Program Files (x86)\Microsoft Azure Site Recovery\home\svsystems\pushinstallsvc
  • Folder \etc w katalogu instalacyjnym. Jeśli na przykład katalog instalacyjny to dysk F, ustaw odpowiednie uprawnienia do -
    • F:\Program Files (x86)\Microsoft Azure Site Recovery\home\svsystems\etc
  • C:\Temp
  • C:\thirdparty\php5nts
  • Wszystkie elementy znajdujące się pod następującą ścieżką:
    • C:\thirdparty\rrdtool-1.2.15-win32-perl58\rrdtool\Release*

Rozwiązywanie problemów ze zmianami czasu na replikowanych serwerach i obsługa ich

Ten błąd występuje, gdy czas na maszynie źródłowej przemieszcza się do przodu, a następnie przesuwa się z powrotem w krótkim czasie, aby skorygować zmianę. Możliwe, że nie zauważysz zmiany, ponieważ czas jest poprawiany szybko.

Obejście: Aby rozwiązać ten problem, poczekaj, aż czas systemowy przekroczy niesymetryczny czas w przyszłości. Inną opcją jest wyłączenie i ponowne włączenie replikacji, co jest możliwe tylko w przypadku replikacji przesyłania dalej (danych replikowanych ze środowiska lokalnego do platformy Azure) i nie ma zastosowania do replikacji odwrotnej (dane replikowane z platformy Azure do środowiska lokalnego).

Dalsze kroki

Jeśli potrzebujesz dodatkowej pomocy, opublikuj swoje pytanie na stronie pytań i odpowiedzi firmy Microsoft dla usługi Azure Site Recovery. Mamy aktywną społeczność, a jeden z naszych inżynierów może Ci pomóc.