Ciągłość działania i odzyskiwanie po awarii dla rozwiązania Azure VMware Solution

Ten scenariusz o skali przedsiębiorstwa pomaga poprawić ciągłość działania i odzyskiwanie po awarii (BCDR). Rozwiązanie Azure VMware Solution udostępnia chmury prywatne, które zawierają klastry VMware vSphere utworzone na podstawie dedykowanej infrastruktury platformy Azure bez systemu operacyjnego. Rozwiązanie zapewnia co najmniej trzy hosty ESXi, maksymalnie 16 hostów na klaster. Wszystkie aprowizowane chmury prywatne mają oprogramowanie VMware vCenter Server, VMware vSAN, VMware vSphere i VMware NSX-T Data Center. Aby dowiedzieć się więcej o umowie dotyczącej poziomu usług (SLA) dla usługi Azure VMware Solution, zobacz Umowa SLA dla rozwiązania Azure VMware Solution.

Niezależnie od tego, czy masz rozwiązanie lokalne, czy rozwiązanie Azure VMware, należy wziąć pod uwagę różne czynniki BCDR, aby przygotować się do awarii. Niezawodny plan BCDR ma na celu ochronę firmy przed utratą danych, utratą finansową i przestojem, jeśli wystąpi zdarzenie powodujące zakłócenia. W poniższym drzewie decyzyjnym przedstawiono różne opcje BCDR dostępne dla rozwiązania Azure VMware Solution.

Diagram that shows a flow chart for business continuity and disaster recovery.

Uwaga

Środowisko pilotażowe jest konfigurowane z minimalną konfiguracją, z tylko podstawowymi składnikami obsługującymi krytyczny zestaw aplikacji. Można jednak skalować w poziomie i duplikować więcej hostów, aby pobrać większość obciążenia, jeśli nastąpi przejście w tryb failover. W przypadku odzyskiwania po awarii obciążeń rozwiązania Azure VMware intensywnie korzystających z zasobów obliczeniowych i pamięci wymagana jest ta sama ilość miejsca w lokacji dodatkowej.

Zagadnienia dotyczące projektowania ciągłości działania

  • Zasady magazynu VMware vSAN w rozwiązaniu Azure VMware Solution są implementowane z myślą o dostępności magazynu. Jeśli klaster ma od trzech do pięciu hostów, liczba niepowodzeń hostów, które mogą być tolerowane bez utraty danych, jest równa jednej. Jeśli klaster ma od 6 do 16 hostów, liczba niepowodzeń hostów tolerowanych przed wystąpieniem utraty danych może wynosić dwa. Zasady magazynu VMware vSAN można stosować dla poszczególnych maszyn wirtualnych. Chociaż te zasady są domyślne, możesz zmienić zasady zgodnie z wymaganiami niestandardowymi. Aby uzyskać więcej informacji, zobacz Pojęcia dotyczące magazynu usługi Azure VMware Solution.

  • Wysoka dostępność vSphere jest domyślnie włączona w rozwiązaniu Azure VMware Solution. Zasady dostępu o wysokiej dostępności rezerwują pojemność obliczeniową i pamięć dla jednego węzła. Ta rezerwacja zapewnia wystarczającą pojemność do ponownego uruchomienia obciążeń w innym węźle w klastrze usługi Azure VMware Solution.

  • Wysoka dostępność z klastrem rozproszonym: w przypadku usługi Azure VMware Solution hosty ESXi wdrożone w standardowym klastrze vSphere tradycyjnie znajdują się w jednej strefie dostępności platformy Azure i są chronione przez wysoką dostępność vSphere. Jednak obciążenia nie są chronione przed awarią strefy dostępności. Aby chronić przed awarią, pojedynczy klaster vSAN może obejmować dwie oddzielne strefy dostępności, nazywane klastrem rozproszony vSAN. Aby uzyskać więcej informacji, zobacz Deploy vSAN stretched clusters (Wdrażanie klastrów rozproszony vSAN).

  • Wybierz zweryfikowane rozwiązanie do tworzenia kopii zapasowych dla maszyn wirtualnych VMware vSphere, takich jak microsoft Azure Backup Server lub rozwiązanie do tworzenia kopii zapasowych partnera.

  • Aby uzyskać informacje o obsługiwanych funkcjach w rozwiązaniach do tworzenia kopii zapasowych partnerów, zapoznaj się z odpowiednią dokumentacją partnera.

    Uwaga

    Kopie zapasowe serwerów vCenter Server i NSX-T Data Center dla chmur prywatnych są tworzone co godzinę, a kopie zapasowe są przechowywane przez trzy dni.

  • Składniki usługi Azure VMware Solution, takie jak vCenter Server, menedżer NSX-T lub MENEDŻER HCX, to usługi zarządzane, dla których platforma Azure zarządza kopiami zapasowymi. Aby przywrócić z kopii zapasowej, utwórz żądanie pomocy technicznej platformy Azure.

Zalecenia dotyczące projektowania ciągłości działania

  • Użyj usługi Azure Backup Server, aby utworzyć kopię zapasową chmury prywatnej usługi Azure VMware Solution. Aby uzyskać więcej informacji, zobacz Tworzenie kopii zapasowych maszyn wirtualnych VMware vSphere za pomocą usługi Azure Backup. Obsługiwane topologie wdrażania obejmują agenta MARS i menedżera ochrony danych. Każda topologia wdrożenia ma własną macierz obsługi, ograniczenia i ograniczenia.

  • Wdróż usługę Azure Backup Server w tym samym regionie świadczenia usługi Azure co chmura prywatna rozwiązania Azure VMware Solution. Ta metoda wdrażania zmniejsza koszty ruchu, ułatwia administrowanie i utrzymuje topologię podstawową/pomocniczą. Zapoznaj się z przewodnikiem wyboru regionów świadczenia usługi Azure, aby zapoznać się z najlepszymi rozwiązaniami dotyczącymi wdrażania regionów świadczenia usługi Azure.

  • Usługę Azure Backup można wdrożyć jako maszynę wirtualną IaaS (Infrastruktura jako usługa) platformy Azure lub w chmurze prywatnej usługi Azure VMware Solution. Zdecydowanie zaleca się wdrożenie go poza chmurą prywatną usługi Azure VMware Solution. Wdróż usługę Backup w sieci wirtualnej platformy Azure i upewnij się, że ta sieć wirtualna jest połączona z tą samą usługą ExpressRoute połączoną z chmurą prywatną usługi Azure VMware Solution. Uruchamianie usługi Backup Server poza chmurą prywatną usługi Azure VMware Solution pomaga zmniejszyć zużycie sieci vSAN, ponieważ sieć vSAN jest ograniczonym zasobem pojemności w chmurze prywatnej usługi Azure VMware Solution.

    Usługa Azure Backup Server wdrożona jako maszyna wirtualna IaaS platformy Azure.

    Diagram that shows Azure Backup Server deployed as an Azure IaaS VM.

    Usługa Azure Backup Server wdrożona jako maszyna wirtualna usługi Azure VMware Solution.

    Diagram that shows Azure Backup Server deployed as an Azure VMware Solution VM.

  • Skorzystaj z listy kontrolnej wymagań dotyczących wydajności aplikacji, aby uzyskać odpowiednią pojemność i typ dysku, na przykład HDD, SSD lub Ultra. Rozważ jednostkę SKU maszyny wirtualnej IaaS platformy Azure, która obsługuje typ dysku i pojemność na potrzeby operacji tworzenia kopii zapasowych.

  • Użyj planisty pojemności usługi Azure Backup Server, aby określić liczbę serwerów, magazynu i wymagań dotyczących liczby operacji we/wy na sekundę dla każdego z nich. W przypadku podawania wartości "Całkowity rozmiar obciążenia (GB)*" w planisty pojemności użyj mediany między wartością "używanego magazynu" i "przydzielonym magazynem" wszystkich maszyn wirtualnych w programie vCenter, które chcesz utworzyć kopię zapasową.

  • Użyj pul magazynów z usługą Azure Backup Server w celu zwiększenia liczby operacji we/wy na sekundę dysku/przepływności. Używaj magazynu warstwowego na serwerze kopii zapasowych w celu wykonywania rozszerzonych operacji. Ustaw wartość konfiguracji DisableWriteAutoTiering na wartość 1 na woluminie USŁUGI MABS, aby cała warstwa wydajności jest dostępna do przechowywania metadanych systemu plików ReFS.

  • Zidentyfikuj liczbę równoległych zadań tworzenia kopii zapasowych i operacji przywracania do uruchomienia na serwerze usługi Azure Backup. Obecnie obsługiwane są osiem równoległych zadań tworzenia kopii zapasowych. Mierzenie ilości czasu potrzebnego do utworzenia kopii zapasowej i przywrócenia obciążeń o znaczeniu krytycznym dla wielu przebiegów. Sprawdź, czy czas tworzenia i przywracania kopii zapasowych spełnia wymagania celu punktu odzyskiwania i celu odzyskiwania dla serwera usługi Azure Backup. Upewnij się, że magazyn danych avS vSAN ma wystarczającą pojemność do przechowywania przywróconej kopii zapasowej.

  • Dodaj niezbędne wyjątki programu antywirusowego dla plików i folderów usługi Azure Backup Server zgodnie z opisem w tym miejscu , jeśli jakiekolwiek oprogramowanie antywirusowe/chroniące przed złośliwym oprogramowaniem działa na serwerze Azure Backup Server. W przypadku korzystania z agenta ochrony programu DPM na dowolnej maszynie wirtualnej usługi Azure VMware Solution do tworzenia kopii zapasowych aplikacji (na przykład SQL, Sharepoint itp.), wyłącz monitorowanie dpmra.exe w czasie rzeczywistym.

  • Skonfiguruj odpowiednie reguły sieciowej grupy zabezpieczeń (sieciowej grupy zabezpieczeń) w podsieci obsługującej usługę Azure Backup Server, aby umożliwić komunikację sieciową z agenta ochrony programu DPM uruchomionego na chronionej maszynie wirtualnej w rozwiązaniu Azure VMware Solution. Agent ochrony programu DPM komunikuje się z usługą Azure Backup Server na dowolnym porcie dynamicznym z zakresu od 1024 do 65535.

  • Obecnie usługa Azure Backup Server nie obsługuje przywracania między regionami dla chmury prywatnej usługi Azure VMware Solution. Zapoznaj się z sekcją rozwiązań do tworzenia kopii zapasowych partnerów i odzyskiwania po awarii, gdy wymagane jest odzyskiwanie rozwiązania Azure VMware Solution w wielu regionach.

Zagadnienia dotyczące projektowania odzyskiwania po awarii

  • Dopasuj wymagania biznesowe do celów czasu odzyskiwania (RTO), pojemności i celów punktu odzyskiwania (RPO) dla aplikacji. Zaplanuj i zaprojektuj odpowiednio, aby osiągnąć te cele przy użyciu najbardziej odpowiedniej technologii replikacji. Na przykład natywnie replikuj bazy danych SQL przy użyciu zawsze włączonej grupy dostępności SQL lub użyj narzędzia odzyskiwania po awarii, takiego jak program VMware Site Recovery Manager.

  • Określ docelową lokację odzyskiwania po awarii dla chronionej chmury prywatnej usługi Azure VMware Solution. Ta witryna ma wpływ na to, które narzędzia odzyskiwania po awarii są odpowiednie dla środowiska. Jeśli na przykład chcesz odzyskać obciążenia usługi Azure VMware Solution na maszynach wirtualnych IaaS na platformie Azure, możesz rozważyć usługę Azure Site Recovery lub Zerto.

  • Określ, który podzbiór obciążeń usługi Azure VMware Solution wymaga ochrony, jeśli wystąpi zdarzenie odzyskiwania po awarii. Rozważ kategoryzowanie obciążeń na podstawie priorytetu: P0 dla obciążeń o znaczeniu krytycznym dla działania firmy oraz P1, P2, P3 dla innych obciążeń, które są ważne, ale nie tak krytyczne dla działania firmy. Plan ciągłości działania klienta definiuje poziomy priorytetów, co pomaga kontrolować koszty związane z implementacją odzyskiwania po awarii.

  • W większości przypadków środowiska nieprodukcyjne, takie jak deweloperskie, testowe lub UAT, nie muszą przejść w tryb failover do lokacji dodatkowej. Należy uruchomić światło pilotażowe w lokacji dodatkowej z ograniczoną pojemnością dla obciążeń produkcyjnych i krytycznych, aby zaoszczędzić na kosztach. Aby zwiększyć pojemność, można skalować w poziomie, aby dodać hosty ESXi do klastra podczas zdarzenia odzyskiwania po awarii.

  • W przypadku wdrożeń pilotażowych w szczególności upewnij się, że w lokacji dodatkowej zostały zabezpieczone wszystkie wymagane limity przydziału hostów, aby nie trzeba było czekać na wymaganą pojemność podczas pełnego skalowania w poziomie. Zobacz Request host quota for Azure VMware Solution (Żądanie limitu przydziału hostów dla rozwiązania Azure VMware Solution).

  • Skonfiguruj funkcjonalne role domeny, takie jak kontrolery domeny usługi Active Directory, w środowisku pomocniczym.

  • Rozwiązania od partnerów, takich jak JetStream i Zerto, są ogólnie dostępne i weryfikowane w rozwiązaniu Azure VMware Solution. Obsługują one większość scenariuszy odzyskiwania po awarii i mogą zapewnić szybsze odzyskiwanie przy użyciu niemal zerowego celu punktu odzyskiwania.

  • Program VMware Site Recovery Manager, Jetstream i Zerto obsługują migrację z lokalizacji innych firm do rozwiązania Azure VMware Solution.

  • VMware HCX to również ekonomiczne rozwiązanie do odzyskiwania po awarii. Jednak nie jest zalecane w przypadku dużych obciążeń produkcyjnych ze względu na ręczną aranżację.

  • W przypadku odzyskiwania po awarii między chmurami prywatnymi usługi Azure VMware Solution w różnych regionach świadczenia usługi Azure należy włączyć usługę ExpressRoute Global Reach między obydwoma obwodami usługi ExpressRoute zaplecza. Te obwody tworzą łączność podstawowej do dodatkowej chmury prywatnej, jeśli jest to wymagane w przypadku rozwiązań takich jak VMware SRM i VMware HCX.

  • W przypadku odzyskiwania po awarii między chmurami prywatnymi usługi Azure VMware Solution w tym samym regionie świadczenia usługi Azure należy włączyć połączenie między usługą Azure VMware Solution. Tworzy on połączenie routingu między sieciami zarządzania i obciążeniami chmur prywatnych usługi Azure VMware Solution na potrzeby komunikacji między chmurami. Upewnij się, że przestrzeń adresów IP kierowanych w każdej chmurze prywatnej jest unikatowa i nie nakłada się na siebie.

  • Podczas pracy z odzyskiwaniem po awarii możesz użyć tej samej źródłowej przestrzeni adresowej IP w regionie podstawowym platformy Azure i pomocniczym regionie świadczenia usługi Azure. Wymaga to jednak dodatkowych prac projektowych i inżynieryjnych.

    • Zachowaj te same adresy IP: maszyny wirtualne w dodatkowej lokacji usługi Azure VMware Solution można odzyskać przy użyciu tego samego źródłowego adresu IP co lokacja główna. W przypadku tej metody utwórz izolowane sieci VLAN lub segmenty NSX-T w lokacji dodatkowej i upewnij się, że żadne z tych izolowanych sieci VLAN lub segmentów nie są połączone ze środowiskiem. Zmodyfikuj trasy odzyskiwania po awarii, aby odzwierciedlić, że podsieć została przeniesiona do lokacji dodatkowej i nowej lokalizacji adresów IP. Mimo że ta metoda działa, tworzy również nakłady inżynieryjne w przypadku uzyskania w pełni zautomatyzowanego odzyskiwania po awarii.

    • Użyj różnych adresów IP: możesz również użyć różnych adresów IP dla odzyskanych maszyn wirtualnych. Jeśli maszyna wirtualna zostanie przeniesiona do lokacji dodatkowej, plan odzyskiwania w programie VMware Site Recovery Manager zawiera szczegóły niestandardowej mapy adresów IP. Wybierz tę mapę, aby zmienić adres IP. Maszyny wirtualne są tworzone w nowych segmentach NSX-T, a nowe adresy IP są przypisywane. Narzędzia mogą się różnić w przypadku różnych rozwiązań odzyskiwania po awarii.

  • Ważne czynniki dla scenariuszy częściowego i pełnego odzyskiwania po awarii:

    • Program VMware Site Recovery Manager obsługuje częściowe odzyskiwanie, które odzyskuje tylko podzbiór maszyn wirtualnych i pełne odzyskiwanie po awarii. Między dwiema lokacjami usługi Azure VMware Solution w regionie 1 i 2 wszystkie lub niektóre maszyny wirtualne mogą przejść w tryb failover.

    • Wymaganie przechowywania źródłowego adresu IP dla odzyskanych maszyn wirtualnych określa, czy możliwe jest częściowe i pełne odzyskiwanie po awarii.

    • Aby zachować źródłowy adres IP podczas wykonywania częściowego odzyskiwania po awarii w programie Site Recovery Manager, brama podsieci musi przejść do lokacji dodatkowej.

    Uwaga

    Odzyskiwanie po awarii w trybie gotowości aktywnej nie wymaga rozciągania warstwy 2.

Zalecenia dotyczące projektowania odzyskiwania po awarii

  • Użyj programu VMware Site Recovery Manager podczas pracy z usługą Azure VMware Solution zarówno w lokacjach głównych, jak i dodatkowych. Lokacje główne i dodatkowe są również nazywane odpowiednio lokacjami chronionymi i odzyskiwania.

    Ogólne omówienie ciągłej replikacji vSphere.

    Diagram that shows a high-level example of continuous vSphere replication between two Azure VMware Solution sites.

    Szczegółowy przykład ciągłej replikacji vSphere między lokacjami podstawowymi i dodatkowymi.

    Diagram that shows a detailed example of continuous vSphere replication between two Azure VMware Solution sites.

  • W przypadku aplikacji krytycznych dla działania firmy rozwiązania Zerto i JetStream są dostępne jako rozwiązania odzyskiwania po awarii dla chmury prywatnej usługi Azure VMware Solution. JetStream i Zerto są oparte na podstawach ciągłej ochrony danych (CDP) przy użyciu interfejsu API VMware vSphere na potrzeby filtrowania we/wy (TLS), która umożliwia minimalną lub bliską utratę danych. Umożliwia również ekonomiczne odzyskiwanie po awarii przy użyciu minimalnych zasobów.

  • Użyj usługi Azure Site Recovery lub Zerto, jeśli maszyny wirtualne IaaS platformy Azure są celem odzyskiwania po awarii dla chmury prywatnej usługi Azure VMware Solution.

  • Zminimalizuj ręczne wprowadzanie danych wejściowych przy użyciu zautomatyzowanych planów odzyskiwania w ramach każdego z odpowiednich rozwiązań odzyskiwania po awarii. Te plany są przydatne podczas pracy z rozwiązaniem VMware Site Recovery Manager lub rozwiązaniami partnerskimi. Plan odzyskiwania zbiera maszyny do grup odzyskiwania na potrzeby trybu failover. Następnie ułatwia zdefiniowanie systematycznego procesu odzyskiwania przez utworzenie niezależnych jednostek, które mogą przejść w tryb failover.

  • Skonfiguruj testy weryfikacyjne kompilacji lub próbne odzyskiwanie po awarii co najmniej raz w roku, aby zapewnić, że plany odzyskiwania działają zgodnie z oczekiwaniami. Możliwości orkiestracji wybranego narzędzia odzyskiwania po awarii określają poziom nakładu pracy związanego z uruchamianiem tych prób.

  • Użyj geopolitycznych par regionalnych jako pomocniczego środowiska odzyskiwania po awarii. Niektóre zalety par regionalnych to priorytetowe odzyskiwanie regionów, aktualizacje sekwencyjne, izolacja fizyczna i miejsce przechowywania danych.

  • Zachowaj różne przestrzenie adresowe, aby uniknąć nakładających się adresów IP między dwiema lokacjami. Można na przykład użyć dla 192.168.0.0/16 regionu 1 i 10.0.0.0/16 regionu 2.

  • Użyj łączności Global Reach usługi ExpressRoute między chmurami podstawowymi i pomocniczymi w różnych regionach. Zobacz więcej zagadnień dotyczących sieci i zaleceń w odpowiednim obszarze projektowania.

Następne kroki

Dowiedz się więcej o zagadnieniach i zaleceniach dotyczących początkowego wdrożenia rozwiązania Azure VMware Solution i wskazówek dotyczących automatyzacji operacyjnej.