Zasady odzyskiwania po awarii i przygotowanie

Artykuł
06/01/2023

W tym artykule omówimy ważne zasady odzyskiwania po awarii (DR) dla dużych wystąpień platformy HANA (inaczej nazywanej infrastrukturą BareMetal). Omówimy kroki, które należy wykonać w ramach przygotowań do odzyskiwania po awarii. Zobaczysz również, jak osiągnąć cel czasu odzyskiwania (RTO) i cel punktu odzyskiwania (RPO) w przypadku awarii.

Zasady odzyskiwania po awarii dla dużych wystąpień platformy HANA

Duże wystąpienia platformy HANA oferują funkcje odzyskiwania po awarii między sygnaturami dużych wystąpień platformy HANA w różnych regionach świadczenia usługi Azure. Załóżmy na przykład, że wdrażasz duże wystąpienia HANA w regionie Zachodnie stany USA platformy Azure. Następnie możesz użyć dużych wystąpień platformy HANA w regionie Wschodnie stany USA jako jednostek odzyskiwania po awarii. Odzyskiwanie po awarii nie jest konfigurowane automatycznie, ponieważ wymaga płacenia za inne duże wystąpienie HANA w regionie odzyskiwania po awarii. Konfiguracja odzyskiwania po awarii działa w przypadku konfiguracji skalowanych w górę i skalowanych w poziomie.

Większość klientów używa jednostki w regionie odzyskiwania po awarii do uruchamiania systemów nieprodukcyjnych korzystających z zainstalowanego wystąpienia platformy HANA. Duże wystąpienie HANA musi mieć taką samą jednostkę SKU, jak jednostka SKU używana do celów produkcyjnych. Na poniższej ilustracji przedstawiono konfigurację dysku między jednostką serwera w regionie produkcyjnym platformy Azure a regionem odzyskiwania po awarii:

Konfiguracja konfiguracji odzyskiwania po awarii z punktu widzenia dysku

Jak pokazano na tej grafice przeglądu, należy zamówić drugi zestaw woluminów dysków. Woluminy dysku docelowego skojarzone z serwerem dużych wystąpień platformy HANA w lokacji odzyskiwania po awarii są takie same jak woluminy produkcyjne.

Następujące woluminy są replikowane z regionu produkcyjnego do lokacji odzyskiwania po awarii:

/hana/data
/hana/logbackups
/hana/shared (obejmuje /usr/sap)

Wolumin /hana/log nie jest replikowany. Dziennik transakcji platformy SAP HANA nie jest wymagany podczas przywracania z tych woluminów.

Replikacja magazynu dużych wystąpień platformy HANA

Podstawą funkcji odzyskiwania po awarii w infrastrukturze dużych wystąpień HANA jest jej replikacja magazynu. Funkcja używana po stronie magazynu nie jest stałym strumieniem zmian replikowanych w sposób asynchroniczny w miarę wprowadzania zmian w woluminie magazynu. Zamiast tego jest to mechanizm, który polega na regularnym tworzeniu migawek tych woluminów. Różnica między już zreplikowaną migawką a nową migawką, która nie została jeszcze zreplikowana, jest następnie przenoszona do lokacji odzyskiwania po awarii do woluminów dysku docelowego. Te migawki są przechowywane na woluminach. W przypadku przejścia w tryb failover odzyskiwania po awarii należy je przywrócić na tych woluminach.

Pierwszy transfer pełnych danych woluminu powinien nastąpić, zanim ilość danych stanie się mniejsza niż różnice między migawkami. Następnie woluminy w lokacji odzyskiwania po awarii będą zawierać wszystkie migawki woluminów wykonane w lokacji produkcyjnej. W końcu możesz użyć tego systemu odzyskiwania po awarii, aby uzyskać wcześniejszy stan w celu odzyskania utraconych danych bez wycofywania systemu produkcyjnego.

Jeśli istnieje wdrożenie MCOD z wieloma niezależnymi wystąpieniami sap HANA w jednym dużym wystąpieniu HANA, wszystkie wystąpienia sap HANA powinny mieć magazyn replikowany po stronie odzyskiwania po awarii.

W przypadku korzystania z replikacji systemu HANA w celu zapewnienia wysokiej dostępności w lokacji produkcyjnej i replikacji opartej na magazynie dla lokacji odzyskiwania po awarii woluminy obu węzłów z lokacji głównej do wystąpienia odzyskiwania po awarii są replikowane. Kup dodatkowy magazyn (taki sam jak węzeł podstawowy) w lokacji odzyskiwania po awarii, aby uwzględnić replikację z węzłów podstawowych i pomocniczych do odzyskiwania po awarii.

Uwaga

Funkcja replikacji magazynu dużych wystąpień platformy HANA dubluje i replikuje migawki magazynu. Jeśli nie wykonasz migawek magazynu zgodnie z opisem w temacie Tworzenie kopii zapasowej i przywracanie, nie można przeprowadzić replikacji do lokacji odzyskiwania po awarii. Wykonanie migawki magazynu jest warunkiem wstępnym replikacji magazynu do lokacji odzyskiwania po awarii.

Przygotowanie scenariusza odzyskiwania po awarii

W tym scenariuszu odzyskiwania po awarii masz system produkcyjny działający na dużych wystąpieniach platformy HANA w regionie produkcyjnym platformy Azure. W przypadku kroków, które należy wykonać, załóżmy, że identyfikator SID tego systemu HANA to "PRD". Masz również system nieprodukcyjny działający na dużych wystąpieniach platformy HANA w regionie świadczenia usługi Azure ODZYSKIWANIA po awarii. Jego identyfikator SID to "TST". Na poniższej ilustracji przedstawiono tę konfigurację:

Rozpoczęcie konfigurowania odzyskiwania po awarii

Załóżmy, że wystąpienie serwera nie zostało jeszcze uporządkowane z dodatkowym zestawem woluminów magazynu. Następnie platforma SAP HANA w usłudze Azure Service Management dołącza dodane woluminy. Są one celem repliki produkcyjnej do dużego wystąpienia platformy HANA, na którym jest uruchomione wystąpienie TST HANA. Należy podać identyfikator SID wystąpienia produkcyjnego HANA. Po potwierdzeniu załącznika tych woluminów na platformie SAP HANA w usłudze Azure Service Management należy zainstalować te woluminy w dużym wystąpieniu HANA.

Następny krok konfiguracji odzyskiwania po awarii

Następnym krokiem jest zainstalowanie drugiego wystąpienia platformy SAP HANA na dużym wystąpieniu platformy HANA w regionie platformy Azure odzyskiwania po awarii, w którym jest uruchamiane wystąpienie TST HANA. Nowo zainstalowane wystąpienie SAP HANA musi mieć ten sam identyfikator SID. Utworzoni użytkownicy muszą mieć ten sam identyfikator UID i identyfikator grupy co wystąpienie produkcyjne. Przeczytaj artykuł Kopia zapasowa i przywracanie , aby uzyskać szczegółowe informacje. Jeśli instalacja zakończy się pomyślnie, musisz:

Wykonaj krok 2 przygotowania migawki magazynu opisany w temacie Tworzenie kopii zapasowej i przywracanie.
Utwórz klucz publiczny dla jednostki odzyskiwania po awarii dużego wystąpienia HANA, jeśli jeszcze tego nie zrobiono. Zobacz krok 3 przygotowania migawki magazynu opisany w temacie Tworzenie kopii zapasowych i przywracanie.
Zachowaj HANABackupCustomerDetails.txt przy użyciu nowego wystąpienia platformy HANA i przetestuj, czy łączność z magazynem działa prawidłowo.
Zatrzymaj nowo zainstalowane wystąpienie SAP HANA w dużym wystąpieniu HANA w regionie świadczenia usługi Azure ODZYSKIWANIA po awarii.
Odinstaluj te woluminy PRD i skontaktuj się z platformą SAP HANA w usłudze Azure Service Management. Woluminy nie mogą pozostać zainstalowane w jednostce, ponieważ nie mogą być dostępne podczas działania jako miejsce docelowe replikacji magazynu.

Diagram przedstawiający relację replikacji między woluminami PRD w regionie produkcyjnym platformy Azure i woluminami PRD w regionie świadczenia usługi Azure odzyskiwania po awarii.

Zespół operacyjny ustanawia relację replikacji między woluminami PRD w regionie produkcyjnym a woluminami PRD w regionie odzyskiwania po awarii.

Ważne

Wolumin /hana/log nie jest replikowany, ponieważ nie jest konieczne przywrócenie zreplikowanej bazy danych SAP HANA do stanu spójnego w lokacji odzyskiwania po awarii.

Następnie ustaw harmonogram tworzenia kopii zapasowych migawek magazynu, aby osiągnąć cel czasu odzyskiwania i cel punktu odzyskiwania, jeśli wystąpi awaria. Aby zminimalizować cel punktu odzyskiwania, ustaw następujące interwały replikacji w usłudze dużych wystąpień platformy HANA:

W przypadku woluminów objętych połączoną migawką (typ migawki hana) ustaw wartość na replikację co 15 minut do równoważnych miejsc docelowych woluminów magazynu w lokacji odzyskiwania po awarii.
W przypadku woluminu kopii zapasowej dziennika transakcji ( dzienniki typu migawki) ustaw wartość replikacji co 3 minuty na równoważne cele woluminu magazynu w lokacji odzyskiwania po awarii.

Aby zminimalizować cel punktu odzyskiwania:

Wykonaj migawkę magazynu typu hana co 30 minut do 1 godziny. Aby uzyskać więcej informacji, zobacz Tworzenie kopii zapasowej przy użyciu narzędzia do tworzenia kopii zapasowych aplikacja systemu Azure spójnej migawki.
Wykonywanie kopii zapasowych dziennika transakcji sap HANA co 5 minut.
Wykonaj migawkę magazynu typu dzienników co 5–15 minut. W tym przedziale czasu uzyskujesz cel punktu odzyskiwania wynoszący około 15–25 minut.

W przypadku tej konfiguracji sekwencja kopii zapasowych dziennika transakcji, migawek magazynu i replikacja woluminu kopii zapasowej dziennika transakcji HANA i /hana/data oraz /hana/shared (w tym /usr/sap) mogą wyglądać podobnie do danych przedstawionych na tej ilustracji:

Relacja między migawką kopii zapasowej dziennika transakcji a dublowaniem przyciągania na osi czasu

Aby osiągnąć jeszcze lepszy cel punktu odzyskiwania w przypadku odzyskiwania po awarii, możesz skopiować kopie zapasowe dziennika transakcji HANA z platformy SAP HANA na platformie Azure (duże wystąpienia) do innego regionu świadczenia usługi Azure. Aby osiągnąć tę dalszą redukcję celu punktu odzyskiwania, wykonaj następujące kroki:

Utwórz kopię zapasową dziennika transakcji platformy HANA tak często, jak to możliwe, do /hana/logbackups.
Użyj narzędzia rsync, aby skopiować kopie zapasowe dziennika transakcji do maszyn wirtualnych platformy Azure hostowanych w udziale NFS. Maszyny wirtualne znajdują się w sieciach wirtualnych platformy Azure w regionie produkcyjnym platformy Azure i w regionie odzyskiwania po awarii. Połącz obie sieci wirtualne platformy Azure z obwodem łączącym produkcyjne duże wystąpienia HANA z platformą Azure. Aby uzyskać więcej informacji, zobacz Zagadnienia dotyczące sieci na potrzeby odzyskiwania po awarii za pomocą dużych wystąpień platformy HANA.
Zachowaj kopie zapasowe dziennika transakcji w regionie maszyny wirtualnej dołączonej do wyeksportowanego magazynu systemu plików NFS.
W przypadku przejścia w tryb failover po awarii uzupełnij kopie zapasowe dziennika transakcji, które można znaleźć na woluminie /hana/logbackups z niedawno wykonanymi kopiami zapasowymi dziennika transakcji w udziale NFS w lokacji odzyskiwania po awarii.
Uruchom kopię zapasową dziennika transakcji, aby przywrócić najnowszą kopię zapasową, która może zostać zapisana w regionie odzyskiwania po awarii.

Gdy operacje dużego wystąpienia platformy HANA potwierdzają konfigurację relacji replikacji i uruchamiasz kopie zapasowe migawek magazynu wykonywania, rozpoczyna się replikacja danych.

Krok konfiguracji odzyskiwania po awarii przed ustanowieniem replikacji

W miarę postępu replikacji migawki woluminów PRD w regionach odzyskiwania po awarii platformy Azure nie są przywracane. Migawki są przechowywane tylko. Jeśli woluminy są zainstalowane w takim stanie, reprezentują one stan, w którym nie zainstalowano tych woluminów po zainstalowaniu wystąpienia PRD SAP HANA na serwerze w regionie platformy Azure odzyskiwania po awarii. Reprezentują one również kopie zapasowe magazynu, które nie zostały jeszcze przywrócone.

Jeśli nastąpi przejście w tryb failover, możesz również wybrać przywrócenie do starszej migawki magazynu zamiast do najnowszej migawki magazynu.

Następne kroki

Dowiedz się więcej o procedurze trybu failover odzyskiwania po awarii.

Procedura przechodzenia w tryb failover odzyskiwania po awarii

Udostępnij za pośrednictwem