Udostępnij za pośrednictwem


Ciągłość działania i odzyskiwanie po awarii

Awarie mogą być awariami sprzętowymi, klęskami żywiołowymi lub awariami oprogramowania. Proces przygotowywania i odzyskiwania po awarii jest nazywany odzyskiwaniem po awarii (DR). W tym artykule omówiono zalecane rozwiązania dotyczące zapewnienia ciągłości działania i odzyskiwania po awarii (BCDR) dla Szczegółowe informacje operatora platformy Azure.

Strategie BCDR obejmują nadmiarowość strefy dostępności i odzyskiwanie zarządzane przez użytkownika.

Płaszczyzna sterowania

Płaszczyzna sterowania Szczegółowe informacje operatora platformy Azure jest odporna zarówno na błędy oprogramowania, jak i awarię strefy dostępności. Możliwość tworzenia produktów danych i zarządzania nimi nie ma wpływu na te tryby awarii.

Płaszczyzna sterowania nie jest geograficznie nadmiarowa. Podczas awarii w regionie świadczenia usługi Azure nie można tworzyć nowych produktów danych w tym regionie ani uzyskiwać dostępu do istniejących produktów danych ani zarządzać nimi. Po odzyskaniu regionu po awarii możesz ponownie uzyskać dostęp do istniejących produktów danych i zarządzać nimi.

Płaszczyzna danych

Produkty danych są odporne na awarie oprogramowania lub sprzętu. Jeśli na przykład usterka oprogramowania powoduje awarię usługi lub awaria sprzętowa powoduje utratę zasobów obliczeniowych na potrzeby zapytań wzbogacania, usługa automatycznie odzyskuje sprawność. Jedynym wpływem jest niewielkie opóźnienie w udostępnieniu nowo pozyskanych danych w punkcie końcowym magazynu produktu danych i adresie URL użycia języka KQL.

Nadmiarowość stref

Produkty danych nie obsługują nadmiarowości strefy. Gdy strefa dostępności nie powiedzie się, pozyskiwanie danych produktu, obiekty blob/DFS i interfejsy API KQL/SQL są niedostępne, a pulpity nawigacyjne nie działają. Przekształcanie już pozyskanych danych jest wstrzymane. Nie tracono wcześniej pozyskanych danych. Przetwarzanie jest wznawiane po odzyskaniu strefy dostępności.

Co się stanie z danymi wygenerowanymi podczas przestoju strefy dostępności, zależy od zachowania agenta pozyskiwania:

  • Jeśli agent pozyskiwania buforuje dane i ponownie je po odzyskaniu strefy dostępności, dane nie zostaną utracone. Szczegółowe informacje operator platformy Azure może zająć trochę czasu, aby przejść przez listę prac związanych z transformacją.
  • W przeciwnym razie dane zostaną utracone.

Odzyskiwanie po awarii

Operator platformy Azure Szczegółowe informacje nie ma nadmiarowości w regionie wrodzonym. Awarie regionalne wpływają na produkty danych w taki sam sposób, jak awarie strefy dostępności. Mamy zalecenia i funkcje do obsługi klientów, którzy chcą mieć możliwość obsługi awarii całego regionu świadczenia usługi Azure.

Nadmiarowość zarządzana przez użytkownika

Aby uzyskać maksymalną nadmiarowość, można wdrożyć produkty danych w trybie aktywny-aktywny. Wdróż drugi produkt danych w wybranym regionie kopii zapasowej platformy Azure i skonfiguruj agentów pozyskiwania w celu utworzenia rozwidlenia danych w obu produktach danych jednocześnie. Produkt danych kopii zapasowej nie ma wpływu na awarię regionu podstawowego. Podczas awarii regionalnej przyjrzyj się pulpitom nawigacyjnym, które używają produktu danych kopii zapasowej jako źródła danych. Ta architektura podwaja koszt rozwiązania.

Alternatywnie można użyć trybu aktywny-pasywny. Wdróż drugi produkt danych w regionie kopii zapasowej platformy Azure i skonfiguruj agentów pozyskiwania w celu wysłania do podstawowego produktu danych. Podczas awarii regionalnej skonfiguruj ponownie agentów pozyskiwania, aby wysyłać dane do produktu danych kopii zapasowej podczas awarii regionu. Ta architektura zapewnia pełny dostęp do danych utworzonych podczas przestoju (począwszy od czasu ponownego skonfigurowania agentów pozyskiwania), ale podczas przestoju nie masz dostępu do danych pozyskanych wcześniej. Ta architektura wymaga niewielkiej opłaty za infrastrukturę za drugi produkt danych, ale nie są naliczane dodatkowe opłaty za przetwarzanie danych.