Topologia usługi danych
Na wysokim poziomie topologia usługi danych dla platformy danych firmy Contoso można zilustrować jako: Ten diagram logiczny przedstawia abstrakcję kluczowych funkcji ekosystemu danych firmy Contoso w uproszczonym widoku wysokiego poziomu. Ten abstrakcyjny widok obsługuje sekcje obejmujące wdrożenia scenariuszy, zgodnie ze strategią odzyskiwania po awarii (DR) i podziałem obowiązków w procesie odzyskiwania usługi.
Wpływ na odzyskiwanie po awarii a aktywność klienta
W poniższych sekcjach przedstawiono podział działań firmy Contoso niezbędnych dla zdarzeń odzyskiwania po awarii o różnym wpływie.
Obszar: Podstawowe składniki
Identyfikator entra firmy Microsoft, w tym uprawnienia roli
- Wybór jednostki SKU firmy Contoso: Premium P1
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: nie dotyczy
Grupy zarządzania
- Wybór jednostki SKU firmy Contoso: Nie dotyczy
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: nie dotyczy
Subskrypcje
- Wybór jednostki SKU firmy Contoso: Nie dotyczy
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: nie dotyczy
Azure Key Vault
- Wybór jednostki SKU firmy Contoso: Standardowa
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: nie dotyczy
Azure Monitor
- Wybór jednostki SKU firmy Contoso: Nie dotyczy
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: nie dotyczy
Microsoft Defender dla Chmury
- Wybór jednostki SKU firmy Contoso: Nie dotyczy
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: nie dotyczy
Zarządzanie kosztami
- Wybór jednostki SKU firmy Contoso: Nie dotyczy
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: nie dotyczy
Usługa DNS platformy Azure
- Wybór jednostki SKU firmy Contoso: Nie dotyczy
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: nie dotyczy
Network Watcher
- Wybór jednostki SKU firmy Contoso: Nie dotyczy
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: nie dotyczy
Magazyn usługi Recovery Services
- Wybór jednostki SKU firmy Contoso: domyślny (magazyn geograficznie nadmiarowy (GRS))
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: nie dotyczy
- Notatki
- Przywracanie między regionami umożliwi przechodzenie do szczegółów odzyskiwania po awarii i przejście klienta w tryb failover do regionu pomocniczego
Sieci wirtualne, w tym podsieci, trasa zdefiniowana przez użytkownika (UDR) i sieciowe grupy zabezpieczeń
- Wybór jednostki SKU firmy Contoso: Nie dotyczy
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć sieci wirtualne platformy Foundation i Data przy użyciu dołączonych tras zdefiniowanych przez użytkownika i sieciowe grupy zabezpieczeń do regionu pomocniczego
- Notatki
- Usługa Traffic Manager może służyć do kierowania ruchu geograficznego między regionami, które przechowują struktury repliki sieci wirtualnej. Jeśli mają tę samą przestrzeń adresową, nie mogą być połączone z siecią lokalną, co spowodowałoby problemy z routingiem. W momencie awarii i utraty sieci wirtualnej w jednym regionie można połączyć drugą sieć wirtualną w dostępnym regionie z pasującą przestrzenią adresową do sieci lokalnej
Grupy zasobów
- Wybór jednostki SKU firmy Contoso: Nie dotyczy
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć grupy zasobów platformy Danych i Podstawy w regionie pomocniczym
- Notatki
- To działanie zostanie złagodzone przez zaimplementowanie strategii "Warm Spare", która ma topologię sieci i grupy zasobów dostępną w regionie pomocniczym
Azure Firewall
- Wybór jednostki SKU firmy Contoso: Standardowa
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: w razie potrzeby firma Contoso musi zweryfikować dostępność i ponownie wdrożyć
- Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć zapory platformy Azure Foundation w regionie pomocniczym
- Notatki
- Usługę Azure Firewall można utworzyć za pomocą Strefy dostępności w celu zwiększenia dostępności
- Strategia "Warm Spare" ograniczyłaby tę aktywność
Azure DDoS
- Wybór jednostki SKU firmy Contoso: Ochrona sieci
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: firma Contoso musi utworzyć plan ochrony przed atakami DDoS dla sieci wirtualnych fundacji w regionie pomocniczym
ExpressRoute — obwód
- Wybór jednostki SKU firmy Contoso: Standardowa
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: nie dotyczy
- Notatki
- Obwód fizyczny pozostanie odpowiedzialny za firmę Microsoft i partnera łączności w celu odzyskania
VPN Gateway
- Wybór jednostki SKU firmy Contoso: VpnGw1
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: w razie potrzeby firma Contoso musi zweryfikować dostępność i ponownie wdrożyć
- Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć bramy sieci VPN Foundation w regionie pomocniczym
- Notatki
- Bramy sieci VPN można utworzyć przy użyciu Strefy dostępności w celu zwiększenia dostępności
- Strategia "Warm Spare" ograniczyłaby tę aktywność
Load Balancer
- Wybór jednostki SKU firmy Contoso: Standardowa
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: w razie potrzeby firma Contoso musi zweryfikować dostępność i ponownie wdrożyć
- Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć moduły równoważenia obciążenia podstawowego w regionie pomocniczym
- Notatki
- W zależności od regionu podstawowego można wykorzystać strefowo nadmiarowy lub cross-regionalny projekt, aby podnieść ten stan
Azure DevOps
- Wybór jednostki SKU firmy Contoso: DevOps Services
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: nie dotyczy
- Notatki
- Usługa DevOps Services jest oparta na sieci szkieletowej platformy Azure i korzysta z usługi Azure Blob Storage z replikacją geograficzną w celu zapewnienia odporności
Obszar: Składniki platformy danych
Konto magazynu — Azure Data Lake Gen2
- Wybór jednostki SKU firmy Contoso: magazyn lokalnie nadmiarowy (LRS)
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: w razie potrzeby firma Contoso musi zweryfikować dostępność i ponownie wdrożyć
- Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć konta magazynu platformy danych i przywrócić je przy użyciu danych w regionie pomocniczym
- Notatki
- Konta magazynu mają szeroką gamę opcji nadmiarowości danych od nadmiarowości regionu podstawowego do nadmiarowości w regionie pomocniczym
- W przypadku danych nadmiarowości w regionie pomocniczym dane są replikowane asynchronicznie do regionu pomocniczego. Awaria, która ma wpływ na region podstawowy, może spowodować utratę danych, jeśli nie można odzyskać regionu podstawowego. Usługa Azure Storage zwykle ma cel punktu odzyskiwania (RPO) krótszy niż 15 minut
- W przypadku regionalnej awarii konta magazynu, które są geograficznie nadmiarowe, będą dostępne w regionie pomocniczym jako magazyn LRS. Aby podnieść te składniki w regionie pomocniczym, należy zastosować dodatkową konfigurację, aby były geograficznie nadmiarowe
Azure Synapse — potoki
- Wybór jednostki SKU firmy Contoso: obliczona zoptymalizowana generacja 2
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: firma Contoso musiałaby wdrożyć i przywrócić usługę Azure Synapse Analytics platformy danych do regionu pomocniczego i ponownie wdrożyć potoki
- Notatki
- Automatyczne punkty przywracania są usuwane po siedmiu dniach
- Dostępne są punkty przywracania zdefiniowane przez użytkownika. Obecnie istnieje limit 42 punktów przywracania zdefiniowanych przez użytkownika, które są automatycznie usuwane po siedmiu dniach
- Usługa Synapse może również wykonać przywracanie bazy danych w regionie lokalnym lub zdalnym, a następnie natychmiast wstrzymać wystąpienie. Ten proces będzie ponosić tylko koszty magazynowania — i ma zerowe koszty obliczeniowe. Umożliwia to zachowanie kopii bazy danych "na żywo" w określonych odstępach czasu
Azure Event Hubs
- Wybór jednostki SKU firmy Contoso: Standardowa
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć wystąpienie usługi Event Hubs w regionie pomocniczym
- Notatki
- W przypadku korzystania z witryny Azure Portal nadmiarowość strefy za pośrednictwem obsługi stref dostępności jest automatycznie włączona, można to wyłączyć za pomocą interfejsu wiersza polecenia platformy Azure lub poleceń programu PowerShell
- Tę odporność można rozszerzyć w celu zapewnienia pełnej awarii w regionie z odzyskiwaniem po awarii geograficznej
Azure IoT Hubs
- Wybór jednostki SKU firmy Contoso: Standardowa
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć usługę IoT Hub w regionie pomocniczym
- Notatki
- Usługa IoT Hub zapewnia wysoką dostępność wewnątrz regionu i automatycznie użyje strefy dostępności, jeśli zostanie utworzona w wstępnie zdefiniowanym zestawie regionów świadczenia usługi Azure
Azure Stream Analytics
- Wybór jednostki SKU firmy Contoso: Standardowa
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć usługę IoT Hub w regionie pomocniczym
- Notatki
- Kluczową funkcją usługi Stream Analytics jest możliwość odzyskania sprawności po awarii węzła
Usługi Azure AI (dawniej Cognitive Services)
- Wybór jednostki SKU firmy Contoso: Płatność zgodnie z rzeczywistym użyciem
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: nie dotyczy
Azure Machine Learning
- Wybór jednostki SKU firmy Contoso: Ogólnego przeznaczenia — wystąpienia serii D
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: w razie potrzeby firma Contoso musiałaby zweryfikować dostępność i ponownie wdrożyć
- Niepowodzenie strefy dostępności: w razie potrzeby firma Contoso musi zweryfikować dostępność i ponownie wdrożyć
- Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć maszynę Edukacja w regionie pomocniczym
- Notatki
- Chociaż infrastruktura Edukacja maszyny jest zarządzana przez firmę Microsoft; skojarzone zasoby są zarządzane przez klienta. Tylko usługa Key Vault jest domyślnie wysoce dostępna
- W zależności od obsługiwanej krytycznej obsługi usługi firma Microsoft zaleca wdrożenie w wielu regionach
Azure Synapse — pule eksploratora danych
- Wybór jednostki SKU firmy Contoso: zoptymalizowane pod kątem obliczeń, małe (4 rdzenie)
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć usługę Azure Synapse — pule i potoki eksploratora danych w regionie pomocniczym
Azure Synapse — pule platformy Spark
- Wybór jednostki SKU firmy Contoso: Obliczanie zoptymalizowane pod kątem generacji 2
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć usługę Azure Synapse — pule i potoki platformy Spark w regionie pomocniczym
- Notatki
- Jeśli jest używany zewnętrzny magazyn metadanych Hive, będzie to również wymagać strategii odzyskiwania
- Usługa Azure Site Recovery może służyć do magazynu metadanych programu SQL Server
- Magazyn metadanych MySQL używa funkcji przywracania geograficznego lub replik do odczytu między regionami
- Jeśli jest używany zewnętrzny magazyn metadanych Hive, będzie to również wymagać strategii odzyskiwania
Azure Synapse — bezserwerowe i dedykowane pule SQL
- Wybór jednostki SKU firmy Contoso: Obliczanie zoptymalizowane pod kątem generacji 2
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: firma Contoso musiałaby wdrożyć i przywrócić usługę Azure Synapse Analytics platformy danych w regionie pomocniczym
- Notatki
- Automatyczne punkty przywracania są usuwane po siedmiu dniach
- Dostępne są punkty przywracania zdefiniowane przez użytkownika. Obecnie istnieje limit 42 punktów przywracania zdefiniowanych przez użytkownika, które są automatycznie usuwane po siedmiu dniach
- Usługa Synapse może również wykonać przywracanie bazy danych w regionie lokalnym lub zdalnym, a następnie natychmiast wstrzymać wystąpienie. Spowoduje to tylko naliczenie kosztów magazynowania — i będzie mieć zerowe koszty obliczeń. To rozwiązanie umożliwia zachowanie kopii bazy danych "na żywo" w określonych odstępach czasu
Power BI
- Wybór jednostki SKU firmy Contoso: Power BI Pro
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: nie dotyczy
- Notatki
- Klient nie będzie musiał wykonywać żadnych czynności , jeśli awaria zostanie podjęta/zadeklarowana przez zespół usługi Power BI
- Wystąpienie usługa Power BI trybu failover obsługuje tylko operacje odczytu. Raporty korzystające z zapytania bezpośredniego lub połączenia na żywo nie będą działać podczas pracy w trybie failover
- Klient nie będzie musiał wykonywać żadnych czynności , jeśli awaria zostanie podjęta/zadeklarowana przez zespół usługi Power BI
Azure Cosmos DB
- Wybór jednostki SKU firmy Contoso: zapis w jednym regionie z okresową kopią zapasową
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: Nie dotyczy
- Awaria regionalna platformy Azure: firma Contoso powinna monitorować, upewniając się, że w pozostałych regionach jest wystarczająca liczba aprowizowanych jednostek żądania (RU), aby obsługiwać działania odczytu i zapisu
- Notatki
- Konta z jednym regionem mogą utracić dostępność po awarii regionalnej. Aby zapewnić wysoką dostępność wystąpienia usługi Cosmos DB, skonfiguruj je w jednym regionie zapisu i co najmniej drugim (odczyt) i włącz tryb failover zarządzany przez usługę
- Aby uniknąć utraty dostępności zapisu, zaleca się skonfigurowanie obciążeń produkcyjnych z "włączaniem trybu failover zarządzanego przez usługę", co umożliwia automatyczne przełączanie w tryb failover do dostępnych regionów
Azure AI Search (dawniej Cognitive Search)
- Wybór jednostki SKU firmy Contoso: Standardowa S1
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: w razie potrzeby firma Contoso musiałaby zweryfikować dostępność i ponownie wdrożyć
- Niepowodzenie strefy dostępności: w razie potrzeby firma Contoso musi zweryfikować dostępność i ponownie wdrożyć
- Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć wyszukiwanie sztucznej inteligencji w regionie pomocniczym
- Notatki
- nie ma wbudowanego mechanizmu odzyskiwania po awarii
- Implementowanie wielu replik wyszukiwania sztucznej inteligencji w różnych strefach dostępności będzie dotyczyć ryzyka awarii centrum danych
Azure Data Share
- Wybór jednostki SKU firmy Contoso: Nie dotyczy
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: w razie potrzeby firma Contoso musiałaby zweryfikować dostępność i ponownie wdrożyć
- Niepowodzenie strefy dostępności: w razie potrzeby firma Contoso musi zweryfikować dostępność i ponownie wdrożyć
- Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć udział danych w regionie pomocniczym
- Notatki
- Usługa Azure Data Share nie jest obecnie obsługiwana przez Strefy dostępności
- Uplifting Data Share to a HA deployment will address each of these outage risks (Uplifting Data Share to a HA deployment ) będzie dotyczyć każdego z tych zagrożeń związanych z awarią
Kompetencji
- Wybór jednostki SKU firmy Contoso: Nie dotyczy
- Wpływ odzyskiwania po awarii
- Niepowodzenie centrum danych Platformy Azure: nie dotyczy
- Niepowodzenie strefy dostępności: w razie potrzeby firma Contoso musi zweryfikować dostępność i ponownie wdrożyć
- Awaria regionalna platformy Azure: firma Contoso musi wdrożyć wystąpienie usługi Purview w regionie pomocniczym
- Notatki
- To działanie zostanie złagodzone przez zaimplementowanie strategii "Warm Spare" o drugim wystąpieniu usługi Azure Purview dostępnej w regionie pomocniczym
- Podejście "Warm Spare" ma następujące kluczowe objaśnienia:
- Nie można skonfigurować kont podstawowych i pomocniczych usługi Azure Purview do tych samych kont usług Azure Data Factory, Azure Data Share i Synapse Analytics, jeśli ma to zastosowanie. W związku z tym pochodzenie danych z usług Azure Data Factory i Azure Data Share nie może być widoczne na pomocniczych kontach usługi Azure Purview
- Środowiska Integration Runtime są specyficzne dla konta usługi Azure Purview. W związku z tym, jeśli skanowanie musi być uruchamiane równolegle na kontach podstawowej i pomocniczej usługi Azure Purview, należy zachować wiele własnych środowisk Integration Runtime
Uwaga
Ta sekcja jest przeznaczona jako ogólne wskazówki. Dokumentacja dostawcy dotycząca odzyskiwania po awarii, nadmiarowości i tworzenia kopii zapasowych powinna być konsultowana w celu uzyskania odpowiedniego podejścia do nowego składnika/usługi.
"Awaria centrum danych Azure" obejmuje sytuację, w której region, którego dotyczy problem, nie ma Strefy dostępności oferowanych.
Jeśli w momencie wystąpienia awarii wystąpiła nowa/zaktualizowana konfiguracja lub wydania, należy je sprawdzić i ponownie wdrożyć (w razie potrzeby) w ramach pracy w celu zapewnienia aktualności platformy.
Następne kroki
Teraz, po zapoznaniu się ze szczegółami scenariusza, możesz dowiedzieć się więcej o zaleceniach związanych z tym scenariuszem