Odzyskiwanie po awarii dla platformy Azure Data Platform — szczegóły scenariusza

Azure Synapse Analytics
Azure Machine Learning
Azure Cosmos DB
Azure Data Lake
Azure Event Hubs

Topologia usługi danych

Na wysokim poziomie topologia usługi danych dla platformy danych firmy Contoso można zilustrować jako: Diagram topologii usługi danych firmy Contoso wysokiego poziomu. Ten diagram logiczny przedstawia abstrakcję kluczowych funkcji ekosystemu danych firmy Contoso w uproszczonym widoku wysokiego poziomu. Ten abstrakcyjny widok obsługuje sekcje obejmujące wdrożenia scenariuszy, zgodnie ze strategią odzyskiwania po awarii (DR) i podziałem obowiązków w procesie odzyskiwania usługi.

Wpływ na odzyskiwanie po awarii a aktywność klienta

W poniższych sekcjach przedstawiono podział działań firmy Contoso niezbędnych dla zdarzeń odzyskiwania po awarii o różnym wpływie.

Obszar: Podstawowe składniki

  • Identyfikator entra firmy Microsoft, w tym uprawnienia roli

    • Wybór jednostki SKU firmy Contoso: Premium P1
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: nie dotyczy
  • Grupy zarządzania

    • Wybór jednostki SKU firmy Contoso: Nie dotyczy
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: nie dotyczy
  • Subskrypcje

    • Wybór jednostki SKU firmy Contoso: Nie dotyczy
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: nie dotyczy
  • Azure Key Vault

    • Wybór jednostki SKU firmy Contoso: Standardowa
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: nie dotyczy
  • Azure Monitor

    • Wybór jednostki SKU firmy Contoso: Nie dotyczy
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: nie dotyczy
  • Microsoft Defender dla Chmury

    • Wybór jednostki SKU firmy Contoso: Nie dotyczy
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: nie dotyczy
  • Zarządzanie kosztami

    • Wybór jednostki SKU firmy Contoso: Nie dotyczy
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: nie dotyczy
  • Usługa DNS platformy Azure

    • Wybór jednostki SKU firmy Contoso: Nie dotyczy
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: nie dotyczy
  • Network Watcher

    • Wybór jednostki SKU firmy Contoso: Nie dotyczy
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: nie dotyczy
  • Magazyn usługi Recovery Services

    • Wybór jednostki SKU firmy Contoso: domyślny (magazyn geograficznie nadmiarowy (GRS))
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: nie dotyczy
    • Notatki
      • Przywracanie między regionami umożliwi przechodzenie do szczegółów odzyskiwania po awarii i przejście klienta w tryb failover do regionu pomocniczego
  • Sieci wirtualne, w tym podsieci, trasa zdefiniowana przez użytkownika (UDR) i sieciowe grupy zabezpieczeń

    • Wybór jednostki SKU firmy Contoso: Nie dotyczy
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć sieci wirtualne platformy Foundation i Data przy użyciu dołączonych tras zdefiniowanych przez użytkownika i sieciowe grupy zabezpieczeń do regionu pomocniczego
    • Notatki
      • Usługa Traffic Manager może służyć do kierowania ruchu geograficznego między regionami, które przechowują struktury repliki sieci wirtualnej. Jeśli mają tę samą przestrzeń adresową, nie mogą być połączone z siecią lokalną, co spowodowałoby problemy z routingiem. W momencie awarii i utraty sieci wirtualnej w jednym regionie można połączyć drugą sieć wirtualną w dostępnym regionie z pasującą przestrzenią adresową do sieci lokalnej
  • Grupy zasobów

    • Wybór jednostki SKU firmy Contoso: Nie dotyczy
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć grupy zasobów platformy Danych i Podstawy w regionie pomocniczym
    • Notatki
      • To działanie zostanie złagodzone przez zaimplementowanie strategii "Warm Spare", która ma topologię sieci i grupy zasobów dostępną w regionie pomocniczym
  • Azure Firewall

    • Wybór jednostki SKU firmy Contoso: Standardowa
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: w razie potrzeby firma Contoso musi zweryfikować dostępność i ponownie wdrożyć
      • Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć zapory platformy Azure Foundation w regionie pomocniczym
    • Notatki
      • Usługę Azure Firewall można utworzyć za pomocą Strefy dostępności w celu zwiększenia dostępności
      • Strategia "Warm Spare" ograniczyłaby tę aktywność
  • Azure DDoS

    • Wybór jednostki SKU firmy Contoso: Ochrona sieci
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: firma Contoso musi utworzyć plan ochrony przed atakami DDoS dla sieci wirtualnych fundacji w regionie pomocniczym
  • ExpressRoute — obwód

    • Wybór jednostki SKU firmy Contoso: Standardowa
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: nie dotyczy
    • Notatki
      • Obwód fizyczny pozostanie odpowiedzialny za firmę Microsoft i partnera łączności w celu odzyskania
  • VPN Gateway

    • Wybór jednostki SKU firmy Contoso: VpnGw1
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: w razie potrzeby firma Contoso musi zweryfikować dostępność i ponownie wdrożyć
      • Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć bramy sieci VPN Foundation w regionie pomocniczym
    • Notatki
      • Bramy sieci VPN można utworzyć przy użyciu Strefy dostępności w celu zwiększenia dostępności
      • Strategia "Warm Spare" ograniczyłaby tę aktywność
  • Load Balancer

    • Wybór jednostki SKU firmy Contoso: Standardowa
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: w razie potrzeby firma Contoso musi zweryfikować dostępność i ponownie wdrożyć
      • Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć moduły równoważenia obciążenia podstawowego w regionie pomocniczym
    • Notatki
  • Azure DevOps

    • Wybór jednostki SKU firmy Contoso: DevOps Services
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: nie dotyczy
    • Notatki

Obszar: Składniki platformy danych

  • Konto magazynu — Azure Data Lake Gen2

    • Wybór jednostki SKU firmy Contoso: magazyn lokalnie nadmiarowy (LRS)
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: w razie potrzeby firma Contoso musi zweryfikować dostępność i ponownie wdrożyć
      • Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć konta magazynu platformy danych i przywrócić je przy użyciu danych w regionie pomocniczym
    • Notatki
      • Konta magazynu mają szeroką gamę opcji nadmiarowości danych od nadmiarowości regionu podstawowego do nadmiarowości w regionie pomocniczym
      • W przypadku danych nadmiarowości w regionie pomocniczym dane są replikowane asynchronicznie do regionu pomocniczego. Awaria, która ma wpływ na region podstawowy, może spowodować utratę danych, jeśli nie można odzyskać regionu podstawowego. Usługa Azure Storage zwykle ma cel punktu odzyskiwania (RPO) krótszy niż 15 minut
      • W przypadku regionalnej awarii konta magazynu, które są geograficznie nadmiarowe, będą dostępne w regionie pomocniczym jako magazyn LRS. Aby podnieść te składniki w regionie pomocniczym, należy zastosować dodatkową konfigurację, aby były geograficznie nadmiarowe
  • Azure Synapse — potoki

    • Wybór jednostki SKU firmy Contoso: obliczona zoptymalizowana generacja 2
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: firma Contoso musiałaby wdrożyć i przywrócić usługę Azure Synapse Analytics platformy danych do regionu pomocniczego i ponownie wdrożyć potoki
    • Notatki
      • Automatyczne punkty przywracania są usuwane po siedmiu dniach
      • Dostępne są punkty przywracania zdefiniowane przez użytkownika. Obecnie istnieje limit 42 punktów przywracania zdefiniowanych przez użytkownika, które są automatycznie usuwane po siedmiu dniach
      • Usługa Synapse może również wykonać przywracanie bazy danych w regionie lokalnym lub zdalnym, a następnie natychmiast wstrzymać wystąpienie. Ten proces będzie ponosić tylko koszty magazynowania — i ma zerowe koszty obliczeniowe. Umożliwia to zachowanie kopii bazy danych "na żywo" w określonych odstępach czasu
  • Azure Event Hubs

    • Wybór jednostki SKU firmy Contoso: Standardowa
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć wystąpienie usługi Event Hubs w regionie pomocniczym
    • Notatki
      • W przypadku korzystania z witryny Azure Portal nadmiarowość strefy za pośrednictwem obsługi stref dostępności jest automatycznie włączona, można to wyłączyć za pomocą interfejsu wiersza polecenia platformy Azure lub poleceń programu PowerShell
      • Tę odporność można rozszerzyć w celu zapewnienia pełnej awarii w regionie z odzyskiwaniem po awarii geograficznej
  • Azure IoT Hubs

    • Wybór jednostki SKU firmy Contoso: Standardowa
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć usługę IoT Hub w regionie pomocniczym
    • Notatki
  • Azure Stream Analytics

    • Wybór jednostki SKU firmy Contoso: Standardowa
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć usługę IoT Hub w regionie pomocniczym
    • Notatki
      • Kluczową funkcją usługi Stream Analytics jest możliwość odzyskania sprawności po awarii węzła
  • Usługi Azure AI (dawniej Cognitive Services)

    • Wybór jednostki SKU firmy Contoso: Płatność zgodnie z rzeczywistym użyciem
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: nie dotyczy
  • Azure Machine Learning

    • Wybór jednostki SKU firmy Contoso: Ogólnego przeznaczenia — wystąpienia serii D
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: w razie potrzeby firma Contoso musiałaby zweryfikować dostępność i ponownie wdrożyć
      • Niepowodzenie strefy dostępności: w razie potrzeby firma Contoso musi zweryfikować dostępność i ponownie wdrożyć
      • Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć maszynę Edukacja w regionie pomocniczym
    • Notatki
  • Azure Synapse — pule eksploratora danych

    • Wybór jednostki SKU firmy Contoso: zoptymalizowane pod kątem obliczeń, małe (4 rdzenie)
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć usługę Azure Synapse — pule i potoki eksploratora danych w regionie pomocniczym
  • Azure Synapse — pule platformy Spark

    • Wybór jednostki SKU firmy Contoso: Obliczanie zoptymalizowane pod kątem generacji 2
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć usługę Azure Synapse — pule i potoki platformy Spark w regionie pomocniczym
    • Notatki
  • Azure Synapse — bezserwerowe i dedykowane pule SQL

    • Wybór jednostki SKU firmy Contoso: Obliczanie zoptymalizowane pod kątem generacji 2
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: Nie dotyczy
      • Awaria regionalna platformy Azure: firma Contoso musiałaby wdrożyć i przywrócić usługę Azure Synapse Analytics platformy danych w regionie pomocniczym
    • Notatki
      • Automatyczne punkty przywracania są usuwane po siedmiu dniach
      • Dostępne są punkty przywracania zdefiniowane przez użytkownika. Obecnie istnieje limit 42 punktów przywracania zdefiniowanych przez użytkownika, które są automatycznie usuwane po siedmiu dniach
      • Usługa Synapse może również wykonać przywracanie bazy danych w regionie lokalnym lub zdalnym, a następnie natychmiast wstrzymać wystąpienie. Spowoduje to tylko naliczenie kosztów magazynowania — i będzie mieć zerowe koszty obliczeń. To rozwiązanie umożliwia zachowanie kopii bazy danych "na żywo" w określonych odstępach czasu
  • Power BI

  • Azure Cosmos DB

    • Wybór jednostki SKU firmy Contoso: zapis w jednym regionie z okresową kopią zapasową
    • Wpływ odzyskiwania po awarii
    • Notatki
      • Konta z jednym regionem mogą utracić dostępność po awarii regionalnej. Aby zapewnić wysoką dostępność wystąpienia usługi Cosmos DB, skonfiguruj je w jednym regionie zapisu i co najmniej drugim (odczyt) i włącz tryb failover zarządzany przez usługę
      • Aby uniknąć utraty dostępności zapisu, zaleca się skonfigurowanie obciążeń produkcyjnych z "włączaniem trybu failover zarządzanego przez usługę", co umożliwia automatyczne przełączanie w tryb failover do dostępnych regionów
  • Azure AI Search (dawniej Cognitive Search)

    • Wybór jednostki SKU firmy Contoso: Standardowa S1
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: w razie potrzeby firma Contoso musiałaby zweryfikować dostępność i ponownie wdrożyć
      • Niepowodzenie strefy dostępności: w razie potrzeby firma Contoso musi zweryfikować dostępność i ponownie wdrożyć
      • Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć wyszukiwanie sztucznej inteligencji w regionie pomocniczym
    • Notatki
  • Azure Data Share

    • Wybór jednostki SKU firmy Contoso: Nie dotyczy
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: w razie potrzeby firma Contoso musiałaby zweryfikować dostępność i ponownie wdrożyć
      • Niepowodzenie strefy dostępności: w razie potrzeby firma Contoso musi zweryfikować dostępność i ponownie wdrożyć
      • Awaria regionalna platformy Azure: firma Contoso musiałaby ponownie wdrożyć udział danych w regionie pomocniczym
    • Notatki
      • Usługa Azure Data Share nie jest obecnie obsługiwana przez Strefy dostępności
      • Uplifting Data Share to a HA deployment will address each of these outage risks (Uplifting Data Share to a HA deployment ) będzie dotyczyć każdego z tych zagrożeń związanych z awarią
  • Kompetencji

    • Wybór jednostki SKU firmy Contoso: Nie dotyczy
    • Wpływ odzyskiwania po awarii
      • Niepowodzenie centrum danych Platformy Azure: nie dotyczy
      • Niepowodzenie strefy dostępności: w razie potrzeby firma Contoso musi zweryfikować dostępność i ponownie wdrożyć
      • Awaria regionalna platformy Azure: firma Contoso musi wdrożyć wystąpienie usługi Purview w regionie pomocniczym
    • Notatki
      • To działanie zostanie złagodzone przez zaimplementowanie strategii "Warm Spare" o drugim wystąpieniu usługi Azure Purview dostępnej w regionie pomocniczym
      • Podejście "Warm Spare" ma następujące kluczowe objaśnienia:
        • Nie można skonfigurować kont podstawowych i pomocniczych usługi Azure Purview do tych samych kont usług Azure Data Factory, Azure Data Share i Synapse Analytics, jeśli ma to zastosowanie. W związku z tym pochodzenie danych z usług Azure Data Factory i Azure Data Share nie może być widoczne na pomocniczych kontach usługi Azure Purview
        • Środowiska Integration Runtime są specyficzne dla konta usługi Azure Purview. W związku z tym, jeśli skanowanie musi być uruchamiane równolegle na kontach podstawowej i pomocniczej usługi Azure Purview, należy zachować wiele własnych środowisk Integration Runtime

Uwaga

Ta sekcja jest przeznaczona jako ogólne wskazówki. Dokumentacja dostawcy dotycząca odzyskiwania po awarii, nadmiarowości i tworzenia kopii zapasowych powinna być konsultowana w celu uzyskania odpowiedniego podejścia do nowego składnika/usługi.

"Awaria centrum danych Azure" obejmuje sytuację, w której region, którego dotyczy problem, nie ma Strefy dostępności oferowanych.

Jeśli w momencie wystąpienia awarii wystąpiła nowa/zaktualizowana konfiguracja lub wydania, należy je sprawdzić i ponownie wdrożyć (w razie potrzeby) w ramach pracy w celu zapewnienia aktualności platformy.

Następne kroki

Teraz, po zapoznaniu się ze szczegółami scenariusza, możesz dowiedzieć się więcej o zaleceniach związanych z tym scenariuszem