Zalecenia dotyczące projektowania w wielu regionach o wysokiej dostępności

Dotyczy tego zalecenia dotyczącego listy kontrolnej niezawodności platformy Azure Well-Architected Framework:

RE:05 Dodaj nadmiarowość na różnych poziomach, szczególnie w przypadku przepływów krytycznych. Zastosuj nadmiarowość do warstw obliczeniowych, danych, sieci i innych warstw infrastruktury zgodnie ze zidentyfikowanymi celami niezawodności.

Powiązane przewodniki:Nadmiarowość | przy użyciu stref dostępności i regionów

W tym przewodniku opisano zalecenia dotyczące projektowania środowiska chmury o wysokiej dostępności w wielu regionach. Wysoka dostępność to podstawowy zestaw projektowania pod kątem niezawodności. Architektura o wysokiej dostępności może pomóc uniknąć przestojów w możliwie największym stopniu i wydajnie odzyskać, jeśli wystąpi przestój.

Aktywne-aktywne i aktywne-pasywne to ogólne typy architektur, które można stosować na różne sposoby, w zależności od platformy, na której wdrażasz środowisko. Ten przewodnik koncentruje się na projekcie środowiska chmury w wielu regionach. Na platformie Azure można również zaprojektować architekturę aktywny-aktywny lub aktywny-pasywny w jednym regionie przy użyciu stref dostępności. Aby uzyskać szczegółowe wskazówki dotyczące projektowania architektury o wysokiej dostępności przy użyciu stref dostępności, zobacz Przewodnik platformy Azure Well-Architected Framework.

Kluczowe strategie projektowania

Aktywne-aktywne i aktywne-pasywne to dwa podstawowe podejścia do projektowania środowiska chmury o wysokiej dostępności. Środowiska aktywne-aktywne są przeznaczone do obsługi obciążeń produkcyjnych w każdym regionie, w którym wdrażasz obciążenie. Środowiska aktywne-pasywne są przeznaczone do obsługi obciążeń produkcyjnych tylko w regionie podstawowym, ale w razie potrzeby przełączenia w tryb failover do regionu pomocniczego (pasywnego). Wybór najlepszych regionów świadczenia usługi Azure dla obciążenia jest kluczowym elementem projektowania środowiska z wieloma regionami o wysokiej dostępności. Aby uzyskać wskazówki dotyczące wybierania regionów platformy Azure, zobacz przewodnik Select Azure Regions (Wybieranie regionów świadczenia usługi Azure).

W tej sekcji opisano opcje projektowania, które należy wziąć pod uwagę podczas oceny każdego wzorca i uściślić architekturę w celu spełnienia wymagań biznesowych.

Zobacz Wzorzec sygnatur wdrażania, aby uzyskać wskazówki dotyczące tworzenia architektury obciążenia w powtarzalny, skalowalny sposób. Ten wzorzec projektowy może pomóc w optymalizacji projektu wysokiej dostępności pod kątem wydajnego zarządzania.

W poniższych sekcjach opisano opcje projektowania tych dwóch wzorców.

Aktywne/aktywne

  • Aktywne-aktywne w pojemności: dublowane sygnatury wdrożenia w co najmniej dwóch regionach świadczenia usługi Azure, z których każda jest skonfigurowana do obsługi obciążeń produkcyjnych dla regionu lub regionów, które obsługują i skalowalne do obsługi obciążeń z innych regionów w przypadku awarii regionalnej.

    • Sieć: użyj opóźnienia lub routingu globalnego ważonego , aby rozłożyć ruch między regionami.

    • Replikacja i spójność danych: używaj globalnie rozproszonego magazynu danych, takiego jak usługa Azure Cosmos DB , na potrzeby możliwości odczytu i zapisu w wielu regionach. W przypadku relacyjnych baz danych należy używać replik do odczytu z parametrami połączenia tylko do odczytu.

    • Zaleta tego projektu: niższe koszty operacyjne niż nadmierna aprowizowana konstrukcja.

    • Wadą tego projektu: Możliwe pogorszenie środowiska użytkownika podczas skalowania w górę w celu spełnienia wymagań pełnego obciążenia, jeśli inny region ulegnie awarii.

  • Nadmierna aprowizacja aktywna-aktywna: dublowane sygnatury wdrożenia w co najmniej dwóch regionach świadczenia usługi Azure, z których każda jest nadmierna aprowizacja w celu obsługi obciążeń produkcyjnych dla regionu lub regionów, które obsługują, oraz obsługi obciążeń z innych regionów w przypadku awarii regionalnej.

    • Sieć: użyj opóźnienia lub routingu globalnego ważonego , aby rozłożyć ruch między regionami.

    • Replikacja i spójność danych: używaj globalnie rozproszonego magazynu danych, takiego jak usługa Azure Cosmos DB , na potrzeby możliwości odczytu i zapisu w wielu regionach. W przypadku relacyjnych baz danych należy używać replik do odczytu z parametrami połączenia tylko do odczytu.

    • Zaleta tego projektu: najbardziej odporny projekt jest możliwy.

    • Wadą tego projektu: Wyższe koszty operacyjne niż skalowalny projekt.

  • Typowe zalety obu projektów: wysoka odporność i niskie ryzyko awarii pełnego obciążenia.

  • Typowe wady obu projektów: wyższe koszty operacyjne i obciążenie związane z zarządzaniem z powodu różnych czynników, w tym konieczności zarządzania synchronizacją stanu aplikacji i danych.

Aktywne/pasywne

  • Ciepły zapasowy: jeden region podstawowy i co najmniej jeden region pomocniczy. Region pomocniczy jest wdrażany z minimalnym możliwymi możliwościami obliczeniowymi i rozmiarami danych oraz jest uruchamiany bez obciążenia. Ten region jest znany jako ciepły region zapasowy . Po przejściu w tryb failover zasoby obliczeniowe i zasoby danych są skalowane w celu obsługi obciążenia z regionu podstawowego.

    • Sieć: użyj routingu globalnego o priorytecie .

    • Replikacja i spójność danych: replikuj bazę danych do regionu pasywnego i korzystaj z automatycznych funkcji trybu failover rozwiązań typu platforma jako usługa (PaaS), takich jak Azure Cosmos DB i Azure SQL Database.

    • Zaleta tego projektu: najkrótszy czas odzyskiwania wśród projektów aktywny-pasywny.

    • Wadą tego projektu: Najwyższy koszt operacyjny wśród projektów aktywnych-pasywnych.

  • Zimny zapasowy: jeden region podstawowy i co najmniej jeden region pomocniczy. Region pomocniczy jest skalowany w celu obsługi pełnego obciążenia, ale wszystkie zasoby obliczeniowe są zatrzymywane. Ten region jest znany jako zimny region zapasowy . Należy uruchomić zasoby przed przejściem w tryb failover.

    • Sieć: użyj routingu globalnego o priorytecie .

    • Replikacja i spójność danych: replikuj bazę danych do regionu pasywnego i korzystaj z funkcji automatycznego trybu failover rozwiązań PaaS, takich jak Azure Cosmos DB i Azure SQL Database.

    • Zaleta tego projektu: niższe koszty operacyjne niż ciepły zapasowy projekt.

    • Wadą tego projektu: Dłuższy czas odzyskiwania niż ciepły zapasowy projekt.

  • Ponowne wdrażanie w przypadku awarii: jeden region podstawowy i co najmniej jeden region pomocniczy. Tylko niezbędna sieć jest wdrażana w regionie pomocniczym. Operatorzy muszą uruchamiać skrypty aprowizacji w regionie pomocniczym, aby przejąć obciążenia w tryb failover. Ten projekt jest znany jako ponowne wdrażanie w przypadku awarii.

    • Sieć: użyj routingu globalnego o priorytecie .

    • Replikacja danych i spójność: wdrażanie nowych wystąpień bazy danych i ponowne wypełnianie danych z kopii zapasowych.

    • Zaleta tego projektu: najniższe koszty operacyjne.

    • Wadą tego projektu: najdłuższy czas odzyskiwania.

  • Typowe zalety projektów aktywnych-pasywnych: niższe koszty operacyjne i mniejsze obciążenie związane z zarządzaniem codziennym niż projekty aktywne-aktywne. Nie trzeba synchronizować stanu aplikacji.

  • Typowe wady projektów aktywnych-pasywnych: dłuższy, bardziej złożony proces odzyskiwania. Większe prawdopodobieństwo konieczności ręcznej interwencji w celu pomyślnego przejścia w tryb failover.

Uwaga

Niezależnie od projektu o wysokiej dostępności należy pamiętać o skonfigurowaniu nadmiarowości dla usług pomocniczych, takich jak infrastruktura Usługi Azure DevOps, pola przesiadkowe, monitorowanie i wszelkie inne krytyczne usługi niezbędne do administrowania obciążeniem.

Ułatwienia dla platformy Azure

  • Usługa Azure Front Door łączy globalne funkcje routingu usługi Azure Traffic Manager z systemem dostarczania zawartości i zaporą aplikacji internetowej, aby ułatwić zarządzanie obciążeniem o wysokiej dostępności.

  • Azure Cosmos DB to globalnie rozproszona platforma bazy danych NoSQL, która może pomóc w uruchomieniu aktywnego środowiska aktywnego i zminimalizować ryzyko przestoju w przypadku wystąpienia regionalnej awarii.

Lista kontrolna dotycząca niezawodności

Zapoznaj się z pełnym zestawem zaleceń.