Udostępnij za pośrednictwem


Zalecenia dotyczące projektowania w wielu regionach o wysokiej dostępności

Dotyczy tego zalecenia listy kontrolnej dotyczącej niezawodności platformy Azure Well-Architected Framework:

RE:05 Dodaj nadmiarowość na różnych poziomach, szczególnie w przypadku przepływów krytycznych. Zastosuj nadmiarowość do warstw obliczeniowych, danych, sieci i innych warstw infrastruktury zgodnie ze zidentyfikowanymi celami niezawodności.

Powiązane przewodniki: Nadmiarowość | przy użyciu stref dostępności i regionów

W tym przewodniku opisano zalecenia dotyczące projektowania środowiska chmury o wysokiej dostępności w wielu regionach. Wysoka dostępność to podstawowy zestaw projektowania pod kątem niezawodności. Architektura o wysokiej dostępności może pomóc uniknąć jak największego przestoju i wydajnego odzyskiwania, jeśli wystąpi przestój.

Aktywne-aktywne i aktywne-pasywne są ogólnymi typami architektury, które można stosować na różne sposoby, w zależności od platformy wdrażanej w środowisku. Ten przewodnik koncentruje się na projekcie środowiska chmury w wielu regionach. Na platformie Azure można również zaprojektować architekturę active-active-active-passive w jednym regionie przy użyciu stref dostępności. Aby uzyskać szczegółowe wskazówki dotyczące projektowania architektury o wysokiej dostępności przy użyciu stref dostępności, zobacz Przewodnik po platformie Azure Well-Architected Framework.

Kluczowe strategie projektowania

Aktywne i aktywne-pasywne to dwa podstawowe podejścia do projektowania środowiska chmury o wysokiej dostępności. Środowiska aktywne-aktywne są przeznaczone do obsługi obciążeń produkcyjnych w każdym regionie, w którym wdrażasz obciążenie. Środowiska aktywne-pasywne są przeznaczone do obsługi obciążeń produkcyjnych tylko w regionie podstawowym, ale w razie potrzeby przełączenia w tryb failover do regionu pomocniczego (pasywnego). Wybór najlepszych regionów świadczenia usługi Azure dla obciążenia jest kluczowym elementem projektowania środowiska z wieloma regionami o wysokiej dostępności. Aby uzyskać wskazówki dotyczące wybierania regionów platformy Azure, zobacz przewodnik Select Azure Regions (Wybieranie regionów świadczenia usługi Azure).

W tej sekcji opisano opcje projektowania, które należy wziąć pod uwagę podczas oceny każdego wzorca i uściślić architekturę w celu spełnienia wymagań biznesowych.

Zobacz Wzorzec sygnatur wdrażania, aby uzyskać wskazówki dotyczące tworzenia architektury obciążenia w powtarzalny, skalowalny sposób. Ten wzorzec projektu może pomóc w optymalizacji projektu wysokiej dostępności pod kątem wydajnego zarządzania.

W poniższych sekcjach opisano opcje projektowania tych dwóch wzorców.

Aktywne/aktywne

  • Aktywny-aktywny w pojemności: dublowane sygnatury wdrożenia w co najmniej dwóch regionach świadczenia usługi Azure, z których każda jest skonfigurowana do obsługi obciążeń produkcyjnych dla regionu lub regionów, które obsługują i skalowalne do obsługi obciążeń z innych regionów w przypadku awarii regionalnej.

    • Sieć: użyj opóźnienia lub routingu globalnego ważonego , aby rozłożyć ruch między regionami.

    • Replikacja i spójność danych: używaj globalnie rozproszonego magazynu danych, takiego jak usługa Azure Cosmos DB , na potrzeby funkcji odczytu i zapisu w wielu regionach. W przypadku relacyjnych baz danych użyj replik do odczytu z parametry połączenia tylko do odczytu.

    • Zaleta tego projektu: niższe koszty operacyjne niż nadmierna aprowizowana konstrukcja.

    • Wadą tego projektu: Możliwe obniżenie środowiska użytkownika podczas skalowania w górę w celu spełnienia wymagań pełnego obciążenia, jeśli inny region doświadcza awarii.

  • Aktywna aprowizowana nadmierna aprowizowana: dublowane sygnatury wdrożenia w co najmniej dwóch regionach świadczenia usługi Azure, z których każda jest nadmiernie aprowizowana w celu obsługi obciążeń produkcyjnych dla regionu lub regionów, które obsługują, oraz obsługi obciążeń z innych regionów w przypadku awarii regionalnej.

    • Sieć: użyj opóźnienia lub routingu globalnego ważonego , aby rozłożyć ruch między regionami.

    • Replikacja i spójność danych: używaj globalnie rozproszonego magazynu danych, takiego jak usługa Azure Cosmos DB , na potrzeby funkcji odczytu i zapisu w wielu regionach. W przypadku relacyjnych baz danych użyj replik do odczytu z parametry połączenia tylko do odczytu.

    • Zaleta tego projektu: najbardziej odporny projekt jest możliwy.

    • Wadą tego projektu: Wyższe koszty operacyjne niż skalowalny projekt.

  • Typowe zalety obu projektów: wysoka odporność i niskie ryzyko awarii pełnego obciążenia.

  • Typowe wady obu projektów: wyższe koszty operacyjne i obciążenie związane z zarządzaniem ze względu na różne czynniki, w tym konieczność zarządzania synchronizacją stanu aplikacji i danych.

Aktywne/pasywne

  • Ciepły zapasowy: jeden region podstawowy i co najmniej jeden region pomocniczy. Region pomocniczy jest wdrażany z minimalnym możliwym rozmiarem i rozmiarem danych oraz jest uruchamiany bez ładowania. Ten region jest znany jako ciepły region zapasowy . Po przejściu w tryb failover zasoby obliczeniowe i zasoby danych są skalowane w celu obsługi obciążenia z regionu podstawowego.

    • Sieć: Użyj priorytetowego routingu globalnego.

    • Replikacja danych i spójność: Replikuj bazę danych do pasywnego regionu i korzystaj z automatycznych możliwości trybu failover rozwiązań typu platforma jako usługa (PaaS), takich jak Azure Cosmos DB i Azure SQL Database.

    • Zaletą tego projektu: najkrótszy czas odzyskiwania wśród projektów aktywny-pasywny.

    • Wadą tego projektu: Najwyższy koszt operacyjny wśród projektów aktywny-pasywny.

  • Zimny zapasowy: jeden region podstawowy i co najmniej jeden region pomocniczy. Region pomocniczy jest skalowany w celu obsługi pełnego obciążenia, ale wszystkie zasoby obliczeniowe są zatrzymywane. Ten region jest znany jako zimny region zapasowy . Przed przejściem w tryb failover należy uruchomić zasoby.

    • Sieć: Użyj priorytetowego routingu globalnego.

    • Replikacja i spójność danych: Replikuj bazę danych do pasywnego regionu i korzystaj z automatycznych możliwości trybu failover rozwiązań PaaS, takich jak Azure Cosmos DB i Azure SQL Database.

    • Zaletą tego projektu: niższe koszty operacyjne niż ciepły zapasowy projekt.

    • Wadą tego projektu: Dłuższy czas odzyskiwania niż ciepły zapasowy projekt.

  • Ponowne wdrażanie w przypadku awarii: jeden region podstawowy i co najmniej jeden region pomocniczy. Tylko niezbędna sieć jest wdrażana w regionie pomocniczym. Operatorzy muszą uruchamiać skrypty aprowizacji w regionie pomocniczym, aby przejąć obciążenia w tryb failover. Ten projekt jest znany jako ponowne wdrażanie w przypadku awarii.

    • Sieć: Użyj priorytetowego routingu globalnego.

    • Replikacja i spójność danych: wdróż nowe wystąpienia bazy danych i ponownie wypełnianie danych z kopii zapasowych.

    • Zaletą tego projektu: najniższe koszty operacyjne.

    • Wadą tego projektu: najdłuższy czas odzyskiwania.

  • Typowe zalety projektów aktywnych-pasywnych: niższe koszty operacyjne i mniejsze obciążenie związane z zarządzaniem codziennym niż projekty aktywne-aktywne. Nie trzeba synchronizować stanu aplikacji.

  • Typowe wady projektów aktywnych-pasywnych: Dłuższy, bardziej złożony proces odzyskiwania. Większe prawdopodobieństwo konieczności ręcznej interwencji w celu pomyślnego przejścia w tryb failover.

Uwaga

Niezależnie od projektu wysokiej dostępności należy pamiętać o skonfigurowaniu nadmiarowości dla usług pomocniczych, takich jak infrastruktura usługi Azure DevOps, pola przesiadkowe, monitorowanie i wszelkie inne krytyczne usługi niezbędne do administrowania obciążeniem.

Ułatwienia platformy Azure

  • Usługa Azure Front Door łączy globalne funkcje routingu usługi Azure Traffic Manager z systemem dostarczania zawartości i zaporą aplikacji internetowej, aby ułatwić zarządzanie obciążeniem o wysokiej dostępności.

  • Azure Cosmos DB to globalnie rozproszona platforma bazy danych NoSQL, która może pomóc w uruchomieniu aktywnego środowiska aktywnego i zminimalizować ryzyko przestoju w przypadku wystąpienia regionalnej awarii.

Lista kontrolna dotycząca niezawodności

Zapoznaj się z pełnym zestawem zaleceń.