Udostępnij za pośrednictwem


Niezawodność w narzędziu Azure Operator Nexus

Ważne

Ta funkcja jest aktualnie dostępna jako funkcja podglądu. Wersje zapoznawcze są udostępniane pod warunkiem udzielenia zgody na dodatkowe warunki użytkowania.

W tym artykule opisano obsługę niezawodności w narzędziu Azure Operator Nexus i opisano odporność wewnątrz regionalną ze strefami dostępności. Aby uzyskać bardziej szczegółowe omówienie niezawodności na platformie Azure, zobacz Niezawodność platformy Azure.

Obsługa strefy dostępności

Strefy dostępności platformy Azure to co najmniej trzy fizycznie oddzielne grupy centrów danych w każdym regionie świadczenia usługi Azure. Centra danych w każdej strefie są wyposażone w niezależną infrastrukturę zasilania, chłodzenia i sieci. W przypadku awarii strefy lokalnej strefy strefy dostępności są zaprojektowane tak, aby w przypadku wystąpienia problemu z jedną strefą usługi regionalne, pojemność i wysoka dostępność są obsługiwane przez pozostałe dwie strefy.

Awarie mogą wahać się od awarii oprogramowania i sprzętu po zdarzenia, takie jak trzęsienia ziemi, powodzie i pożary. Tolerancja awarii jest osiągana z nadmiarowością i logiczną izolacją usług platformy Azure. Aby uzyskać bardziej szczegółowe informacje na temat stref dostępności na platformie Azure, zobacz Regiony i strefy dostępności.

Usługi z obsługą stref dostępności platformy Azure zostały zaprojektowane w celu zapewnienia odpowiedniego poziomu niezawodności i elastyczności. Można je skonfigurować na dwa sposoby. Mogą być strefowo nadmiarowe, z automatyczną replikacją między strefami lub strefami, z wystąpieniami przypiętymi do określonej strefy. Możesz również połączyć te podejścia. Aby uzyskać więcej informacji na temat architektury strefowej i strefowo nadmiarowej, zobacz Rekomendacje na potrzeby korzystania ze stref dostępności i regionów.

Operator platformy Azure Nexus domyślnie oferuje wdrożenia strefowo nadmiarowe dostępności. Składniki Operator Nexus, takie jak Menedżer klastra i Kontroler sieci szkieletowej sieci, są wdrażane w klastrze usługi Azure Kubernetes Service (AKS), który jest włączony ze strefami dostępności. Inne zależności usługi, takie jak usługa konta magazynu i usługa KeyVault, są również konfigurowane z nadmiarowością stref dostępności.

Uwaga

Operator Nexus On-Premises instance implementuje projekt z wieloma stojakami, który zapewnia nadmiarowość fizyczną na wszystkich poziomach stosu. Każdy stojak jest zaprojektowany jako domena awarii lub strefa Nexus. Obciążenia klientów można wdrażać na wielu stojakach/węzłach, co zasadniczo zapewnia podobne środowisko strefy z wieloma dostępnościami.

Środowisko stref dostępności platformy Azure nie działa

W scenariuszu w dół strefy dostępności wywołania interfejsu API względem klastra i dostawców zasobów będą nadal działać bez przerwy. Nie będzie to miało wpływu na aktualnie uruchomione obciążenia dzierżawy lokalnej lub możliwość tworzenia nowych obciążeń dzierżawy. Ponadto nie powinna wystąpić żadna utrata danych, ponieważ zapewniana jest odporność operatora Nexus i innych typów zasobów.

Obsługa trybu failover strefy dostępności platformy Azure

W przypadku awarii strefy dostępności ponowne nawiązywanie połączenia z inną strefą dostępności platformy Azure jest automatyczne i nie wymaga interakcji od użytkownika.

Dostępność wdrożeń wystąpień operatora Nexus

Zapewnienie dostępności wdrożeń obciążeń Operator Nexus platformy Azure jest podzielone. Zgodnie z opisem w poprzedniej sekcji zasoby oparte na usłudze Operator Nexus AKS są wdrażane z nadmiarowością strefy dostępności. W tej sekcji rozważymy najlepsze rozwiązania dotyczące dostępności obciążeń lokalnych.

Ogólnie rzecz biorąc, cele dostępności są osiągane za pośrednictwem wdrożeń lokalnych i geograficznie nadmiarowych.

Strefa Nexus: mechanizm nadmiarowości obciążeń lokalnych

Wystąpienia lokalne Operatora Nexus składają się z konstrukcji wielotelerowej, która zapewnia nadmiarowość fizyczną na wszystkich poziomach stosu. Każdy stojak jest wyznaczony jako domena awarii, dlatego można skonfigurować jako strefę Nexus, w której te strefy mogą i, najlepiej, powinny być używane w przypadku wdrożeń obciążeń nadmiarowych lokalnych.

Wystąpienie Nexusa: mechanizm nadmiarowości obciążeń geograficznych

Wystąpienia lokalne Nexus są hostowane w określonym regionie świadczenia usługi Azure. Jak wspomniano wcześniej, używane usługi platformy Azure i zasoby Nexus są wdrażane w wielu strefach dostępności w tym regionie świadczenia usługi Azure.

Wystąpienia Nexus, które są geograficznie rozproszone, tj. nie w tym samym centrum danych operatora (prawdopodobnie nawet w tym samym regionie geograficznym) i hostowane w różnych regionach platformy Azure powinny być używane do nadmiarowego wdrażania obciążeń na potrzeby nadmiarowości geograficznej.

Ostrzeżenie

Wdrażanie obciążeń na przykład dwóch geograficznie rozproszonych wystąpień Nexus jest niewystarczające do osiągnięcia prawdziwej nadmiarowości geograficznej, chyba że wystąpienia geograficznie nadmiarowe Nexus są hostowane w różnych regionach świadczenia usługi Azure.

W mało prawdopodobnym przypadku, gdy region świadczenia usługi Azure stanie się niedostępny, usługi platformy Azure oraz zasoby Nexus w tym regionie również staną się niedostępne. Chociaż nie ma to wpływu na uruchomione obciążenia, zapobiega możliwościom, takim jak uruchamianie nowych obciążeń, analiza itp.

Wiele wystąpień Nexus w tej samej lokalizacji geograficznej

Istnieją scenariusze, w których należy wdrożyć wiele wystąpień Nexus w tej samej lokalizacji geograficznej. Nadmiarowość geograficzna obciążenia nie jest oczywiście osiągana przez wdrożenie obciążeń w wystąpieniach Nexus w tej samej lokalizacji geograficznej.

Jednym z zagadnień związanych z projektowaniem pod kątem niezawodności, poza dostępnością, jest odporność i możliwość odzyskiwania po awariach. Odzyskiwanie po awariach i możliwość spełnienia celów czasu odzyskiwania wymaga ograniczenia "wybuchu" lub promienia awarii. W scenariuszu, w którym wiele wystąpień Nexus jest wdrażanych w tej samej lokalizacji geograficznej, odporne wymagania projektowe, że te wystąpienia Nexus są hostowane w różnych regionach świadczenia usługi Azure. W związku z tym, gdy region świadczenia usługi Azure ulegnie awarii, jego wpływ jest ograniczony do jednego wystąpienia Nexusa.

Następne kroki