Uwaga
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Platforma Azure oferuje kompleksowy zestaw możliwości niezawodności, które ułatwiają spełnienie wymagań dotyczących obciążenia. Dokumentacja niezawodności platformy Azure zawiera przewodniki specyficzne dla usługi dotyczące sposobu, w jaki każda usługa platformy Azure obsługuje te możliwości niezawodności platformy, takie jak obsługa błędów przejściowych, strefy dostępności, obsługa wielu regionów i obsługa kopii zapasowych. Aby wyświetlić bieżącą listę przewodników dotyczących usługi niezawodności, zobacz Przewodniki dotyczące niezawodności według usługi.
Oprócz przewodników dotyczących usługi niezawodności dokumentacja dotycząca niezawodności platformy Azure zawiera również ogólne informacje, takie jak:
- Regiony platformy Azure: informacje o regionach platformy Azure, sparowanych i niepairowanych regionach oraz różnych konfiguracjach regionów.
- Strefy dostępności platformy Azure: informacje na temat stref dostępności, w tym sposobu obsługi wysokiej dostępności i odzyskiwania po awarii. Ta sekcja zawiera również listy usług i regionów platformy Azure, które obsługują strefy dostępności.
-
Pojęcia dotyczące niezawodności: Podstawowe pojęcia dotyczące niezawodności, takie jak:
- Ciągłość działania, wysoka dostępność i odzyskiwanie po awarii.
- Nadmiarowość, replikacja (nadmiarowość danych) i kopia zapasowa
- Przełączenie awaryjne i przywrócenie.
- Wspólna odpowiedzialność między firmą Microsoft a Tobą.
Co to jest niezawodność?
Niezawodność odnosi się do zdolności obciążenia do konsekwentnego działania na oczekiwanym poziomie i zgodnie z wymaganiami dotyczącymi ciągłości biznesowej. Niezawodność to kluczowa koncepcja przetwarzania w chmurze. Na platformie Azure niezawodność jest osiągana za pomocą kombinacji czynników, w tym projektu samej platformy, jej usług, architektury aplikacji oraz implementacji najlepszych rozwiązań.
Kluczowym podejściem do zapewnienia niezawodności obciążenia jest odporność, która jest zdolnością obciążenia do wytrzymania i odzyskania sprawności po usterkach i przestojach. Platforma Azure oferuje wiele funkcji odporności, takich jak strefy dostępności, obsługa wielu regionów, replikacja danych i możliwości tworzenia kopii zapasowych i przywracania. Te funkcje należy wziąć pod uwagę podczas projektowania obciążenia w celu spełnienia wymagań dotyczących ciągłości działania.
Wskazówka
Niezawodność obejmuje również inne elementy projektu rozwiązania, w tym sposób bezpiecznego wdrażania zmian, sposób zarządzania wydajnością w celu uniknięcia przestojów z powodu dużego obciążenia oraz sposobu testowania i weryfikowania poszczególnych części rozwiązania. Aby dowiedzieć się więcej, zobacz Platformę Azure Well-Architected Framework.
Regiony Azure
Platforma Azure udostępnia ponad 60 regionów globalnie, które znajdują się w wielu różnych lokalizacjach geograficznych. Każdy region to zestaw obiektów fizycznych, które obejmują centra danych i infrastrukturę sieci. Wszystkie regiony mogą być podzielone na obszary geograficzne nazywane lokalizacjami geograficznymi. Każda lokalizacja geograficzna jest granicą rezydencji danych i może zawierać co najmniej jeden region.
Regiony platformy Azure zapewniają pewne typy opcji odporności. Wiele regionów zapewnia strefy dostępności, a niektóre mają sparowane regiony, podczas gdy inne są niesparowane. Po wybraniu regionu dla usług należy zwrócić uwagę na opcje odporności, które są dostępne w tym regionie.
- Aby wyświetlić listę regionów świadczenia usługi Azure, zobacz Lista regionów świadczenia usługi Azure.
- Aby wyświetlić listę usług wdrożonych w regionach świadczenia usługi Azure, zobacz Dostępność produktów według regionów
Strefy dostępności platformy Azure
Wiele regionów platformy Azure zapewnia strefy dostępności, które są oddzielnymi grupami centrów danych w regionie. Strefy dostępności są ważnym sposobem osiągnięcia niezawodności na platformie Azure, ponieważ zapewniają one pewien poziom izolacji fizycznej w regionie.
Strefy dostępności są wystarczająco blisko, aby mieć połączenia o niskim opóźnieniu z innymi strefami dostępności, ale są wystarczająco odległe, aby zmniejszyć prawdopodobieństwo, że więcej niż jedna strefa zostanie dotknięta przez lokalne awarie lub zjawiska pogodowe. Strefy dostępności mają niezależną infrastrukturę zasilania, chłodzenia i sieci. Są one zaprojektowane tak, aby w przypadku wystąpienia awarii w jednej strefie usługi regionalne, pojemność i wysoka dostępność były obsługiwane przez pozostałe strefy.
- Aby uzyskać więcej informacji na temat stref dostępności, zobacz Co to są strefy dostępności?.
- Aby wyświetlić regiony obsługujące strefy dostępności, zobacz Lista regionów świadczenia usługi Azure.
Pojęcia dotyczące niezawodności
Sekcja pojęcia dotyczące niezawodności zawiera omówienie niektórych kluczowych pojęć i zasad, które stanowią podstawę niezawodności na platformie Azure.
Ciągłość działania, wysoka dostępność i odzyskiwanie po awarii
Planowanie ciągłości działania można zrozumieć jako ciągły proces zarządzania ryzykiem dzięki wysokiej dostępności i projektowi odzyskiwania po awarii.
Biorąc pod uwagę ciągłość działalności biznesowej, ważne jest, aby zrozumieć następujące terminy:
Ciągłość działania to stan, w którym firma może kontynuować operacje podczas usterek, przerw lub katastrof. Ciągłość działalności biznesowej wymaga proaktywnego planowania, przygotowania i implementacji odpornych systemów i procesów.
Wysoka dostępność polega na projektowaniu rozwiązania spełniającego potrzeby biznesowe dotyczące dostępności i odporności na codzienne problemy, które mogą mieć wpływ na wymagania dotyczące czasu pracy.
Odzyskiwanie po katastrofie polega na planowaniu, jak radzić sobie z nietypowymi zagrożeniami i potencjalnymi katastrofalnymi awariami.
Aby uzyskać informacje na temat ciągłości działania i planowania ciągłości działania dzięki projektowi wysokiej dostępności i odzyskiwania po awarii, zobacz Co to są ciągłość działalności biznesowej, wysoka dostępność i odzyskiwanie po awarii?.
Nadmiarowość, replikacja i kopia zapasowa
Często myślimy o chmurze jako globalnie rozproszonym, wszechobecnym systemie. Jednak w rzeczywistości chmura składa się ze sprzętu działającego w centrach danych. Odporność wymaga, aby uwzględnić niektóre zagrożenia związane z lokalizacjami fizycznymi, w których działają składniki hostowane w chmurze.
Nadmiarowość to możliwość obsługi wielu identycznych kopii składnika usługi i używania tych kopii w sposób uniemożliwiający, że każdy składnik staje się pojedynczym punktem awarii.
Replikacja lub nadmiarowość danych to możliwość obsługi wielu kopii danych nazywanych replikami.
Tworzenie kopii zapasowej to możliwość tworzenia i przechowywania kopii danych z sygnaturą czasową, których można użyć do przywrócenia utraconych danych.
Aby zapoznać się z wprowadzeniem do nadmiarowości, replikacji i tworzenia kopii zapasowych, zobacz Co to jest nadmiarowość, replikacja i kopia zapasowa?.
Przełączenie awaryjne i powrót po awarii
Częstą przyczyną utrzymania nadmiarowych kopii aplikacji i replik danych jest możliwość przejścia w tryb failover. W przypadku trybu failover można przekierowywać ruch i żądania z niesprawnych wystąpień do sprawnych. Następnie, gdy oryginalne wystąpienia odzyskają sprawność, można przeprowadzić przywrócenie do oryginalnej konfiguracji.
Aby uzyskać więcej informacji na temat trybu failover i powrotu po awarii, zobacz Co to jest tryb failover i powrót po awarii?.
Wspólna odpowiedzialność
Odporność definiuje zdolność zadania do automatycznego samonaprawiania się i odzyskiwania po różnych formach awarii lub przerw. Usługi platformy Azure są tworzone tak, aby były odporne na wiele typowych awarii, a każdy produkt zapewnia umowę dotyczącą poziomu usług (SLA), która opisuje czas pracy, którego można oczekiwać. Jednak ogólna odporność obciążenia zależy od tego, jak zaprojektowano rozwiązanie zgodnie z potrzebami biznesowymi. Niektóre plany ciągłości działania mogą uwzględniać pewne zagrożenia związane z niepowodzeniem, które są nieistotne, podczas gdy inne mogą je traktować jako krytyczne.
Na platformie chmury publicznej platformy Azure odporność jest wspólną odpowiedzialnością między firmą Microsoft a Tobą. Ponieważ istnieją różne poziomy odporności w każdym obciążeniu, które projektujesz i wdrażasz, ważne jest, aby zrozumieć, kto ma główną odpowiedzialność za każdy z tych poziomów z perspektywy odporności. Aby lepiej zrozumieć, jak działa wspólna odpowiedzialność, zwłaszcza w przypadku wystąpienia awarii lub katastrofy, zobacz Wspólna odpowiedzialność za odporność.