Co to jest dokumentacja dotycząca niezawodności Azure?

Azure zapewnia kompleksowy zestaw możliwości niezawodności, które ułatwiają spełnienie wymagań dotyczących obciążenia. Dokumentacja dotycząca niezawodności Azure zawiera przewodniki specyficzne dla usługi dotyczące sposobu, w jaki każda usługa Azure obsługuje te możliwości niezawodności platformy, takie jak obsługa błędów przejściowych, strefy dostępności, obsługa wielu regionów i obsługa kopii zapasowych. Aby wyświetlić bieżącą listę przewodników dotyczących usługi niezawodności, zobacz Przewodniki dotyczące niezawodności według usługi.

Oprócz przewodników dotyczących usługi niezawodności dokumentacja dotycząca niezawodności Azure zawiera również ogólne informacje, takie jak:

Azure regiony: Informacje o regionach Azure, sparowanych i nieparowanych regionach oraz różnych konfiguracjach regionów.
Strefy dostępności Azure: Informacje na temat stref dostępności, w tym, w jaki sposób wspierają wysoką dostępność i odbudowę po awarii. Ta sekcja zawiera również listy usług Azure i regionów, które obsługują strefy dostępności.
Pojęcia dotyczące niezawodności: Podstawowe pojęcia dotyczące niezawodności, takie jak:
- Ciągłość działania, wysoka dostępność i odzyskiwanie po awarii.
- Nadmiarowość, replikacja i kopia zapasowa.
- Przełączenie awaryjne i przywrócenie.
- Wspólna odpowiedzialność między firmą Microsoft a Tobą.
- Zagadnienia dotyczące niezależności i rezydencji danych.

Co to jest niezawodność?

Niezawodność odnosi się do zdolności obciążenia do spójnego wykonywania na akceptowalnym poziomie usług i zgodnie z wymaganiami dotyczącymi ciągłości działania. Niezawodność to kluczowa koncepcja przetwarzania w chmurze. W Azure niezawodność jest osiągana za pomocą kombinacji czynników, w tym projektu samej platformy, jej usług, architektury aplikacji oraz implementacji najlepszych rozwiązań.

Dwa kluczowe podejścia do osiągnięcia niezawodności w obciążeniu to:

Odporność: możliwość wytrzymania i kontynuowania działania w przypadku wystąpienia problemów, takich jak błędy tymczasowe, awarie infrastruktury lub nieoczekiwane skoki zapotrzebowania. Odporność pomaga uniknąć zakłóceń.
Możliwość odzyskiwania: możliwość przywracania normalnych operacji po przerwie. W przypadku wystąpienia zakłóceń funkcja odzyskiwania pomaga przywrócić niezawodny stan.

Platforma i usługi Azure oferują szereg funkcji niezawodności, takich jak strefy dostępności, obsługa wielu regionów, replikacja danych i tworzenie kopii zapasowych i przywracanie. Te funkcje należy wziąć pod uwagę podczas projektowania obciążenia w celu spełnienia wymagań dotyczących ciągłości działania.

Wskazówka

Niezawodność obejmuje również inne elementy projektu rozwiązania, w tym sposób bezpiecznego wdrażania zmian, sposób zarządzania wydajnością w celu uniknięcia przestojów z powodu dużego obciążenia oraz sposobu testowania i weryfikowania poszczególnych części rozwiązania. Aby dowiedzieć się więcej, zobacz Azure Well-Architected Framework.

Przewodniki dotyczące niezawodności usług Azure

Azure zapewnia kompleksowy zestaw możliwości niezawodności, które ułatwiają spełnienie wymagań dotyczących obciążenia. Przewodniki dotyczące niezawodności usług Azure to przewodniki specyficzne dla usługi dotyczące sposobu, w jaki każda usługa Azure obsługuje te możliwości niezawodności platformy, takie jak obsługa błędów przejściowych, odporność na strefę dostępności i regionalne awarie oraz tworzenie kopii zapasowych i przywracanie. Aby zapoznać się z bieżącą listą przewodników dotyczących niezawodności usług, zobacz przewodniki dotyczące Niezawodności dla usług Azure.

Regiony Azure

Azure zapewnia ponad 60 regionów na całym świecie, które znajdują się w wielu różnych lokalizacjach geograficznych. Każdy region to zestaw obiektów fizycznych, które obejmują centra danych i infrastrukturę sieci. Wszystkie regiony mogą być podzielone na obszary geograficzne nazywane lokalizacjami geograficznymi. Każda lokalizacja geograficzna jest granicą rezydencji danych i może zawierać co najmniej jeden region.

Azure regiony oferują pewne opcje odporności. Wiele regionów zapewnia strefy dostępności, a niektóre mają sparowane regiony, podczas gdy inne są niesparowane. Po wybraniu regionu dla usług należy zwrócić uwagę na opcje odporności, które są dostępne w tym regionie.

Aby wyświetlić listę regionów Azure, zobacz Lista regionów Azure.
Aby wyświetlić listę usług wdrożonych w regionach Azure, zobacz Product Availability by Region

Azure strefy dostępności

Wiele Azure regionów zapewnia strefy dostępności, które są oddzielnymi grupami centrów danych w obrębie regionu. Strefy dostępności są ważnym sposobem osiągnięcia niezawodności na platformie Azure, ponieważ zapewniają one pewien poziom izolacji fizycznej w regionie.

Strefy dostępności są wystarczająco blisko, aby mieć połączenia o niskim opóźnieniu z innymi strefami dostępności, ale są wystarczająco odległe, aby zmniejszyć prawdopodobieństwo, że więcej niż jedna strefa zostanie dotknięta przez lokalne awarie lub zjawiska pogodowe. Strefy dostępności mają niezależną infrastrukturę zasilania, chłodzenia i sieci. Są one zaprojektowane tak, aby w przypadku wystąpienia awarii w jednej strefie usługi regionalne, pojemność i wysoka dostępność były obsługiwane przez pozostałe strefy.

Aby uzyskać więcej informacji na temat stref dostępności, zobacz Co to są strefy dostępności?.
Aby wyświetlić regiony obsługujące strefy dostępności, zobacz Lista regionów Azure.

Pojęcia dotyczące niezawodności

Sekcja pojęcia dotyczące niezawodności zawiera omówienie niektórych kluczowych pojęć i zasad, które stanowią podstawę niezawodności Azure.

Ciągłość działania, wysoka dostępność i odzyskiwanie po awarii

Planowanie ciągłości działania można zrozumieć jako ciągły proces zarządzania ryzykiem dzięki wysokiej dostępności i projektowi odzyskiwania po awarii.

Biorąc pod uwagę ciągłość działalności biznesowej, ważne jest, aby zrozumieć następujące terminy:

Ciągłość działania to stan, w którym firma może kontynuować operacje podczas usterek, przerw lub katastrof. Ciągłość działalności biznesowej wymaga proaktywnego planowania, przygotowania i implementacji odpornych systemów i procesów.
Wysoka dostępność polega na projektowaniu rozwiązania spełniającego potrzeby biznesowe dotyczące dostępności i odporności na codzienne problemy, które mogą mieć wpływ na wymagania dotyczące czasu pracy.
Odzyskiwanie po katastrofie polega na planowaniu, jak radzić sobie z nietypowymi zagrożeniami i potencjalnymi katastrofalnymi awariami.

Aby uzyskać informacje na temat ciągłości działania i planowania ciągłości działania dzięki projektowi wysokiej dostępności i odzyskiwania po awarii, zobacz Co to są ciągłość działalności biznesowej, wysoka dostępność i odzyskiwanie po awarii?.

Nadmiarowość, replikacja i kopia zapasowa

Często myślimy o chmurze jako globalnie rozproszonym, wszechobecnym systemie. Jednak w rzeczywistości chmura składa się ze sprzętu działającego w centrach danych. Odporność wymaga, aby uwzględnić niektóre zagrożenia związane z lokalizacjami fizycznymi, w których działają składniki hostowane w chmurze.

Nadmiarowość to możliwość obsługi wielu identycznych kopii składnika usługi i używania tych kopii w sposób uniemożliwiający, że każdy składnik staje się pojedynczym punktem awarii.

Replikacja lub nadmiarowość danych to możliwość obsługi wielu kopii danych nazywanych replikami.

Tworzenie kopii zapasowej to możliwość tworzenia i przechowywania kopii danych z sygnaturą czasową, których można użyć do przywrócenia utraconych danych.

Aby zapoznać się z wprowadzeniem do nadmiarowości, replikacji i tworzenia kopii zapasowych, zobacz Co to jest nadmiarowość, replikacja i kopia zapasowa?.

Przełączenie awaryjne i powrót po awarii

Częstą przyczyną utrzymania nadmiarowych kopii aplikacji i replik danych jest możliwość przejścia w tryb failover. W przypadku trybu failover można przekierowywać ruch i żądania z niesprawnych wystąpień do sprawnych. Następnie, gdy oryginalne wystąpienia odzyskają sprawność, można przeprowadzić przywrócenie do oryginalnej konfiguracji.

Aby uzyskać więcej informacji na temat trybu failover i powrotu po awarii, zobacz Co to jest tryb failover i powrót po awarii?.

Wspólna odpowiedzialność

Azure usługi są tworzone tak, aby były odporne na wiele typowych awarii, a każdy produkt zapewnia umowę dotyczącą poziomu usług (SLA), która opisuje czas pracy, którego można oczekiwać. Jednak ogólna niezawodność obciążenia zależy od tego, w jaki sposób zaprojektowano rozwiązanie zgodnie z potrzebami biznesowymi. Niektóre plany ciągłości działania mogą uwzględniać pewne zagrożenia związane z niepowodzeniem, które są nieistotne, podczas gdy inne mogą je traktować jako krytyczne.

W Azure platformie chmury publicznej niezawodność jest wspólną odpowiedzialnością między firmą Microsoft a Tobą. Ze względu na to, że istnieją różne poziomy niezawodności w każdym obciążeniu, które projektujesz i wdrażasz, ważne jest, aby zrozumieć, kto ma główną odpowiedzialność za każdy z tych poziomów z perspektywy niezawodności. Aby lepiej zrozumieć, jak działa wspólna odpowiedzialność, zwłaszcza w przypadku wystąpienia awarii lub katastrofy, zobacz Wspólna odpowiedzialność za niezawodność.

Niezależność i miejsce przechowywania danych

Podczas projektowania niezawodności należy uwzględnić wymagania dotyczące niezależności i rezydencji danych na wczesnym etapie, ponieważ mają one wpływ na wybór regionu, strategię replikacji i ścieżki trybu failover. Odporna architektura może nadal nie spełniać wymogów zgodności, jeśli przełączenie awaryjne lub przenoszenie danych przekracza granice objęte ograniczeniami. Aby uzyskać więcej informacji, zobacz Niezawodność i niezależność.

Opinia

Czy ta strona była pomocna?

Last updated on 2026-06-02