Udostępnij za pośrednictwem


Niezawodność w usłudze Azure Storage Actions

W tym artykule opisano obsługę niezawodności w usłudze Azure Storage Actions i opisano zarówno odporność wewnątrz regionalną ze strefami dostępności, jak i odzyskiwaniem po awarii między regionami i ciągłością działania. Aby uzyskać bardziej szczegółowe omówienie zasad niezawodności na platformie Azure, zobacz Niezawodność platformy Azure.

Azure Storage Actions to platforma bezserwerowa, której można używać do wykonywania typowych operacji na danych na milionach obiektów na wielu kontach magazynu. Sama usługa jest regionalna i nie ma jednostek SKU ani obsługi stref dostępności. Jednak płaszczyzna sterowania usługi automatycznie obsługuje nadmiarowość strefową. Płaszczyzna danych może również obsługiwać nadmiarowość w zależności od tego, czy konto magazynu jest uruchomione w konfiguracji strefowo nadmiarowej.

Obsługa strefy dostępności

Strefy dostępności platformy Azure to co najmniej trzy fizycznie oddzielne grupy centrów danych w każdym regionie świadczenia usługi Azure. Centra danych w każdej strefie są wyposażone w niezależną infrastrukturę zasilania, chłodzenia i sieci. W przypadku awarii strefy lokalnej strefy strefy dostępności są zaprojektowane tak, aby w przypadku wystąpienia problemu z jedną strefą usługi regionalne, pojemność i wysoka dostępność są obsługiwane przez pozostałe dwie strefy.

Awarie mogą wahać się od awarii oprogramowania i sprzętu po zdarzenia, takie jak trzęsienia ziemi, powodzie i pożary. Tolerancja awarii jest osiągana z nadmiarowością i logiczną izolacją usług platformy Azure. Aby uzyskać bardziej szczegółowe informacje na temat stref dostępności na platformie Azure, zobacz Regiony i strefy dostępności.

Usługi z obsługą stref dostępności platformy Azure zostały zaprojektowane w celu zapewnienia odpowiedniego poziomu niezawodności i elastyczności. Można je skonfigurować na dwa sposoby. Mogą być strefowo nadmiarowe, z automatyczną replikacją między strefami lub strefami, z wystąpieniami przypiętymi do określonej strefy. Możesz również połączyć te podejścia. Aby uzyskać więcej informacji na temat architektury strefowej i strefowo nadmiarowej, zobacz Zalecenia dotyczące korzystania ze stref dostępności i regionów.

Chociaż usługa Azure Storage Actions jest regionalna i nie oferuje jednostek SKU ani stref dostępności, nadmiarowość strefy jest dostępna z płaszczyzny sterowania i warunkowo z płaszczyzny danych:

  • Płaszczyzna sterowania usługi jest strefowo nadmiarowa. Gdy strefa jest wyłączona w jednym regionie, płaszczyzna sterowania będzie nadal dostępna. W scenariuszu w dół strefy można nadal zarządzać definicją i przypisaniem zadań.

  • Płaszczyzna danych (wykonanie przypisania zadania) dziedziczy właściwości strefowe z nadrzędnego konta magazynu. Jeśli konto magazynu zostanie wdrożone w strefie, które nie powiodło się, konto stanie się niedostępne i z perspektywy klienta, plan danych nie jest dostępny. Jeśli konto magazynu jest strefowo nadmiarowe, konto będzie nadal dostępne, a usługa nadal wykonuje operację na koncie.

Środowisko strefowe w dół

W scenariuszu wykonanym w strefie usługa akcji magazynu będzie nadal dostępna. Postęp zadań zależy od obsługi kont magazynu w strefie dostępności, względem których są uruchomione. Jeśli konto nie ma wpływu na strefę wyłączoną, zadania będą kontynuować postęp. W przeciwnym razie zadania kończą się niepowodzeniem.

Przygotowywanie i odzyskiwanie w strefie awarii

Usługa akcji magazynu nie jest strefowa, ale konto magazynu. Jeśli na konto magazynu ma wpływ awaria strefy, zadania magazynu przypisane do konta kończą się niepowodzeniem. Po udostępnieniu strefy i konta magazynu zaplanowane zadania będą nadal uruchamiane zgodnie z harmonogramem. Jeśli zadanie jest skonfigurowane do uruchomienia raz, może być konieczne zaplanowanie zadania do ponownego uruchomienia.

Odzyskiwanie po awarii między regionami i ciągłość działania

Odzyskiwanie po awarii dotyczy odzyskiwania po wystąpieniu zdarzeń o dużym wpływie, takich jak klęski żywiołowe lub nieudane wdrożenia, które powodują przestoje i utratę danych. Niezależnie od przyczyny najlepszym rozwiązaniem dla awarii jest dobrze zdefiniowany i przetestowany plan odzyskiwania po awarii oraz projekt aplikacji, który aktywnie obsługuje odzyskiwanie po awarii. Zanim zaczniesz myśleć o tworzeniu planu odzyskiwania po awarii, zobacz Zalecenia dotyczące projektowania strategii odzyskiwania po awarii.

Jeśli chodzi o odzyskiwanie po awarii, firma Microsoft korzysta z modelu wspólnej odpowiedzialności. W modelu wspólnej odpowiedzialności firma Microsoft zapewnia dostępność infrastruktury bazowej i usług platformy. Jednocześnie wiele usług platformy Azure nie replikuje automatycznie danych ani nie wraca z regionu, w którym wystąpił błąd, aby przeprowadzić replikację krzyżową do innego regionu z włączoną obsługą. W przypadku tych usług ponosisz odpowiedzialność za skonfigurowanie planu odzyskiwania po awarii, który działa dla obciążenia. Większość usług uruchamianych na platformie Azure jako usługa (PaaS) oferuje funkcje i wskazówki dotyczące obsługi odzyskiwania po awarii. Funkcje specyficzne dla usługi umożliwiają szybkie odzyskiwanie w celu ułatwienia opracowania planu odzyskiwania po awarii.

Akcja magazynu jest usługą regionalną i działa względem kont w tym samym regionie. Gdy region nie działa, zarówno konto magazynu, jak i usługa również nie działają. Usługa nie obsługuje odzyskiwania po awarii w różnych regionach. Jeśli wyzwolisz tryb failover konta magazynu w innym regionie, zadania magazynu nie będą mogły być uruchamiane względem konta magazynu, dopóki nie powróci do oryginalnego regionu. W związku z tym, mimo że możesz odzyskać konto magazynu, zadanie magazynu nie będzie mogło zostać uruchomione.

Ważne

Jeśli przeprowadzisz migrację konta magazynu z regionu podstawowego GRS lub GZRS do regionu pomocniczego lub odwrotnie, wszystkie zadania magazynu przeznaczone dla konta magazynu nie zostaną wyzwolone, a żadne istniejące wykonania zadań mogą zakończyć się niepowodzeniem.

Wykrywanie, powiadamianie i zarządzanie awariami

Zadania magazynu nie wysyłają żadnych powiadomień, gdy wystąpi awaria w samej usłudze. Ważne jest, aby sprawdzić stan zadania magazynu i ponowić próbę wykonania zadań po odzyskaniu usługi/regionu.

Następne kroki