Odzyskiwanie po awarii dla platformy Azure Data Platform — omówienie

Azure Synapse Analytics
Azure Machine Learning
Azure Cosmos DB
Azure Data Lake
Azure Event Hubs

Omówienie

Ta seria zawiera ilustrujący przykład sposobu, w jaki organizacja może zaprojektować strategię odzyskiwania po awarii dla platformy danych przedsiębiorstwa platformy Azure.

Platforma Azure oferuje szeroką gamę opcji odporności, które mogą zapewnić ciągłość usług w przypadku awarii. Jednak wyższe poziomy usług mogą powodować złożoność i koszt premium. Kompromis kosztów w porównaniu z odpornością i złożonością jest kluczowym czynnikiem decyzyjnym dla większości klientów dotyczących odzyskiwania po awarii.

Podczas gdy sporadyczne awarie punktów występują w usłudze platformy Azure, należy zauważyć, że centra danych firmy Microsoft i usługi platformy Azure mają wiele warstw wbudowanej nadmiarowości. Każda awaria jest zwykle ograniczona w zakresie i zwykle jest odzyskiwane w ciągu kilku godzin. Historycznie jest znacznie bardziej prawdopodobne, że usługa kluczy, taka jak zarządzanie tożsamościami, napotyka problem z usługą, a nie cały region świadczenia usługi Azure przechodzi w tryb offline.

Należy również uznać, że cyberataki, szczególnie oprogramowanie wymuszające okup, stanowią teraz namacalne zagrożenie dla każdego nowoczesnego ekosystemu danych i mogą spowodować awarię platformy danych. Chociaż jest to poza zakresem tej serii, klienci powinni zaimplementować mechanizmy kontroli przed takimi atakami w ramach projektu zabezpieczeń i odporności dowolnej platformy danych.

Zakres

Zakres tej serii artykułów obejmuje:

  • Odzyskiwanie usługi platformy danych platformy Azure z awarii fizycznej dla ilustrujące osoby klienta. Ten ilustrujący klient to:
    • średniej organizacji ze zdefiniowaną funkcją wsparcia operacyjnego zgodnie z metodologią zarządzania usługami opartą na ITIL
    • nie natywne dla chmury, z podstawowym przedsiębiorstwem, usługi udostępnione, takie jak zarządzanie dostępem i uwierzytelnianiem i zarządzanie zdarzeniami, pozostają w środowisku lokalnym
    • migracji do chmury na platformę Azure, która jest włączona przez automatyzację
  • Platforma danych platformy Azure zaimplementowała następujące projekty w ramach dzierżawy platformy Azure klienta
  • Ten proces zostanie wykonany przez zasób techniczny platformy Azure, a nie wyspecjalizowany ekspert platformy Azure. W związku z tym zasoby powinny mieć następujący poziom wiedzy/umiejętności
    • Podstawy platformy Azure — wiedza na temat platformy Azure, jej podstawowych usług i składników danych
    • Działająca wiedza na temat usługi Azure DevOps. Możliwość nawigowania po kontroli źródła i wykonywaniu wdrożeń potoków
  • W tym procesie opisano proces trybu failover z regionu podstawowego do pomocniczego

Poza zakresem

Następujące elementy są uznawane za poza zakresem tej serii artykułów:

  • Proces rezerwowy z regionu pomocniczego z powrotem do regionu podstawowego
  • Wszystkie aplikacje, składniki lub systemy nienależące do platformy Azure — dotyczy to również usług lokalnych, innych dostawców usług w chmurze, usług internetowych innych firm itp.
  • Odzyskiwanie wszelkich usług nadrzędnych, takich jak sieci lokalne, bramy, usługi udostępnione przedsiębiorstwa itp., które są wymaganiami wstępnymi dla tego procesu
  • Odzyskiwanie wszelkich usług podrzędnych, takich jak lokalne systemy operacyjne, systemy raportowania innych firm, modelowanie danych lub aplikacje do nauki o danych itp., które są zależne od tego procesu w celu odzyskania własnych usług
  • Scenariusze utraty danych, w tym odzyskiwanie z oprogramowania wymuszającego okup lub podobne zdarzenia związane z bezpieczeństwem danych
  • Strategie tworzenia kopii zapasowych danych i plany przywracania danych
  • Ustanawianie głównej przyczyny zdarzenia odzyskiwania po awarii

Kluczowe założenia

Kluczowe założenia dotyczące tego przykładu dotyczącego odzyskiwania po awarii są następujące:

  • Organizacja jest zgodna z metodologią zarządzania usługami opartą na itIL na potrzeby obsługi operacyjnej platformy danych Platformy Azure
  • Organizacja ma istniejący proces odzyskiwania po awarii w ramach struktury przywracania usług dla zasobów IT
  • "Infrastruktura jako kod" (IaC) została użyta do wdrożenia platformy danych platformy Azure włączonej przez usługę automatyzacji, taką jak Azure DevOps lub podobna
  • Każde rozwiązanie hostowane przez platformę danych platformy Azure ukończyło ocenę wpływu na działalność biznesową lub podobną, zapewniając jasne wymagania dotyczące usług dla celu punktu odzyskiwania, celu czasu odzyskiwania i celu MTO

Następne kroki

Teraz, po zapoznaniu się ze scenariuszem na wysokim poziomie, możesz dowiedzieć się więcej o architekturze zaprojektowanej dla przypadku użycia.