Omówienie
Ta seria zawiera ilustrujący przykład sposobu, w jaki organizacja może zaprojektować strategię odzyskiwania po awarii dla platformy danych przedsiębiorstwa platformy Azure.
- Ta seria artykułów stanowi uzupełnienie wskazówek dostarczonych przez Cloud Adoption Framework firmy Microsoft, dobrze zaprojektowaną strukturęplatformy Azure i zarządzanie ciągłością działalności biznesowej
Platforma Azure oferuje szeroką gamę opcji odporności, które mogą zapewnić ciągłość usług w przypadku awarii. Jednak wyższe poziomy usług mogą powodować złożoność i koszt premium. Kompromis kosztów w porównaniu z odpornością i złożonością jest kluczowym czynnikiem decyzyjnym dla większości klientów dotyczących odzyskiwania po awarii.
Podczas gdy sporadyczne awarie punktów występują w usłudze platformy Azure, należy zauważyć, że centra danych firmy Microsoft i usługi platformy Azure mają wiele warstw wbudowanej nadmiarowości. Każda awaria jest zwykle ograniczona w zakresie i zwykle jest odzyskiwane w ciągu kilku godzin. Historycznie jest znacznie bardziej prawdopodobne, że usługa kluczy, taka jak zarządzanie tożsamościami, napotyka problem z usługą, a nie cały region świadczenia usługi Azure przechodzi w tryb offline.
Należy również uznać, że cyberataki, szczególnie oprogramowanie wymuszające okup, stanowią teraz namacalne zagrożenie dla każdego nowoczesnego ekosystemu danych i mogą spowodować awarię platformy danych. Chociaż jest to poza zakresem tej serii, klienci powinni zaimplementować mechanizmy kontroli przed takimi atakami w ramach projektu zabezpieczeń i odporności dowolnej platformy danych.
- Wskazówki firmy Microsoft dotyczące ochrony przed oprogramowaniem wymuszającym okup są dostępne w temacie Podstawy chmury platformy Azure
Zakres
Zakres tej serii artykułów obejmuje:
- Odzyskiwanie usługi platformy danych platformy Azure z awarii fizycznej dla ilustrujące osoby klienta. Ten ilustrujący klient to:
- średniej organizacji ze zdefiniowaną funkcją wsparcia operacyjnego zgodnie z metodologią zarządzania usługami opartą na ITIL
- nie natywne dla chmury, z podstawowym przedsiębiorstwem, usługi udostępnione, takie jak zarządzanie dostępem i uwierzytelnianiem i zarządzanie zdarzeniami, pozostają w środowisku lokalnym
- migracji do chmury na platformę Azure, która jest włączona przez automatyzację
- Platforma danych platformy Azure zaimplementowała następujące projekty w ramach dzierżawy platformy Azure klienta
- Strefa docelowa przedsiębiorstwa — zapewnianie podstaw platformy, w tym sieci, monitorowania, zabezpieczeń itp.
- Azure Analytics Platform — dostarczanie składników danych, które obsługują różne rozwiązania i produkty danych udostępniane przez usługę
- Ten proces zostanie wykonany przez zasób techniczny platformy Azure, a nie wyspecjalizowany ekspert platformy Azure. W związku z tym zasoby powinny mieć następujący poziom wiedzy/umiejętności
- Podstawy platformy Azure — wiedza na temat platformy Azure, jej podstawowych usług i składników danych
- Działająca wiedza na temat usługi Azure DevOps. Możliwość nawigowania po kontroli źródła i wykonywaniu wdrożeń potoków
- W tym procesie opisano proces trybu failover z regionu podstawowego do pomocniczego
Poza zakresem
Następujące elementy są uznawane za poza zakresem tej serii artykułów:
- Proces rezerwowy z regionu pomocniczego z powrotem do regionu podstawowego
- Wszystkie aplikacje, składniki lub systemy nienależące do platformy Azure — dotyczy to również usług lokalnych, innych dostawców usług w chmurze, usług internetowych innych firm itp.
- Odzyskiwanie wszelkich usług nadrzędnych, takich jak sieci lokalne, bramy, usługi udostępnione przedsiębiorstwa itp., które są wymaganiami wstępnymi dla tego procesu
- Odzyskiwanie wszelkich usług podrzędnych, takich jak lokalne systemy operacyjne, systemy raportowania innych firm, modelowanie danych lub aplikacje do nauki o danych itp., które są zależne od tego procesu w celu odzyskania własnych usług
- Scenariusze utraty danych, w tym odzyskiwanie z oprogramowania wymuszającego okup lub podobne zdarzenia związane z bezpieczeństwem danych
- Strategie tworzenia kopii zapasowych danych i plany przywracania danych
- Ustanawianie głównej przyczyny zdarzenia odzyskiwania po awarii
- W przypadku zdarzeń dotyczących usług/składników platformy Azure firma Microsoft publikuje "główną analizę przyczyn" na stronie internetowej Stan — historia
Kluczowe założenia
Kluczowe założenia dotyczące tego przykładu dotyczącego odzyskiwania po awarii są następujące:
- Organizacja jest zgodna z metodologią zarządzania usługami opartą na itIL na potrzeby obsługi operacyjnej platformy danych Platformy Azure
- Organizacja ma istniejący proces odzyskiwania po awarii w ramach struktury przywracania usług dla zasobów IT
- "Infrastruktura jako kod" (IaC) została użyta do wdrożenia platformy danych platformy Azure włączonej przez usługę automatyzacji, taką jak Azure DevOps lub podobna
- Każde rozwiązanie hostowane przez platformę danych platformy Azure ukończyło ocenę wpływu na działalność biznesową lub podobną, zapewniając jasne wymagania dotyczące usług dla celu punktu odzyskiwania, celu czasu odzyskiwania i celu MTO
Następne kroki
Teraz, po zapoznaniu się ze scenariuszem na wysokim poziomie, możesz dowiedzieć się więcej o architekturze zaprojektowanej dla przypadku użycia.