Udostępnij przez


Niezawodność w ramach Microsoft Fabric

W tym artykule opisano wsparcie niezawodności w usłudze Microsoft Fabric, zarówno odporność regionalną z wykorzystaniem stref dostępności, jak i odzyskiwanie międzyregionalne oraz ciągłość działania biznesowego. Aby uzyskać bardziej szczegółowe omówienie niezawodności na platformie Azure, zobacz Niezawodność platformy Azure.

Obsługa strefy dostępności

Strefy dostępności są fizycznie oddzielnymi grupami centrów danych w regionie świadczenia usługi Azure. Gdy jedna strefa ulegnie awarii, usługi mogą przejść w tryb failover do jednej z pozostałych stref.

Fabric używa stref dostępności platformy Azure do ochrony elementów Fabric i elementów Power BI oraz danych przed awariami centrum danych. Zasoby infrastruktury są automatycznie dystrybuowane w wielu strefach bez konieczności konfiguracji ze strony klienta.

  • Inżynieria danych obsługuje strefy dostępności, jeśli używasz usługi OneLake. Jeśli używasz innych źródeł danych, takich jak ADLS Gen2, upewnij się, że magazyn strefowo nadmiarowy (ZRS) jest włączony.

Doświadczenie wyciszenia

Podczas awarii całej strefy nie jest wymagana żadna akcja klienta. Funkcje sieci szkieletowej samoczynnie się naprawiają i wyrównują, w celu wykorzystania zdrowej strefy. W niektórych przypadkach może być konieczne ponowne uruchomienie operacji w toku. Na przykład uruchomienie zadań platformy Spark może zakończyć się niepowodzeniem, jeśli węzeł główny znajduje się w strefie niepowodzenia. W takim przypadku należy ponownie przesłać zadania. Zapytanie punktu końcowego analizy SQL i hurtowni danych może zakończyć się niepowodzeniem w przypadku, gdy węzeł frontowy znajduje się w strefie błędów. W takim przypadku zapytanie musi zostać bezpiecznie uruchomione ponownie.

Important

Podczas gdy Microsoft stara się zapewnić jednolite i spójne wsparcie dla stref dostępności, w niektórych przypadkach awarii stref dostępności moce obliczeniowe Fabric zlokalizowane w regionach Azure z większymi wahaniami zapotrzebowania klientów mogą doświadczyć opóźnień większych niż normalnie.

Odzyskiwanie po awarii między regionami i ciągłość działania

Odzyskiwanie po awarii (DR) odnosi się do praktyk używanych przez organizacje do odzyskiwania po wystąpieniu zdarzeń o dużym wpływie, takich jak klęski żywiołowe lub nieudane wdrożenia, które powodują przestoje i utratę danych. Niezależnie od przyczyny najlepszym rozwiązaniem dla awarii jest dobrze zdefiniowany i przetestowany plan odzyskiwania po awarii oraz projekt aplikacji, który aktywnie obsługuje odzyskiwanie po awarii. Przed rozpoczęciem tworzenia planu odzyskiwania po awarii zobacz Zalecenia dotyczące projektowania strategii odzyskiwania po awarii.

W przypadku DR firma Microsoft używa modelu wspólnej odpowiedzialności . W tym modelu firma Microsoft zapewnia dostępność podstawowej infrastruktury i usług platformy. Jednak wiele usług platformy Azure nie replikuje automatycznie danych ani nie wraca z regionu, w którym wystąpił błąd, aby przeprowadzić replikację krzyżową do innego włączonego regionu. W przypadku tych usług odpowiadasz za skonfigurowanie odpowiedniego planu odzyskiwania po awarii, który odpowiada Twojemu obciążeniu. Większość usług oferty platformy Azure jako usługa (PaaS) udostępnia funkcje i wskazówki wspierające DR. Możesz użyć funkcji specyficznych dla usługi, aby wspierać szybkie odzyskiwanie i ułatwić opracowanie planu odzyskiwania po awarii.

W tej sekcji opisano plan odzyskiwania po awarii dla platformy Fabric, którego celem jest pomoc w zachowaniu bezpieczeństwa i dostępności danych w organizacji, gdy wystąpi nieplanowana awaria regionalna. Plan obejmuje następujące tematy:

  • Replikacja między regionami: sieć szkieletowa oferuje replikację między regionami dla danych przechowywanych w usłudze OneLake. Możesz włączyć lub wyłączyć tę funkcję w zależności od swoich wymagań.

  • Dostęp do danych po awarii: w scenariuszu regionalnej awarii technologia Fabric gwarantuje dostęp do danych z pewnymi ograniczeniami. Chociaż tworzenie lub modyfikowanie nowych elementów jest ograniczone po przejściu w tryb failover, głównym celem jest zapewnienie, że istniejące dane pozostają dostępne i nienaruszone.

  • Wskazówki dotyczące odzyskiwania: Fabric zapewnia ustrukturyzowany zestaw instrukcji, który poprowadzi Cię przez proces odzyskiwania. Wskazówki ustrukturyzowane ułatwiają przejście z powrotem do regularnych operacji.

Usługa Power BI, obecnie część sieci szkieletowej, ma stały system odzyskiwania po awarii i oferuje następujące funkcje:

  • Domyślna opcja BCDR: Power BI automatycznie uwzględnia możliwości odzyskiwania po awarii w swojej domyślnej ofercie. Nie musisz wybierać ani aktywować tej funkcji oddzielnie.

  • Replikacja między regionami: usługa Power BI używa replikacji geograficznie nadmiarowej usługi Azure Storage i replikacji geograficznie nadmiarowej usługi Azure SQL w celu zagwarantowania, że wystąpienia kopii zapasowych istnieją w innych regionach i mogą być używane. Oznacza to, że dane są zduplikowane w różnych regionach, zwiększając ich dostępność i zmniejszając ryzyko związane z awariami regionalnymi.

  • Ciągłe usługi i dostęp po awarii: nawet podczas zakłóceń elementy usługi Power BI pozostają dostępne w trybie tylko do odczytu. Elementy obejmują semantyczne modele, raporty i pulpity nawigacyjne, dzięki czemu firmy mogą kontynuować procesy analizy i podejmowania decyzji bez znaczących przeszkód.

Aby uzyskać więcej informacji, zobacz Często zadawane pytania dotyczące wysokiej dostępności, trybu failover i odzyskiwania po awarii w usłudze Power BI

Important

W przypadku klientów dotkniętych awarią i których regiony macierzyste nie mają sparowanego regionu platformy Azure obsługującego sieć szkieletową, możliwość korzystania z pojemności sieci szkieletowej może zostać naruszona, nawet jeśli dane w tych pojemnościach zostaną zreplikowane. To ograniczenie jest powiązane z infrastrukturą regionu macierzystego, co jest kluczowe dla działania zdolności. Aby wyświetlić listę regionów obsługujących Fabric, przejdź do Dostępność regionów Fabric.

Funkcjonalność regionu macierzystego i pojemności

Skuteczne planowanie odzyskiwania po katastrofie ma kluczowe znaczenie dla zrozumienia relacji między regionem macierzystym a lokacjami zasobów. Zrozumienie lokalizacji regionów macierzystych i wydajności ułatwia wybór strategiczny regionów wydajności, a także procesów związanych z replikacją i odzyskiwaniem.

Region domowy dzierżawy i magazynu danych organizacji jest ustawiony na lokalizację adresu rozliczeniowego pierwszego użytkownika, który się zarejestruje. Aby uzyskać więcej informacji na temat konfigurowania dzierżawy, zobacz Planowanie implementacji usługi Power BI: Konfiguracja dzierżawy. Podczas tworzenia nowych pojemności magazyn danych jest domyślnie ustawiony na region macierzysny. Jeśli chcesz zmienić region przechowywania danych na inny region, musisz włączyć funkcję Multi-Geo, cechę Premium Fabric.

Important

Wybranie innego regionu dla pojemności nie powoduje całkowitego przeniesienia wszystkich danych do tego regionu. Niektóre elementy danych nadal pozostają przechowywane w regionie macierzystym. Aby sprawdzić, które dane pozostają w regionie macierzysym i które dane są przechowywane w regionie z włączoną obsługą funkcji Multi-Geo, zobacz Konfigurowanie obsługi funkcji Multi-Geo dla sieci szkieletowej Premium.

W przypadku, gdy region macierzysty nie ma sparowanego regionu, pojemności operacyjne w dowolnym regionie z włączoną obsługą wielu regionów geograficznych mogą napotkać problemy, jeżeli region macierzysty napotka awarię, ponieważ podstawowa funkcjonalność usługi jest powiązana z regionem macierzystym.

W przypadku wybrania regionu z obsługą wielu regionów geograficznych w UE gwarantuje się, że dane są przechowywane w granicach danych UE.

Aby dowiedzieć się, jak zidentyfikować region macierzysty, zobacz Znajdowanie regionu macierzystego usługi Fabric.

Ustawienie pojemności odzyskiwania po awarii

Platforma Fabric udostępnia przełącznik odzyskiwania po awarii na stronie ustawień pojemności. Jest ona dostępna, gdy pary regionalne platformy Azure są zgodne z obecnością usługi Fabric. Oto specyfika tego przełącznika:

  • Dostęp do roli: tylko użytkownicy z rolą administratora pojemności lub nowszą mogą używać tego przełącznika.

  • Stopień szczegółowości: Stopień szczegółowości przełącznika to poziom pojemności. Jest ona dostępna zarówno w pojemności Premium, jak i Fabric.

  • Zakres danych: przełącznik odzyskiwania po awarii dotyczy konkretnie danych usługi OneLake, w tym danych usługi Lakehouse i Warehouse. Przełącznik nie ma wpływu na dane przechowywane poza usługą OneLake.

  • Ciągłość BCDR dla usługi Power BI: chociaż odzyskiwanie danych OneLake po awarii można włączać i wyłączać, usługa BCDR dla Power BI jest zawsze obsługiwana, niezależnie od stanu przełącznika.

  • Częstotliwość: po zmianie ustawienia pojemności odzyskiwania po awarii należy poczekać 30 dni, zanim będzie można go zmienić ponownie. Okres oczekiwania został wprowadzony, aby utrzymać stabilność i zapobiec ciągłemu przełączaniu.

Zrzut ekranu przedstawiający konfigurację tenanta odzyskiwania po awarii.

Note

Po włączeniu ustawienia pojemności odzyskiwania po awarii lub utworzeniu nowych obszarów roboczych w ramach pojemności replikacja danych może zająć trochę czasu. Możesz sprawdzić, czy replikacja została rozpoczęta, sprawdzając, czy przechowywanie dla danego obszaru roboczego jest rozliczane jako "OneLake BCDR Storage" w aplikacji Metryki Pojemności usługi Microsoft Fabric.

Replikacja danych

Po włączeniu ustawienia pojemności odzyskiwania po awarii replikacja między regionami jest włączona jako funkcja odzyskiwania po awarii dla danych usługi OneLake. Platforma Fabric jest zgodna z regionami platformy Azure w celu tworzenia par nadmiarowości geograficznej. Jednak niektóre regiony nie mają sparowanego regionu Azure lub sparowany region nie obsługuje systemu Azure Fabric. W przypadku tych regionów replikacja danych nie jest dostępna. Aby uzyskać więcej informacji, zobacz Regiony ze strefami dostępności bez pary regionów oraz dostępność w regionie Fabric.

Note

Chociaż usługa Fabric oferuje rozwiązanie replikacji danych w usłudze OneLake do obsługi odzyskiwania po awarii, istnieją istotne ograniczenia. Na przykład dane baz danych KQL i zestawów zapytań są przechowywane zewnętrznie w usłudze OneLake, co oznacza, że potrzebne jest oddzielne podejście do odzyskiwania po awarii. Zapoznaj się z resztą tego dokumentu, aby uzyskać szczegółowe informacje na temat podejścia do odzyskiwania po awarii dla każdego elementu sieci Fabric.

Billing

Funkcja przywracania po awarii w Fabric umożliwia georeplikację danych, co zwiększa bezpieczeństwo i niezawodność. Ta funkcja zużywa więcej miejsca na przechowywanie i transakcji, które są rozliczane odpowiednio jako Przechowywanie BCDR i Operacje BCDR. Możesz monitorować i zarządzać tymi kosztami w aplikacji Microsoft Fabric Capacity Metrics, gdzie są one wyświetlane jako oddzielne elementy wiersza.

Aby uzyskać szczegółowy wykaz wszystkich powiązanych kosztów odzyskiwania po awarii, aby ułatwić odpowiednie planowanie i budżetowanie, zobacz OneLake compute and storage consumption.

Konfigurowanie odzyskiwania po awarii

Chociaż sieć szkieletowa udostępnia funkcje odzyskiwania po awarii w celu zapewnienia odporności danych, należy wykonać pewne czynności ręczne, aby przywrócić usługę podczas zakłóceń. Ta sekcja zawiera szczegółowe informacje o akcjach, które należy podjąć, aby przygotować się do potencjalnych zakłóceń.

Faza 1. Przygotowanie

  • Aktywuj ustawienia pojemności odzyskiwania po awarii: regularnie sprawdzaj i ustawiaj ustawienia pojemności odzyskiwania po awarii, aby upewnić się, że spełniają one wymagania dotyczące ochrony i wydajności.

  • Tworzenie kopii zapasowych danych: skopiuj dane krytyczne przechowywane poza usługą OneLake do innego regionu w sposób dostosowany do planu odzyskiwania po awarii.

Faza 2: Przełączenie awaryjne

Gdy katastrofa o dużym nasileniu uniemożliwi przywrócenie regionu podstawowego, Microsoft Fabric inicjuje regionalne przełączenie. Dostęp do portalu Microsoft Fabric jest zablokowany do zakończenia procedury failover i opublikowania powiadomienia na stronie pomocy technicznej usługi Microsoft Fabric.

Czas potrzebny na ukończenie failoveru może się różnić, chociaż zazwyczaj wynosi mniej niż godzinę. Po zakończeniu przełączenia awaryjnego możesz się spodziewać:

  • Portal sieci szkieletowej: możesz uzyskać dostęp do portalu i operacji odczytu, takich jak przeglądanie istniejących obszarów roboczych, przepływy zadań w obszarach roboczych i elementach, kontynuuj pracę. Wszystkie operacje zapisu, takie jak tworzenie lub modyfikowanie obszaru roboczego, są wstrzymane.

  • Power BI: możesz wykonywać operacje odczytu, takie jak wyświetlanie pulpitów nawigacyjnych i raportów. Operacje odświeżania, operacje publikowania raportów, modyfikacje pulpitu nawigacyjnego i raportu oraz inne operacje, które wymagają zmian metadanych, nie są obsługiwane.

  • Lakehouse/Warehouse: nie można otworzyć tych elementów, ale dostęp do plików można uzyskać za pośrednictwem interfejsów API usługi OneLake lub narzędzi.

  • Definicja zadania platformy Spark: nie można otwierać definicji zadań platformy Spark, ale można uzyskać dostęp do plików kodu za pośrednictwem interfejsów API lub narzędzi usługi OneLake. Wszystkie metadane lub konfiguracja zostaną zapisane po przejściu w tryb failover.

  • Notes: nie można otworzyć notesów, a zawartość kodu nie zostanie zapisana po awarii.

  • Model uczenia maszynowego/eksperyment: nie można otwierać modeli uczenia maszynowego ani eksperymentów. Zawartość kodu i metadane, takie jak metryki uruchamiania i konfiguracje, nie zostaną zapisane po awarii.

  • Dataflow Gen2/Pipeline/Eventstream: nie można otworzyć tych elementów, ale możesz użyć obsługiwanych miejsc docelowych odzyskiwania po awarii (lakehouses lub warehouses), aby chronić dane.

  • KQL Database/Queryset: nie będzie można uzyskać dostępu do baz danych KQL i zestawów zapytań po przejściu w tryb failover. Aby chronić dane w bazach danych KQL i zestawach zapytań, wymagane są dalsze kroki wymagań wstępnych.

W scenariuszu awarii portal sieci szkieletowej i usługa Power BI są w trybie tylko do odczytu, a inne elementy sieci szkieletowej są niedostępne, można uzyskać dostęp do ich danych przechowywanych w usłudze OneLake przy użyciu interfejsów API lub narzędzi innych firm. Zarówno portal, jak i usługa Power BI zachowują możliwość wykonywania operacji odczytu i zapisu na tych danych. Ta możliwość zapewnia dostępność i modyfikowanie krytycznych danych oraz zmniejsza potencjalne zakłócenia operacji biznesowych.

Dane usługi OneLake pozostają dostępne za pośrednictwem wielu kanałów:

Faza 3. Plan odzyskiwania

Platforma Fabric zapewnia, że dane pozostają dostępne po awarii, ale można również podjąć działania w celu pełnego przywrócenia usług do stanu sprzed zdarzenia. Ta sekcja zawiera szczegółowy przewodnik, który ułatwia proces odzyskiwania.

Kroki odzyskiwania

  1. Utwórz nową pojemność Fabric w dowolnym regionie po awarii. Biorąc pod uwagę wysokie zapotrzebowanie podczas takich zdarzeń, zalecamy wybranie regionu spoza podstawowego obszaru geograficznego w celu zwiększenia prawdopodobieństwa dostępności usługi obliczeniowej. Aby uzyskać informacje na temat tworzenia pojemności, zobacz Kupowanie subskrypcji usługi Microsoft Fabric.

  2. Utwórz obszary robocze w nowo utworzonych zasobach. W razie potrzeby użyj tych samych nazw co stare obszary robocze.

  3. Utwórz elementy o takich samych nazwach jak te, które chcesz odzyskać. Ten krok jest ważny, jeśli używasz customowego skryptu do odzyskiwania jezior i magazynów.

  4. Przywróć elementy. Dla każdego elementu postępuj zgodnie z odpowiednią sekcją w wskazówkach na temat odzyskiwania po awarii specyficznych dla środowiska, aby przywrócić element.

Dalsze kroki