Spolehlivost v Microsoft Fabric

Tento článek popisuje podporu spolehlivosti v Microsoft Fabric a jak regionální odolnost se zónami dostupnosti, tak obnovením mezi oblastmi a provozní kontinuitou. Podrobnější přehled spolehlivosti v Azure najdete v tématu Spolehlivost Azure.

Podpora zón dostupnosti

Zóny dostupnosti Azure jsou aspoň tři fyzicky oddělené skupiny datacenter v rámci každé oblasti Azure. Datová centra v každé zóně jsou vybavena nezávislou infrastrukturou napájení, chlazení a sítě. V případě selhání místní zóny jsou zóny dostupnosti navrženy tak, aby v případě ovlivnění jedné zóny, regionální služby, kapacity a vysoké dostupnosti podporovaly zbývající dvě zóny.

Selhání můžou být v rozsahu od selhání softwaru a hardwaru až po události, jako jsou zemětřesení, záplavy a požáry. Odolnost vůči selháním se dosahuje redundancí a logickou izolací služeb Azure. Podrobnější informace o zónách dostupnosti v Azure najdete v tématu Oblasti a zóny dostupnosti.

Služby s podporou zón dostupnosti Azure jsou navržené tak, aby poskytovaly správnou úroveň spolehlivosti a flexibility. Dají se nakonfigurovat dvěma způsoby. Můžou být buď zónově redundantní, s automatickou replikací napříč zónami, nebo zónově, s instancemi připnutými ke konkrétní zóně. Tyto přístupy můžete také kombinovat. Další informace o zónové a zónově redundantní architektuře najdete v tématu Doporučení pro použití zón dostupnosti a oblastí.

Prostředky infrastruktury se komerčně snaží podporovat zónově redundantní zóny dostupnosti, kdy se prostředky automaticky replikují napříč zónami, aniž byste museli nastavovat nebo konfigurovat.

Požadavky

  • Prostředky infrastruktury v současné době poskytují částečnou podporu zóny dostupnosti v omezeném počtu oblastí. Tato částečná podpora zóny dostupnosti pokrývá prostředí (a/nebo určité funkce v rámci prostředí).
  • Prostředí, jako jsou data Factory (kanály), Datoví technici, Datová Věda a Toky událostí nepodporují zóny dostupnosti.
  • Dostupnost zóny může nebo nemusí být dostupná pro prostředí prostředků infrastruktury nebo funkce, které jsou ve verzi Preview.
  • Místní brány a velké sémantické modely v Power BI nepodporují zóny dostupnosti.

Podporované oblasti

Prostředky infrastruktury z hlediska komerčního využití zajišťují podporu zóny dostupnosti v různých oblastech následujícím způsobem:

Amerika Power BI Datové diagramy Datové sklady Analýzy v reálném čase
Brazílie – jih
Střední Kanada
Střední USA
East US
USA – východ 2
Středojižní USA
Západní USA 2
USA – západ 3
Evropa Power BI Datové diagramy Datové sklady Analýzy v reálném čase
Francie – střed
Německo – středozápad
Severní Evropa
Velká Británie – jih
Západní Evropa
Norsko – východ
Střední východ Power BI Datové diagramy Datové sklady Analýzy v reálném čase
Střední Katar
Africe Power BI Datové diagramy Datové sklady Analýzy v reálném čase
Jižní Afrika – sever
Asie a Tichomoří Power BI Datové diagramy Datové sklady Analýzy v reálném čase
Austrálie – východ
Japonsko – východ
Southeast Asia

Prostředí pro zónu dolů

Během výpadku v rámci zóny se během obnovení zóny nevyžaduje žádná akce. Funkce prostředků infrastruktury v oblastech uvedených v podporovaných oblastech se samy opravují a automaticky vyrovnává, aby využívaly výhod zóny, které jsou v pořádku.

Důležité

Microsoft se snaží poskytovat jednotnou a konzistentní podporu zón dostupnosti, ale v některých případech selhání zóny dostupnosti můžou mít kapacity Infrastruktury umístěné v oblastech Azure s vyššími výkyvy poptávky zákazníků vyšší než normální latence.

Zotavení po havárii napříč oblastmi a provozní kontinuita

Zotavení po havárii (DR) se týká zotavení z událostí s vysokým dopadem, jako jsou přírodní katastrofy nebo neúspěšná nasazení, která vedou k výpadkům a ztrátě dat. Bez ohledu na příčinu je nejlepším řešením havárie dobře definovaný a otestovaný plán zotavení po havárii a návrh aplikace, který aktivně podporuje zotavení po havárii. Než začnete přemýšlet o vytvoření plánu zotavení po havárii, přečtěte si doporučení pro návrh strategie zotavení po havárii.

Pokud jde o zotavení po havárii, Microsoft používá model sdílené odpovědnosti. V modelu sdílené odpovědnosti Microsoft zajišťuje, aby byly dostupné základní služby infrastruktury a platformy. Současně mnoho služeb Azure automaticky nereplikuje data nebo se vrátí z oblasti, která selhala, aby se křížově replikovala do jiné povolené oblasti. Za tyto služby zodpovídáte za nastavení plánu zotavení po havárii, který funguje pro vaši úlohu. Většina služeb, které běží na nabídkách PaaS (Platforma jako služba) Azure, poskytuje funkce a pokyny pro podporu zotavení po havárii a pomocí funkcí specifických pro služby můžete podporovat rychlé obnovení , které vám pomůže s vývojem plánu zotavení po havárii.

Tato část popisuje plán zotavení po havárii pro Prostředky infrastruktury, který je navržený tak, aby vaší organizaci pomohl zajistit bezpečnost a dostupnost dat v případě, že dojde k neplánované regionální havárii. Tento plán se zabývá následujícími tématy:

  • Replikace mezi oblastmi: Prostředky infrastruktury nabízejí replikaci mezi oblastmi pro data uložená v OneLake. Na základě vašich požadavků se můžete odhlásit nebo z této funkce odhlásit.

  • Přístup k datům po havárii: V regionálním scénáři havárie zaručuje Prostředky infrastruktury přístup k datům s určitými omezeními. I když je vytváření nebo úpravy nových položek po převzetí služeb při selhání omezené, primární fokus zůstává na tom, aby stávající data zůstala přístupná a nedotčená.

  • Pokyny pro obnovení: Prostředky infrastruktury poskytují strukturovanou sadu pokynů, které vás provedou procesem obnovení. Strukturované pokyny usnadňují přechod zpět na běžné operace.

Power BI, která je teď součástí prostředků infrastruktury, má zavedený pevný systém zotavení po havárii a nabízí následující funkce:

  • BCDR jako výchozí: Power BI automaticky zahrnuje možnosti zotavení po havárii ve své výchozí nabídce. Tuto funkci nemusíte hlásit ani aktivovat samostatně.

  • Replikace mezi oblastmi: Power BI používá geograficky redundantní replikaci úložiště Azure a geograficky redundantní replikaci Azure SQL, aby se zajistilo, že instance zálohování existují v jiných oblastech a je možné je použít. To znamená, že data se duplikují napříč různými oblastmi, zvyšují jejich dostupnost a snižují rizika spojená s oblastmi výpadků.

  • Trvalé služby a přístup po havárii: I během rušivých událostí zůstanou položky Power BI přístupné v režimu jen pro čtení. Mezi položky patří sémantické modely, sestavy a řídicí panely, které zajišťují, aby firmy mohly pokračovat v analýze a rozhodovacích procesech bez významné překážky.

Další informace najdete v nejčastějších dotazech k vysoké dostupnosti, převzetí služeb při selhání a zotavení po havárii Power BI.

Důležité

Pro zákazníky, jejichž domovské oblasti nemají spárovanou oblast Azure a které jsou ovlivněné havárií, může dojít k ohrožení schopnosti využívat kapacity Fabric – i když se data v těchto kapacitách replikují. Toto omezení je svázané s infrastrukturou domovské oblasti, která je nezbytná pro provoz kapacit.

Funkce domovské oblasti a kapacity

Pro efektivní plánování zotavení po havárii je důležité pochopit vztah mezi vaší domovskou oblastí a umístěními kapacity. Porozumění domovské oblasti a umístěním kapacity vám pomůže provádět strategické výběry oblastí kapacity a odpovídajících procesů replikace a obnovení.

Domovská oblast tenanta vaší organizace a úložiště dat je nastavená na umístění fakturační adresy prvního uživatele, který se zaregistruje. Další podrobnosti o nastavení tenantů najdete v plánování implementace Power BI: Nastavení tenanta. Při vytváření nových kapacit je vaše úložiště dat ve výchozím nastavení nastavené na domovskou oblast. Pokud chcete změnit oblast úložiště dat na jinou oblast, budete muset povolit funkci Multi-Geo, která je funkcí Fabric Premium.

Důležité

Volba jiné oblasti pro vaši kapacitu úplně nepřemístí všechna vaše data do této oblasti. Některé datové prvky zůstávají uložené v domovské oblasti. Pokud chcete zjistit, která data zůstávají v domovské oblasti a která data jsou uložená v oblasti s podporou Multi-Geo, přečtěte si téma Konfigurace podpory Multi-Geo pro Fabric Premium.

V případě domovské oblasti, která nemá spárovanou oblast, můžou kapacity v jakékoli oblasti s podporou Multi-Geo čelit provozním problémům, pokud domovská oblast dojde k havárii, protože základní funkce služby jsou připojené k domovské oblasti.

Pokud vyberete oblast s podporou multi-Geo v rámci EU, je zaručeno, že vaše data jsou uložená v rámci datové hranice EU.

Informace o tom, jak identifikovat domovskou oblast, najdete v tématu Vyhledání domovské oblasti Prostředků infrastruktury.

Nastavení kapacity zotavení po havárii

Prostředky infrastruktury poskytují přepínač zotavení po havárii na stránce nastavení kapacity. Je dostupná tam, kde jsou spárování oblastí Azure v souladu s přítomností služby Fabric. Tady jsou specifika tohoto přepínače:

  • Přístup k rolím: Tento přepínač můžou používat jenom uživatelé s rolí správce kapacity nebo vyšší.

  • Členitost: Členitost přepínače je úroveň kapacity. Je k dispozici pro kapacity Premium i Fabric.

  • Rozsah dat: Přepínač zotavení po havárii konkrétně řeší data OneLake, která zahrnují data Lakehouse a Warehouse. Přepínač nemá vliv na vaše data uložená mimo OneLake.

  • Kontinuita BCDR pro Power BI: Zatímco zotavení po havárii pro data OneLake je možné zapnout a vypnout, BCDR pro Power BI se vždy podporuje bez ohledu na to, jestli je přepínač zapnutý nebo vypnutý.

  • Frekvence: Jakmile změníte nastavení kapacity zotavení po havárii, musíte počkat 30 dní, než ho budete moct znovu změnit. Doba čekání je nastavena tak, aby zachovala stabilitu a zabránila konstantnímu přepínání,

Screenshot of the disaster recovery tenant setting.

Poznámka:

Po zapnutí nastavení kapacity zotavení po havárii může trvat až 72 hodin, než se data začnou replikovat.

Replikace dat

Když zapnete nastavení kapacity zotavení po havárii, povolí se replikace mezi oblastmi jako schopnost zotavení po havárii pro data OneLake. Platforma Fabric je v souladu s oblastmi Azure, aby zřídila páry geografické redundance. Některé oblasti ale nemají párovou oblast Azure nebo párová oblast nepodporuje prostředky infrastruktury. Pro tyto oblasti není replikace dat dostupná. Další informace najdete v tématu Oblasti se zónami dostupnosti a žádnou dvojicí oblastí a dostupností oblastí Infrastruktury.

Poznámka:

Fabric sice nabízí řešení replikace dat ve OneLake, které podporuje zotavení po havárii, ale existují určitá omezení. Data databází a sad dotazů KQL se například ukládají externě do OneLake, což znamená, že je potřeba použít samostatný přístup pro zotavení po havárii. Podrobnosti o přístupu pro zotavení po havárii pro každou položku infrastruktury najdete ve zbývající části tohoto dokumentu.

Fakturace

Funkce zotavení po havárii v Prostředcích infrastruktury umožňuje geografickou replikaci dat kvůli lepšímu zabezpečení a spolehlivosti. Tato funkce využívá více úložišť a transakcí, které se účtují jako operace BCDR Storage a BCDR. Tyto náklady můžete monitorovat a spravovat v aplikaci Microsoft Fabric Capacity Metrics, kde se zobrazují jako samostatné řádkové položky.

Úplný přehled všech souvisejících nákladů na zotavení po havárii, které vám pomůžou s plánováním a rozpočtem, najdete v tématu Využití výpočetních prostředků a úložiště OneLake.

Nastavení zotavení po havárii

I když Fabric poskytuje funkce zotavení po havárii, které podporují odolnost dat, musíte během přerušení služby provést určité ruční kroky. Tato část podrobně popisuje akce, které byste měli provést při přípravě na potenciální přerušení.

Fáze 1: Příprava

  • Aktivujte nastavení kapacity zotavení po havárii: Pravidelně zkontrolujte a nastavte nastavení kapacity zotavení po havárii, abyste měli jistotu, že splňují vaše požadavky na ochranu a výkon.

  • Vytváření záloh dat: Kopírování důležitých dat uložených mimo OneLake do jiné oblasti způsobem, který odpovídá vašemu plánu zotavení po havárii.

Fáze 2: Převzetí služeb při selhání po havárii

Když hlavní havárie vykreslí primární oblast nedostupnou, Microsoft Fabric zahájí regionální převzetí služeb při selhání. Přístup k portálu Fabric není k dispozici, dokud se nedokoní převzetí služeb při selhání a na stránce podpory Microsoft Fabric se zveřejní oznámení.

Doba trvání převzetí služeb při selhání se může lišit, i když obvykle trvá méně než jednu hodinu. Po dokončení převzetí služeb při selhání můžete očekávat následující:

  • Portál prostředků infrastruktury: Můžete získat přístup k portálu a operace čtení, jako je procházení existujících pracovních prostorů a položek, dál fungovat. Všechny operace zápisu, jako je vytvoření nebo úprava pracovního prostoru, se pozastaví.

  • Power BI: Můžete provádět operace čtení, jako je zobrazení řídicích panelů a sestav. Aktualizace, operace publikování sestav, změny řídicího panelu a sestavy a další operace, které vyžadují změny metadat, se nepodporují.

  • Lakehouse/Warehouse: Tyto položky nelze otevřít, ale k souborům je možné přistupovat prostřednictvím rozhraní API nebo nástrojů OneLake.

  • Definice úlohy Sparku: Definice úloh Sparku nejde otevřít, ale soubory kódu je možné otevřít prostřednictvím rozhraní API nebo nástrojů OneLake. Po převzetí služeb při selhání se uloží všechna metadata nebo konfigurace.

  • Poznámkový blok: Poznámkové bloky nejde otevřít a po havárii se obsah kódu neuloží.

  • Model nebo experiment ML: Modely nebo experimenty ML nejde otevřít. Obsah kódu a metadata, jako jsou metriky spuštění a konfigurace, se po havárii neuloží.

  • Tok dat Gen2, Kanál nebo Eventstream: Tyto položky nejde otevřít, ale k ochraně dat můžete použít podporované cíle zotavení po havárii (lakehouse nebo sklady).

  • Databáze nebo sada dotazů KQL: Po převzetí služeb při selhání nebudete mít přístup k databázím A sadám dotazů KQL. K ochraně dat v databázích A sadách dotazů KQL se vyžadují další požadované kroky.

Ve scénáři havárie je portál Fabric a Power BI v režimu jen pro čtení a ostatní položky prostředků infrastruktury nejsou k dispozici, můžete k jejich datům uloženým v OneLake přistupovat pomocí rozhraní API nebo nástrojů třetích stran. Portál i Power BI si zachovají možnost provádět operace čtení i zápisu na tato data. Tato schopnost zajišťuje, že důležitá data zůstanou přístupná a upravitelná a zmírní potenciální přerušení obchodních operací.

Data OneLake zůstávají přístupná prostřednictvím několika kanálů:

Fáze 3: Plán obnovení

Prostředky infrastruktury sice zajišťují, že data zůstanou po havárii přístupná, ale můžete také reagovat na úplné obnovení jejich služeb do stavu před incidentem. Tato část obsahuje podrobný průvodce, který vám pomůže procesem obnovení.

Kroky obnovení

  1. Po havárii vytvořte novou kapacitu Prostředků infrastruktury v libovolné oblasti. Vzhledem k vysoké poptávce po těchto událostech doporučujeme vybrat oblast mimo vaši primární geografickou oblast, aby se zvýšila pravděpodobnost dostupnosti výpočetní služby. Informace o vytvoření kapacity najdete v tématu Zakoupení předplatného Microsoft Fabric.

  2. Vytvořte pracovní prostory v nově vytvořené kapacitě. V případě potřeby použijte stejné názvy jako staré pracovní prostory.

  3. Vytvořte položky se stejnými názvy jako položky, které chcete obnovit. Tento krok je důležitý, pokud k obnovení objektů lakehouse a skladů použijete vlastní skript.

  4. Obnovte položky. Pro každou položku postupujte podle příslušné části v pokynech pro zotavení po havárii specifické pro prostředí a obnovte položku.

Další kroky