Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Tento článek obsahuje podrobné informace o regionální odolnosti služby Event Grid a oboru názvů Event Grid s zónami dostupnosti a zotavením po havárii mezi oblastmi a provozní kontinuitou.
Přehled spolehlivosti architektury v Azure najdete v tématu Spolehlivost Azure.
Podpora zón dostupnosti
Zóny dostupnosti jsou fyzicky oddělené skupiny datacenter v rámci oblasti Azure. Když jedna zóna selže, mohou služby přejít na jednu ze zbývajících zón.
Definice prostředků event Gridu pro témata, systémová témata, domény a odběry událostí a data událostí se automaticky replikují do tří zón dostupnosti. Pokud dojde k selhání v jedné z dostupnostních zón, prostředky Event Grid automaticky přesměrují do jiné zóny dostupnosti bez lidského zásahu. V současné době není možné tuto funkci řídit (povolit nebo zakázat). Když existující oblast začne podporovat zóny dostupnosti, stávající prostředky Event Grid se automaticky přepnou na využívání této funkce. Nevyžaduje se žádná akce zákazníka.
Obor názvů služby Azure Event Grid také dosahuje vysoké dostupnosti uvnitř oblastí pomocí zón dostupnosti.
Požadavky
Kvůli podpoře zón dostupnosti musí být prostředky služby Event Grid v oblasti, která podporuje zóny dostupnosti. Pokud chcete zkontrolovat, které oblasti podporují zóny dostupnosti, podívejte se na seznam podporovaných oblastí.
Cenotvorba
Vzhledem k tomu, že Event Grid podporuje zóny dostupnosti automaticky v oblastech, které podporují zóny dostupnosti, nejsou žádné změny ceny.
Vytvořte prostředek s aktivovanými zónami dostupnosti
Protože Event Grid podporuje zóny dostupnosti automaticky v oblastech, které podporují zóny dostupnosti, není nutná konfigurace nastavení.
Migrace na systém s podporou zón dostupnosti
Pokud přesunete prostředky Event Gridu do oblasti, která podporuje zóny dostupnosti, automaticky obdržíte podporu zóny dostupnosti. Informace o přemístění prostředků do jiné oblasti, která podporuje zóny dostupnosti, najdete v následujících tématech:
- Přemístění systémových témat služby Azure Event Grid do jiné oblasti
- Přemístění vlastních témat Azure Event Gridu do jiné oblasti
- Přemístění domén Azure Event Gridu do jiné oblasti
Zotavení po havárii napříč oblastmi a provozní kontinuita
Zotavení po havárii (DR) označuje postupy, které organizace používají k zotavení z událostí s vysokým dopadem, jako jsou přírodní katastrofy nebo neúspěšná nasazení, která vedou k výpadkům a ztrátě dat. Bez ohledu na příčinu je nejlepším řešením havárie dobře definovaný a otestovaný plán zotavení po havárii a návrh aplikace, který aktivně podporuje zotavení po havárii. Než začnete vytvářet plán zotavení po havárii, přečtěte si téma Doporučení pro návrh strategie zotavení po havárii.
Pro DR používá Microsoft model sdílené odpovědnosti. V tomto modelu Microsoft zajišťuje, aby byly dostupné základní služby infrastruktury a platformy. Nicméně mnoho služeb Azure neprovádí automatickou replikaci dat ani nepřepíná z oblasti, která selhala, aby se provedla křížová replikace do jiné povolené oblasti. Za tyto služby zodpovídáte za nastavení plánu zotavení po havárii, který funguje pro vaši úlohu. Většina služeb, které běží v rámci nabídky platformy jako služby (PaaS) na Azure, poskytuje funkce a pokyny pro podporu disaster recovery (DR). Pomocí funkcí specifických pro službu můžete podporovat rychlé obnovení, což pomůže s vývojem vašeho DR plánu.
Zotavení po havárii obvykle zahrnuje vytvoření záložního prostředku, aby se zabránilo přerušení v případě, že oblast není v pořádku. Během tohoto procesu bude ve vaší úloze potřeba primární a sekundární oblast prostředků Azure Event Gridu.
Existují různé způsoby, jak se zotavit z závažné ztráty funkčnosti aplikace. V této části popisujeme kontrolní seznam, kterého se budete muset držet, abyste připravili klienta na zotavení z příčiny selhání způsobeného nefunkčním zdrojem nebo oblastí.
Event Grid podporuje ruční i automatické geografické zotavení po havárii (GeoDR) na straně serveru. Logiku zotavení po havárii na straně klienta můžete stále implementovat, pokud chcete mít větší kontrolu nad procesem převzetí služeb při selhání. Podrobnosti o automatizovaném geografickém zotavení po katastrofě najdete v Server-side geo disaster recovery ve službě Azure Event Grid. Podrobnosti o implementaci zotavení po havárii na straně klienta najdete v tématu Implementace převzetí služeb při selhání na straně klienta ve službě Azure Event Grid.
Následující tabulka znázorňuje podporu převzetí služeb při selhání na straně klienta a podporu geografického zotavení po havárii ve službě Event Grid.
| Prostředek Event Gridu | Podpora převzetí služeb při selhání na straně klienta | Podpora geografického zotavení po havárii (GeoDR) |
|---|---|---|
| Vlastní témata | Podporováno | Cross-Geo / Regional |
| Systémová témata | Není podporováno | Povoleno automaticky |
| Domény | Podporováno | Cross-Geo / Regional |
| Obory názvů partnerů | Podporováno | Není podporováno |
| Jmenné prostory | Podporováno | Není podporováno |
Obor názvů Event Gridu
Obor názvů Služby Event Grid nepodporuje zotavení po havárii napříč oblastmi. Vysokou dostupnost můžete zajistit napříč regiony prostřednictvím implementace převzetí služeb při selhání na straně klienta vytvořením primárních a sekundárních oborů názvů.
S implementací převzetí při selhání na straně klienta můžete:
Implementujte vlastní (ruční nebo automatizovaný) proces pro replikaci oboru názvů, klientských identit a dalších konfigurací** včetně certifikátů certifikační autority, skupin klientů, prostorů témat, vazeb oprávnění, směrování mezi primárními a sekundárními oblastmi.
Implementujte službu concierge , která klientům poskytuje primární a sekundární koncové body provedením kontroly stavu koncových bodů. Služba Concierge může být webová aplikace, která se replikuje a udržuje dosažitelnou pomocí technik přesměrování DNS, například pomocí Azure Traffic Manageru.
Dosáhněte řešení zotavení po havárii Active-Active replikací metadat a vyrovnáváním zatížení mezi obory názvů. Řešení zotavení po havárii Active-Passive lze dosáhnout replikací metadat tak, aby sekundární obor názvů zůstal připravený. Poté, pokud je primární obor názvů nedostupný, je možné provoz směrovat do sekundárního oboru názvů.
Nastavení zotavení po havárii
Pro spárované oblasti nabízí Event Grid schopnost přesměrování provozu publikování na spárovanou oblast pro domény, vlastní témata a systémová témata. V zákulisí Event Grid automaticky synchronizuje definice prostředků témat, systémových témat, domén a odběrů událostí do přidružené oblasti. Data událostí se ale nereplikují do spárované oblasti. V normálním stavu se události ukládají v oblasti, kterou jste vybrali pro daný prostředek. Když dojde k výpadku regionu a Microsoft zahájí přepnutí na záložní systém, začnou do geograficky spárovaného regionu proudit nové události a odesílají se odsud bez vašeho zásahu. Události publikované a přijaté v původní oblasti se odesílají odsud po zmírnění výpadku.
Můžete si vybrat mezi dvěma možnostmi převzetí při selhání: převzetí iniciované Microsoftem a převzetí iniciované zákazníkem. Podrobný postup konfigurace obou těchto nastavení najdete v tématu Konfigurace rezidence dat.
Převzetí služeb při selhání iniciované Microsoftem provádí Microsoft ve výjimečných situacích za účelem převzetí služeb při selhání prostředků Event Gridu z ovlivněné oblasti do odpovídající geograficky spárované oblasti. Společnost Microsoft si vyhrazuje právo určit, kdy bude tato možnost uplatněna. Tento mechanismus nevyžaduje souhlas uživatele před přesměrováním uživatelského provozu.
Tuto funkci povolte aktualizací konfigurace pro vaše téma nebo doménu. Výběrem možnosti Cross-Geo (výchozí) povolte převzetí služeb při selhání iniciované Microsoftem.
Převzetí služeb při selhání iniciované zákazníkem je definováno vaším vlastním plánem zotavení po havárii pro témata a domény Azure Event Gridu. Microsoft nereplikuje žádná data jakéhokoli druhu do jiné oblasti. I když tato možnost převzetí služeb při selhání vyžaduje trochu větší úsilí, umožňuje rychlejší převzetí služeb při selhání a máte kontrolu nad výběrem sekundárních oblastí. Pokud chcete implementovat zotavení po havárii na straně klienta pro témata azure Event Gridu, přečtěte si téma Vytvoření vlastního zotavení po havárii na straně klienta pro témata azure Event Gridu.
Existuje několik důvodů, proč můžete chtít zakázat funkci převzetí služeb při selhání iniciovanou Microsoftem:
- Převzetí služeb při selhání iniciované Microsoftem se provádí podle nejlepších možností.
- Některé geografické páry nesplňují požadavky vaší organizace na rezidenci dat.
Tuto funkci povolte aktualizací konfigurace pro vaše téma nebo doménu. Vyberte Oblast.
Pokud používáte nepárovanou oblast, pak se metadata replikují pouze v rámci této oblasti, bez ohledu na zvolenou konfiguraci rezidence dat.
Zkušenost s převzetím služeb při zotavení po havárii
Zotavení po havárii se měří pomocí dvou metrik, cíle bodu obnovení (RPO) a cíle doby obnovení (RTO). Další informace najdete v tématu Co jsou provozní kontinuita, vysoká dostupnost a zotavení po havárii?.
Automatické převzetí služeb při selhání služby Event Grid má pro vaše metadata (témata, domény, odběry událostí) a data (události) různé RPO a RTO. Pokud potřebujete jinou specifikaci než následující, můžete stále implementovat vlastní záložní řešení na straně klienta pomocí rozhraní API pro informaci o stavu tématu.
Cíl bodu obnovení (RPO)
RPO metadat: nula minut. V případě příslušných prostředků se při vytvoření, aktualizaci nebo odstranění prostředku synchronně replikuje definice prostředku do geografického páru. Když dojde k převzetí při selhání, neztratí se žádná metadata.
Cíl bodu obnovení dat: Když dojde k převzetí služeb při selhání, zpracují se nová data z spárované oblasti. Jakmile dojde ke zmírnění výpadku pro ovlivněnou oblast, odesílají se nezpracované události odtud. Pokud obnovení oblasti vyžadovalo delší dobu, než je hodnota time-to-live nastavená u událostí, může dojít k vyřazení dat. Pokud chcete tuto ztrátu dat zmírnit, doporučujeme nastavit místo určení pro nevyřízené zprávy pro odběr událostí. Pokud se ovlivněná oblast ztratí a nepůjde znovu získat, dojde ke ztrátě dat. V nejlepším případě odběratel stíhá tempo publikování a je ztraceno jen několik sekund dat. Nejhorším scénářem je situace, kdy odběratel není aktivně zapojen do zpracování událostí, a při maximální době životnosti 24 hodin může být ztráta dat až 24 hodin.
Cíl doby obnovení (RTO)
Metadata RTO: Rozhodování o převzetí služeb při selhání vychází z faktorů, jako je dostupná kapacita ve spárované oblasti, a může trvat v rozsahu 60 minut nebo více. Jakmile se zahájí převzetí služeb při selhání, do 5 minut služba Event Grid začne přijímat volání pro vytváření, aktualizace nebo mazání témat a odběrů.
Data RTO: Stejné jako u výše uvedených informací.
Důležité
- V případě zotavení po havárii na straně serveru nemůže Event Grid zahájit převzetí služeb při selhání, pokud spárovaná oblast nemá žádnou dodatečnou kapacitu pro převzetí služeb při selhání. Obnovení se provádí na základě maximálního úsilí.
- Za použití této funkce se neúčtují žádné poplatky.
- Geografické zotavení po havárii není podporováno u partnerských oborů názvů a témat partnerů.