Sdílet prostřednictvím


Spolehlivost ve službě Azure Cosmos DB pro virtuální jádro MongoDB

PLATÍ PRO: Virtuální jádro MongoDB

Tento článek obsahuje podrobné informace o regionální odolnosti se zónami dostupnosti a zotavením po havárii mezi oblastmi a provozní kontinuitou pro virtuální jádra Azure Cosmos DB pro MongoDB.

Přehled spolehlivosti architektury v Azure najdete v tématu Spolehlivost Azure.

Podpora zón dostupnosti

Zóny dostupnosti Azure jsou aspoň tři fyzicky oddělené skupiny datacenter v rámci každé oblasti Azure. Datová centra v každé zóně jsou vybavena nezávislou infrastrukturou napájení, chlazení a sítě. V případě selhání místní zóny jsou zóny dostupnosti navrženy tak, aby v případě ovlivnění jedné zóny, regionální služby, kapacity a vysoké dostupnosti podporovaly zbývající dvě zóny.

Selhání můžou být v rozsahu od selhání softwaru a hardwaru až po události, jako jsou zemětřesení, záplavy a požáry. Odolnost vůči selháním se dosahuje redundancí a logickou izolací služeb Azure. Podrobnější informace o zónách dostupnosti v Azure najdete v tématu Oblasti a zóny dostupnosti.

Služby s podporou zón dostupnosti Azure jsou navržené tak, aby poskytovaly správnou úroveň spolehlivosti a flexibility. Dají se nakonfigurovat dvěma způsoby. Můžou být buď zónově redundantní, s automatickou replikací napříč zónami, nebo zónově, s instancemi připnutými ke konkrétní zóně. Tyto přístupy můžete také kombinovat. Další informace o zónové a zónově redundantní architektuře najdete v tématu Doporučení pro použití zón dostupnosti a oblastí.

Pokud chcete získat podporu zóny dostupnosti, musíte povolit vysokou dostupnost (HA).

Vysoká dostupnost zabraňuje výpadkům databáze udržováním pohotovostních replik každého horizontálního oddílu v clusteru. Pokud dojde ke snížení horizontálního oddílu, Azure Cosmos DB pro MongoDB virtuální jádro přepne příchozí připojení z neúspěšného horizontálního oddílu na pohotovostní repliku.

Pokud je v oblasti podporující zóny dostupnosti povolená vysoká dostupnost, zřídí se horizontální oddíly repliky vysoké dostupnosti v jiné zóně dostupnosti od jejich primárních horizontálních oddílů. Repliky vysoké dostupnosti nedostávají požadavky od klientů, pokud jejich primární horizontální oddíl selže.

Pokud je vysoká dostupnost zakázaná, každý horizontální oddíl má vlastní místně redundantní úložiště (LRS) se třemi synchronními replikami spravovanými službou Azure Storage. Pokud dojde k selhání jedné repliky, služba Azure Storage zjistí selhání a transparentně znovu vytvoří relevantní data. Informace o stálosti úložiště LRS najdete v části Souhrn možností redundance. V případě selhání oblasti ale riskujete rozsáhlý výpadek a možnou ztrátu dat.

Vytvoření prostředku s povolenými zónami dostupnosti

Pokud chcete povolit zóny dostupnosti, musíte povolit vysokou dostupnost (HA) při vytváření clusteru nebo v části Škálování existujícího clusteru na webu Azure Portal.

Zotavení po havárii napříč oblastmi a provozní kontinuita

Zotavení po havárii (DR) se týká zotavení z událostí s vysokým dopadem, jako jsou přírodní katastrofy nebo neúspěšná nasazení, která vedou k výpadkům a ztrátě dat. Bez ohledu na příčinu je nejlepším řešením havárie dobře definovaný a otestovaný plán zotavení po havárii a návrh aplikace, který aktivně podporuje zotavení po havárii. Než začnete přemýšlet o vytvoření plánu zotavení po havárii, přečtěte si doporučení pro návrh strategie zotavení po havárii.

Pokud jde o zotavení po havárii, Microsoft používá model sdílené odpovědnosti. V modelu sdílené odpovědnosti Microsoft zajišťuje, aby byly dostupné základní služby infrastruktury a platformy. Současně mnoho služeb Azure automaticky nereplikuje data nebo se vrátí z oblasti, která selhala, aby se křížově replikovala do jiné povolené oblasti. Za tyto služby zodpovídáte za nastavení plánu zotavení po havárii, který funguje pro vaši úlohu. Většina služeb, které běží na nabídkách PaaS (Platforma jako služba) Azure, poskytuje funkce a pokyny pro podporu zotavení po havárii a pomocí funkcí specifických pro služby můžete podporovat rychlé obnovení , které vám pomůže s vývojem plánu zotavení po havárii.

Virtuální jádro Azure Cosmos DB pro MongoDB neposkytuje integrované automatické převzetí služeb při selhání ani zotavení po havárii. Plánování vysoké dostupnosti je důležitým krokem při škálování vašeho řešení.

Zotavení po havárii v geografické oblasti s jednou oblastí

Pokud chcete maximalizovat dobu provozu, naplánujte si dopředu provozní kontinuitu a připravte se na zotavení po havárii s využitím virtuálních jader Azure Cosmos DB pro MongoDB.

I když jsou služby Azure navržené tak, aby maximalizovaly dobu provozu, může dojít k neplánovaným výpadkům služeb. Plán zotavení po havárii zajišťuje, že máte zavedenou strategii pro zpracování výpadků regionálních služeb.

Virtuální jádro Azure Cosmos DB pro MongoDB automaticky zálohuje vaše data v pravidelných intervalech. Automatické zálohování nemá vliv na výkon ani dostupnost databázových operací. Všechny zálohy se provádějí automaticky na pozadí a ukládají se odděleně od zdrojových dat ve službě úložiště. Tyto automatické zálohování jsou užitečné ve scénářích, kdy omylem odstraníte nebo upravíte prostředky a později budete potřebovat původní verze.

Automatické zálohování se uchovává v různých intervalech podle toho, jestli je cluster aktuálně aktivní nebo nedávno odstraněný.

Doba uchovávání
Aktivní clustery 35 dnů
Odstraněné clustery 7 dnů

Návrh pro zajištění vysoké dostupnosti

Pro důležité clustery azure Cosmos DB pro virtuální jádra MongoDB, na kterých běží produkční úlohy, by měla být povolená vysoká dostupnost (HA). V clusteru s podporou vysoké dostupnosti slouží každý horizontální oddíl jako primární společně s aktivní pohotovostní shard zřízenou v jiné zóně dostupnosti. Replikace mezi primárním a sekundárním horizontálním oddílem je ve výchozím nastavení synchronní. Všechny změny databáze se uchovávají na primárním i sekundárním horizontálním oddílu (aktivní pohotovostní) před přijetím odpovědi z databáze.

Služba udržuje kontroly stavu a prezenční signály pro každý primární a sekundární horizontální oddíl clusteru. Pokud se primární horizontální oddíl stane nedostupným z důvodu výpadku zóny nebo oblasti, sekundární horizontální oddíl se automaticky zvýší tak, aby se stal novým primárním a další sekundární horizontální oddíl se sestaví pro nový primární. Pokud sekundární horizontální oddíl přestane být dostupný, služba automaticky vytvoří nový sekundární horizontální oddíl s úplnou kopií dat z primárního oddílu.

Pokud služba aktivuje převzetí služeb při selhání z primárního do sekundárního horizontálního oddílu, připojení se bezproblémově směrují pod kryty do nového primárního horizontálního oddílu.

Synchronní replikace mezi primárním a sekundárním horizontálním oddílem zaručuje žádné ztráty dat, pokud dojde k převzetí služeb při selhání.

Další kroky