Sdílet prostřednictvím


Spolehlivost v komunitním školení

Komunitní školení je cloudové řešení založené na Azure, které dokáže poskytovat rozsáhlé a dalekosáhlé školicí programy s vysokou kvalitou a efektivitou. Díky komunitnímu školení můžou organizace všech velikostí a typů provozovat rozsáhlé školicí programy pro své interní a externí komunity. Mezi komunity patří pracovníci front-line, rozšíření pracovníci, partnerské ekosystémy, dobrovolnická síť a příjemci programů.

Tento článek popisuje podporu spolehlivosti v školení komunity a popisuje jak regionální odolnost zón dostupnosti, tak zotavení po havárii a kontinuitu podnikových procesů. Podrobnější přehled principu spolehlivosti v Azure najdete v tématu Spolehlivost Azure.

Podpora zón dostupnosti

Zóny dostupnosti Azure jsou aspoň tři fyzicky oddělené skupiny datacenter v rámci každé oblasti Azure. Datová centra v každé zóně jsou vybavena nezávislou infrastrukturou napájení, chlazení a sítě. V případě selhání místní zóny jsou zóny dostupnosti navrženy tak, aby v případě ovlivnění jedné zóny, regionální služby, kapacity a vysoké dostupnosti podporovaly zbývající dvě zóny.

Selhání můžou být v rozsahu od selhání softwaru a hardwaru až po události, jako jsou zemětřesení, záplavy a požáry. Odolnost vůči selháním se dosahuje redundancí a logickou izolací služeb Azure. Podrobnější informace o zónách dostupnosti v Azure najdete v tématu Oblasti a zóny dostupnosti.

Služby s podporou zón dostupnosti Azure jsou navržené tak, aby poskytovaly správnou úroveň spolehlivosti a flexibility. Dají se nakonfigurovat dvěma způsoby. Můžou být buď zónově redundantní, s automatickou replikací napříč zónami, nebo zónově, s instancemi připnutými ke konkrétní zóně. Tyto přístupy můžete také kombinovat. Další informace o zónové a zónově redundantní architektuře najdete v tématu Doporučení pro použití zón dostupnosti a oblastí.

Komunitní školení využívá zóny dostupnosti Azure k zajištění vysoké dostupnosti a odolnosti proti chybám v rámci oblasti Azure. Školení komunity nabízí podporu zóny dostupnosti řídicí roviny i roviny dat:

  • Řídicí rovina je zónově redundantní v primárních oblastech dostupnosti.

  • Rovina dat může být zónově nebo zónově redundantní v závislosti na tom, co si zvolíte pro své potřeby. Důrazně ale doporučujeme zvolit zónově redundantní nasazení, abyste se vyhnuli ztrátě dat a zachovali dostupnost služby během výpadku zóny.

Požadavky

  • Zóny dostupnosti jsou podporovány pro následující skladové položky školení komunity:

    • Standard (nižší měřítko uživatelů)
    • Premium (vysoká škála uživatelů)
  • Komunitní školení se podporuje jenom v spárovaných oblastech. Každá sekundární oblast se nasadí s zónovou konfigurací. V následující tabulce jsou uvedeny všechny oblasti, které podporují zóny dostupnosti pro školení komunity spolu s jejich spárovanou oblastí.

Primární oblast Spárovaná oblast
UkSouth UkWest
AustraliaEast AustraliaSoutheast
EastUS WestUS
EastUS2 CentralUS
Severní Evropa WestEurope
WestUS3 EastUS
Švédsko – střed ŠvédskoSouth

Podpora zónových převzetí služeb při selhání

Komunitní školení využívá řadu závislostí služeb Azure, jako je App Service a Azure SQL. Když zvolíte zónově redundantní nasazení, komunitní školení také vytvoří zónově redundantní nabídky těchto základních prostředků služby Azure. Pokud jedna zóna selže, všechny prostředky, včetně prostředků závislostí, převezme služby při selhání jedné ze zón, které jsou v pořádku.

Vytvoření prostředku s povolenou zónou dostupnosti

Komunitní školení poskytuje konfiguraci zón dostupnosti pouze při vytváření instance. Pokud chcete po vytvoření instance změnit konfiguraci zóny dostupnosti, budete muset vytvořit novou instanci. Informace o tom, jak vytvořit instanci školení komunity, najdete v tématu Vytvoření komunitního školení.

Prostředí pro zónu dolů

  • Zonální. Během výpadku na úrovni zóny může mít komunitní školení úplné nebo částečné přerušení služeb. Rozsah, do kterého je k dispozici, závisí na různých faktorech, například na tom, jestli je celé datové centrum dole nebo jestli už v dané zóně není dostupná konkrétní služba závislostí.

  • Zónově redundantní. Během výpadku na úrovni zóny byste neměli mít žádný vliv na zřízené prostředky. Měli byste však být připraveni na krátké přerušení komunikace s těmito prostředky. V situaci mimo zónu klienti obvykle obdrží kódy chyb 409 a také logika opakování se pokusí znovu navázat připojení v příslušných intervalech. Nové požadavky se směrují na uzly, které jsou v pořádku s nulovým dopadem na uživatele. Během výpadků v rámci zóny můžou uživatelé vytvářet nové prostředky a úspěšně škálovat stávající prostředky.

Zotavení po havárii a provozní kontinuita

Zotavení po havárii (DR) se týká zotavení z událostí s vysokým dopadem, jako jsou přírodní katastrofy nebo neúspěšná nasazení, která vedou k výpadkům a ztrátě dat. Bez ohledu na příčinu je nejlepším řešením havárie dobře definovaný a otestovaný plán zotavení po havárii a návrh aplikace, který aktivně podporuje zotavení po havárii. Než začnete přemýšlet o vytvoření plánu zotavení po havárii, přečtěte si doporučení pro návrh strategie zotavení po havárii.

Pokud jde o zotavení po havárii, Microsoft používá model sdílené odpovědnosti. V modelu sdílené odpovědnosti Microsoft zajišťuje, aby byly dostupné základní služby infrastruktury a platformy. Současně mnoho služeb Azure automaticky nereplikuje data nebo se vrátí z oblasti, která selhala, aby se křížově replikovala do jiné povolené oblasti. Za tyto služby zodpovídáte za nastavení plánu zotavení po havárii, který funguje pro vaši úlohu. Většina služeb, které běží na nabídkách PaaS (Platforma jako služba) Azure, poskytuje funkce a pokyny pro podporu zotavení po havárii a pomocí funkcí specifických pro služby můžete podporovat rychlé obnovení , které vám pomůže s vývojem plánu zotavení po havárii.

Tým školení komunity Microsoftu spravuje celý postup zotavení po havárii pro školení komunity. Zotavení po havárii není aktivní nebo aktivní pasivní, ale je založené na obnovení z nejnovější dostupné zálohy služeb Azure. Tým komunitního školení ručně vytvoří všechny prostředky ve spárované oblasti ze zálohy dat.

Poznámka:

Zotavení po havárii komunitního školení se podporuje jenom v spárovaných oblastech.

Zotavení po havárii v geografické oblasti s více oblastmi

  • V regionální havárii je řídicí rovina ručně převzetí služeb při selhání spárované oblasti. V době před dokončením převzetí služeb při selhání byste měli očekávat snížení výkonu služby. Po převzetí služeb při selhání se operace jen pro čtení podporují, dokud se oblast havárie nevrátí do online režimu. Služba se po obnovení do původní oblasti ručně obnoví a všechny operace se obnoví. Očekává se, že cíl bodu obnovení (RPO) bude 10 minut; Cíl doby obnovení (RTO), 24 hodin.

  • Pro rovinu dat nabízí komunitní školení microsoftu spravované zotavení po havárii. Pokud chcete použít spravované zotavení po havárii, musíte během vytváření instance školení komunity v Azure povolit zotavení po havárii. Jakmile povolíte zotavení po havárii, Microsoft udržuje zálohu úložiště a databáze ve spárované oblasti. Očekává se, že cíl bodu obnovení (RPO) bude 12 hodin; Cíl doby obnovení (RTO), 48 hodin.

Poznámka:

RtO závisí na velikosti databáze a úložiště, latenci mezi spárovanou oblastí. Kapacita virtuálního počítače databáze nebo úložiště Cíl bodu obnovení závisí na podkladových prostředcích Azure, jako je Azure SQL a Azure Storage. Další informace o RTO a RPO najdete v tématu Přehled zotavení po havárii.

Detekce výpadků, oznámení a správa

Když kontrola stavu školení komunity zjistí výpadek jakékoli služby a v jakékoli oblasti požádá Microsoft o převzetí služeb při selhání spárovanou oblastí. Společnost Microsoft vás informuje o tom, které funkce jsou během postupu zotavení po havárii k dispozici. Jakmile Microsoft obdrží váš souhlas, tým školení komunity pak může zahájit postup zotavení po havárii.

Důležité

Studenti nebudou moct využívat funkce zvuku nebo videa, dokud nebude primární oblast funkční. Doporučuje se vyhnout operacím nahrávání médií, dokud nebude primární lokalita funkční.

Odolnost proti zotavení po havárii a proaktivní kapacita

Microsoft a její zákazníci pracují v rámci modelu sdílené odpovědnosti. Jakmile je jakákoli oblast mimo provoz, migruje se nejen instance komunitního školení do spárované oblasti, ale také všechny úlohy produktů a zákazníků se migrují do spárované oblasti. Tento postup může způsobit nedostatek prostředků ve spárované oblasti nebo datovém centru. Dostupnost zotavení po havárii proto závisí na dostupné kapacitě základních prostředků Azure.

Další kroky