Sdílet prostřednictvím


Školení ke spolehlivosti v komunitě Microsoftu

Tento článek popisuje podporu spolehlivosti v školení komunity. Týká se regionální odolnosti se zónami dostupnosti a zotavením po havárii a provozní kontinuitou. Podrobnější přehled principu spolehlivosti v Azure najdete v tématu Spolehlivost Azure.

Školení komunity Microsoftu je cloudové řešení založené na Azure, které umožňuje poskytovat rozsáhlé a dalekosáhlé školicí programy s vysokou kvalitou a efektivitou pomocí zónově redundantního nasazení napříč spárovanými oblastmi. Díky komunitnímu školení můžou organizace všech velikostí a typů spouštět rozsáhlé školicí programy pro své interní a externí komunity s podporou zóny dostupnosti řídicí roviny a roviny dat. Mezi komunity patří pracovníci v první linii, rozšířené pracovní síly, partnerský ekosystém, síť dobrovolníků a příjemci programů.

Podpora zón dostupnosti

Zóny dostupnosti jsou fyzicky oddělené skupiny datacenter v rámci oblasti Azure. Když jedna zóna selže, mohou se služby přesunout do jedné ze zbývajících zón.

Komunitní školení využívá zóny dostupnosti Azure k zajištění vysoké dostupnosti a odolnosti proti chybám v rámci oblasti Azure. Školení komunity nabízí podporu zóny dostupnosti řídicí roviny i roviny dat:

  • Řídicí rovina je zónově redundantní v primárních oblastech dostupnosti.

  • Rovina dat může být zónově nebo zónově redundantní v závislosti na tom, co si zvolíte pro své potřeby. Důrazně ale doporučujeme zvolit zónově redundantní nasazení, abyste se vyhnuli ztrátě dat a zachovali dostupnost služby během výpadku zóny.

Požadavky

  • Podporované zóny dostupnosti jsou pro následující SKU pro komunitní školení:

    • Standard (nižší měřítko uživatelů)
    • Premium (vysoká škála uživatelů)
  • Komunitní školení se podporuje jenom v spárovaných oblastech. Každá sekundární oblast je nasazena se zónovou konfigurací. V následující tabulce jsou uvedeny všechny oblasti, které podporují zóny dostupnosti pro vzdělávání komunity, spolu s jejich spárovanou oblastí.

Primární oblast Spárovaná oblast
Spojené království – jih UkWest
AustrálieVýchod Austrálie-Jihovýchod
Východní USA Západní USA
EastUS2 Centrální USA
Severní Evropa Západní Evropa
WestUS3 Východní USA
Centrální Švédsko ŠvédskoSouth

Podpora převzetí služeb při selhání v zóně

Komunitní školení využívá řadu závislostí služeb Azure, jako je App Service a Azure SQL. Když zvolíte zónově redundantní nasazení, komunitní školení také vytvoří zónově redundantní nabídky těchto základních prostředků služby Azure. Pokud jedna zóna selže, všechny prostředky, včetně závislostních prostředků, se automaticky přesunou do jedné z funkčních zón.

Vytvořit prostředek s povolenou zónou dostupnosti

Komunitní školení poskytuje konfiguraci zón dostupnosti pouze při vytváření instance. Pokud chcete po vytvoření instance změnit konfiguraci zóny dostupnosti, budete muset vytvořit novou instanci.

Prostředí pro zónu dolů

  • Zonální. Během výpadku na úrovni zóny může mít komunitní školení úplné nebo částečné přerušení služeb. Míra, v jaké je k dispozici, závisí na různých faktorech, například na tom, jestli je celé datové centrum nedostupné, nebo jestli už v dané zóně není dostupná konkrétní závislá služba.

  • Zónová redundance. Během výpadku na úrovni zóny by vaše zřízené prostředky neměly být ovlivněny. Měli byste však být připraveni na krátké přerušení komunikace s těmito prostředky. V situaci, kdy je zóna mimo provoz, klienti obvykle obdrží kódy chyb 409 a logika opakovaných pokusů se snaží znovu navázat připojení v příslušných intervalech. Nové požadavky se směrují na uzly, které jsou v pořádku s nulovým dopadem na uživatele. Během výpadků v rámci zóny můžou uživatelé vytvářet nové prostředky a úspěšně škálovat stávající prostředky.

Zotavení po havárii a provozní kontinuita

Zotavení po havárii (DR) označuje postupy, které organizace používají k zotavení z událostí s vysokým dopadem, jako jsou přírodní katastrofy nebo neúspěšná nasazení, která vedou k výpadkům a ztrátě dat. Bez ohledu na příčinu je nejlepším řešením havárie dobře definovaný a otestovaný plán zotavení po havárii a návrh aplikace, který aktivně podporuje zotavení po havárii. Než začnete vytvářet plán zotavení po havárii, přečtěte si téma Doporučení pro návrh strategie zotavení po havárii.

Pro DR používá Microsoft model sdílené odpovědnosti. V tomto modelu Microsoft zajišťuje, aby byly dostupné základní služby infrastruktury a platformy. Nicméně mnoho služeb Azure neprovádí automatickou replikaci dat ani nepřepíná z oblasti, která selhala, aby se provedla křížová replikace do jiné povolené oblasti. Za tyto služby zodpovídáte za nastavení plánu zotavení po havárii, který funguje pro vaši úlohu. Většina služeb, které běží v rámci nabídky platformy jako služby (PaaS) na Azure, poskytuje funkce a pokyny pro podporu disaster recovery (DR). Pomocí funkcí specifických pro službu můžete podporovat rychlé obnovení, což pomůže s vývojem vašeho DR plánu.

Tým školení komunity Microsoftu spravuje celý postup zotavení po havárii pro školení komunity. Zotavení po havárii není aktivní-aktivní nebo aktivní-pasivní, ale obnovuje se z nejnovější dostupné zálohy služeb Azure. Tým komunitního školení ručně vytvoří všechny prostředky ve spárované oblasti ze zálohy dat.

Poznámka:

Zotavení po havárii v komunitních školeních je podporováno pouze ve spárovaných oblastech.

Zotavení po havárii v geografické oblasti s více oblastmi

  • Při regionální katastrofě se řídicí rovina ručně přepne na spárovaný region. V době před dokončením převzetí služeb při selhání byste měli očekávat snížení výkonu služby. Po převzetí služeb při selhání jsou podporovány pouze operace pro čtení, dokud se oblast zasažená havárií nenávrátí online. Služba se po obnovení do původní oblasti ručně obnoví a všechny operace se obnoví. Očekává se, že cíl bodu obnovení (RPO) bude 10 minut; Cíl doby obnovení (RTO), 24 hodin.

  • Pro rovinu dat nabízí Komunitní školení řešení řízené společností Microsoft pro zotavení po havárii. Pokud chcete použít spravované zotavení po havárii, musíte během vytváření instance školení komunity v Azure povolit zotavení po havárii. Jakmile povolíte zotavení po havárii, Microsoft udržuje zálohu úložiště a databáze ve spárované oblasti. Očekává se, že cíl bodu obnovení (RPO) bude 12 hodin; Cíl doby obnovení (RTO), 48 hodin.

Poznámka:

RtO závisí na velikosti databáze a úložiště a latenci mezi spárovanými oblastmi. Kapacita VM pro databáze nebo úložiště (SKU). RPO závisí na podkladových prostředcích Azure, jako jsou Azure SQL a Azure Storage. Další informace o RTO a RPO naleznete v tématu Co jsou provozní kontinuita, vysoká dostupnost a zotavení po havárii?.

Detekce výpadků, oznámení a správa

Když kontrola stavu školení komunity zjistí výpadek jakékoli služby a v jakékoli oblasti požádá Microsoft o převzetí služeb při selhání spárovanou oblastí. Společnost Microsoft vás informuje o tom, které funkce jsou během postupu zotavení po havárii k dispozici. Jakmile Microsoft obdrží váš souhlas, tým školení komunity pak může zahájit postup zotavení po havárii.

Důležité

Studenti nebudou moct využívat funkce zvuku nebo videa, dokud nebude primární oblast funkční. Doporučuje se vyhnout operacím nahrávání médií, dokud nebude primární lokalita funkční.

Odolnost proti zotavení po havárii a proaktivní kapacita

Microsoft a její zákazníci pracují v rámci modelu sdílené odpovědnosti. Jakmile je jakákoli oblast mimo provoz, migruje se nejen instance komunitního školení do spárované oblasti, ale také všechny úlohy produktů a zákazníků se migrují do spárované oblasti. Tento postup může způsobit nedostatek prostředků ve spárované oblasti nebo datovém centru. Dostupnost zotavení po havárii proto závisí na dostupné kapacitě základních prostředků Azure.

Další kroky