Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Řešení Azure VMware poskytuje privátní cloudy, které obsahují clustery VMware vSphere vytvořené z vyhrazené holé Azure infrastruktury. Úlohy můžete migrovat z místních prostředí, nasazovat nové virtuální počítače a využívat Azure služby z privátních cloudů. K zajištění vysoké dostupnosti a odolnosti vašich úloh můžete použít kombinaci funkcí nativních pro VMware a Azure.
Při použití Azure je spolehlivost sdílenou odpovědností. Microsoft poskytuje řadu funkcí pro podporu odolnosti a obnovení. Zodpovídáte za pochopení toho, jak tyto možnosti fungují ve všech službách, které používáte, a výběrem možností, které potřebujete ke splnění vašich obchodních cílů a cílů dostupnosti.
Tento článek popisuje, jak učinit Řešení Azure VMware odolným vůči potenciálním výpadkům a problémům, včetně přechodných chyb, výpadků zón dostupnosti a výpadků regionů. Popisuje také, jak můžete použít zálohy k zotavení z jiných typů problémů a zvýrazní některé klíčové informace o smlouvě o úrovni služeb (SLA) Řešení Azure VMware.
Doporučení pro nasazení do produkčního prostředí
Řešení Azure VMware vyžadují pečlivé plánování napříč řadou oblastí a často zahrnují využití více služeb Azure. Další informace najdete v části pracovní zátěže pro Řešení Azure VMware v architektuře Azure Well-Architected Framework.
Přehled architektury spolehlivosti
Řešení Azure VMware používá hyperkonvergovanou infrastrukturu (HCI) s clustery VMware vSphere.
Když nasadíte Řešení Azure VMware, nasadíte cloud private, který má jeden nebo více clusterů. Každý cluster obsahuje hostitele ESXi, kteří poskytují výpočetní prostředky, úložiště prostřednictvím virtuální sítě SAN (vSAN) a sítě prostřednictvím VMware NSX. Existují dvě generace Řešení Azure VMware:
Gen 1 používá specializovaný bare-metal hardware pro uzly a má vyhrazené síťové přístupy. Další informace o klíčových konceptech najdete v tématu Řešení Azure VMware koncepty privátního cloudu a clusteru.
Gen 2 používá standardní typy virtuálních počítačů Azure a virtuální sítě Azure. Tato architektura zjednodušuje síťovou architekturu, vylepšuje rychlost přenosu dat, snižuje latenci úloh a zlepšuje výkon při přístupu k jiným službám Azure.
Odolnost proti chybám
Řešení Azure VMware poskytuje několik mechanismů pro zpracování chyb na úrovni infrastruktury i aplikace:
Vysoká dostupnost vSphere (HA): vSphere HA monitoruje hostitele ESXi a virtuální počítače. Pokud hostitel selže, automaticky restartuje ovlivněné virtuální počítače na hostitelích, které jsou v pořádku. Služba vSphere HA je ve výchozím nastavení zapnutá a vyhrazuje si výpočetní kapacitu a kapacitu paměti pro selhání jednoho uzlu.
Odolnost proti chybám sítě vSAN: Zásady úložiště vSAN chrání před přechodnými chybami na úrovni úložiště udržováním více kopií dat mezi hostiteli. Pokud cesta k úložišti nebo disk zažívá přechodné problémy, služba vSAN automaticky provede převzetí služeb při selhání na zdravé cesty k úložišti.
Redundance sítě: Řešení Azure VMware poskytuje redundantní síťové cesty a několik síťových adaptérů VMkernel pro zpracování přechodných chyb na úrovni sítě.
Odolnost proti přechodným chybám
Přechodné chyby jsou krátká, přerušovaná selhání ve složkách. V distribuovaném prostředí, jako je cloud, se vyskytují často a jsou normální součástí provozu. Přechodné chyby se opravují po krátké době. Je důležité, aby vaše aplikace mohly zpracovávat přechodné chyby, obvykle opakováním ovlivněných požadavků.
Všechny aplikace hostované v cloudu by měly postupovat podle Azure pokynů pro zpracování přechodných chyb, když komunikují s libovolnými rozhraními API, databázemi a dalšími komponentami hostovanými v cloudu. Další informace najdete v tématu Doporučení pro zpracování přechodných chyb.
Pro aplikace, které běží na virtuálních počítačích Řešení Azure VMware, implementujte standardní postupy pro zpracování přechodných chyb:
Nastavte vhodné zásady opakování s exponenciálním zpožováním.
Používejte vzory obvodových jističů pro volání externích služeb.
Monitorujte stav aplikace a implementujte řádné snížení výkonu.
Pokud je to možné, navrhujte bezstavové aplikace, abyste snížili dopad restartování virtuálních počítačů.
Odolnost proti chybám zóny dostupnosti
zóny dostupnosti jsou fyzicky oddělené skupiny datacenter v rámci Azure oblasti. Když jedna zóna selže, mohou služby přejít na jednu ze zbývajících zón.
Řešení Azure VMware Gen1 podporuje zóny dostupnosti prostřednictvím roztažené clustery, které distribuují hostitele ESXi mezi dvě zóny dostupnosti v rámci oblasti. Microsoft vybere zóny, které se mají použít. Cluster běží v konfiguraci aktivní-aktivní napříč dvěma zónami a síť vSAN také zahrnuje více zón. Můžete určit, jestli je každá úloha nasazená do jedné nebo dvou zón.
Uzel určující kopii se automaticky nasadí do třetí zóny dostupnosti a poskytne kvorum pro scénáře rozděleného mozku. Microsoft spravuje svědek uzel automaticky.
Standardní cluster je cluster, který není roztažený mezi zónami. Ve standardním clusteru se cluster a všichni jeho hostitelé ESXi považují za nezonální nebo regionální. Nezonální clustery mohou být umístěny v jakékoli zóně dostupnosti v rámci oblasti a Microsoft vybere zónu. Pokud dojde k výpadku zóny dostupnosti v dané oblasti, mohou být například nezonální clustery a hostitelé umístěni v ovlivněné zóně a mohou čelit výpadku.
Řešení Azure VMware Gen2 podporuje nasazení privátních cloudů zonal. Když nastavíte zónový privátní cloud, všechny jeho clustery a všechny jejich hostitele ESXi se nasadí do jediné zóny dostupnosti, kterou vyberete.
Zónový privátní cloud nechrání před selháními zón dostupnosti. Pro zajištění vyšší odolnosti můžete nasadit několik privátních cloudů do samostatných zón dostupnosti, ale zodpovídáte za nasazení a konfiguraci jednotlivých privátních cloudů nezávisle.
Pokud nevyberete zónu dostupnosti, váš privátní cloud, jeho clustery a všechny jejich hostitele ESXi se považují za nezonální nebo regionální. Nezonální clustery mohou být umístěny v jakékoli zóně dostupnosti v rámci oblasti a Microsoft vybere zónu. Pokud dojde k výpadku zóny dostupnosti v dané oblasti, může dojít k výpadku nezonálních clusterů v ovlivněné zóně.
Abyste získali více informací o podpoře zóny dostupnosti pro jiné generace, vyberte na začátku tohoto článku příslušnou generaci.
Požadavky
podpora oblastí Region: Roztažené clustery jsou k dispozici pouze v Azure oblastech, které podporují konfiguraci roztaženého clusteru. Zkontrolujte tabulku mapování zón dostupnosti v oblasti Azure na typy hostitelů pro aktuální podporu regionů.
Minimální počet hostitelů: Nasaďte minimálně šest hostitelů mezi dvěma zónami dostupnosti (tři hostitele pro každou zónu) a povolte tak konfiguraci roztaženého clusteru. Při škálování dovnitř nebo ven je nutné škálovat ve dvojicích tak, aby každá zóna měla stejný počet hostů.
Skladové položky hostitele: Typy hostitelů AV36, AV36P a AV52 podporují roztažené clustery. SKU AV64 nepodporuje natažené clustery.
- Region support: Můžete nasadit zónové privátní cloudy v oblastech, které podporují Řešení Azure VMware Gen 2 a zón dostupnosti.
Úvahy
Každá zóna dostupnosti v oblasti může podporovat konkrétní typy hostitelů. Podrobný seznam typů hostitelů dostupných v jednotlivých zónách najdete v tabulce mapování typů hostitelů na zóny dostupnosti Azure regionů
Náklady
Za každý uzel v clusteru se účtují náklady bez ohledu na konfiguraci zóny dostupnosti clusteru. Podrobné informace o cenách najdete na Řešení Azure VMware - ceny.
Konfigurujte podporu zón dostupnosti
Nasadit nový cluster: Když vytvoříte nový privátní cloud řešení Azure VMware v podporované oblasti, můžete ho během nasazování nastavit jako rozšířený cluster. Tato konfigurace distribuuje hostitele mezi dvě zóny dostupnosti automaticky. Další informace najdete v tématu Nasazení roztažených clusterů vSAN.
Existující clustery: Standardní cluster nemůžete převést na roztažený cluster a nemůžete převést roztažený cluster na standardní cluster. Místo toho musíte nasadit nový cluster a migrovat úlohy.
Nasaďte nový cluster: Když vytvoříte nový privátní cloud Řešení Azure VMware v podporované oblasti, můžete zvolit jeho zónu dostupnosti.
Existující clustery: Konfiguraci zóny dostupnosti existujícího clusteru nemůžete změnit. Místo toho musíte nasadit nový cluster a migrovat úlohy.
Chování, když jsou všechny zóny v pořádku
Tato část popisuje, co očekávat, když je cluster rozšířený a všechny zóny dostupnosti jsou funkční.
Operace napříč zónami: Virtuální počítače se můžou spouštět na hostitelích v obou zónách dostupnosti. Umístění virtuálních počítačů můžete řídit pomocí pravidel spřažení a anti-spřažení Plánovače distribuovaných prostředků (DRS) vSphere, která optimalizují výkonnostní nebo dostupnostní požadavky.
Replikace dat mezi zónami: síť vSAN replikuje data synchronně napříč zónami dostupnosti. Obě zóny před dokončením potvrdí každou operaci zápisu, aby se zajistila konzistentní integrita dat.
Tato část popisuje, co očekávat, když je cluster nasazený v zónovém privátním cloudu, a všechny zóny dostupnosti jsou funkční.
Operace napříč zónami: Virtuální počítače běží na hostitelích v rámci zóny dostupnosti clusteru.
Replikace dat mezi zónami: Žádná data se nereplikují do jiné zóny.
Chování při selhání zóny
Tato část popisuje, co očekávat, když je cluster roztažený a dojde k výpadku zóny dostupnosti.
- Detekce a reakce: Řešení Azure VMware spravuje odpověď na úrovni infrastruktury na selhání zón. VSphere HA automaticky rozpozná selhání zón a v případě potřeby zahájí postupy restartování virtuálního počítače.
- Notification: Microsoft vás při výpadku zóny automaticky neoznámí. Pomocí Azure Resource Health ale můžete monitorovat stav jednotlivých prostředků a můžete nastavit výstrahy Resource Health, které vás upozorní na problémy. Můžete také použít Azure Service Health k pochopení celkového stavu služby, včetně jakýchkoli selhání zóny, a můžete nastavit upozornění služby Service Health, která vás upozorní na problémy.
Aktivní požadavky: Jakékoli virtuální počítače, které běží v nefunkční zóně dostupnosti, se restartují na hostitelích ve funkční zóně dostupnosti. Aktivní požadavky a připojení k ovlivněným virtuálním počítačům se ukončí a klienti jsou zodpovědní za jejich opětné spuštění.
Očekávaný výpadek: Doba restartování neúspěšných virtuálních počítačů v zóně, která je v pořádku, je obvykle několik minut v závislosti na konfiguraci a spouštění virtuálních počítačů. Roztažený cluster zůstává funkční se sníženou kapacitou.
Pokud zóna dostupnosti, která selhala, obsahuje uzel svědka, stane se nedostupným. Pokud budou k dispozici dostatečné repliky dat, budou hostitelé dat a spuštěné úlohy nadále fungovat bez okamžité ztráty dat. vSAN však v tomto stavu ztratí povědomí o kvóru. Ztráta kvora zabraňuje bezpečnému provádění rozhodnutí o umístění a obnovení. Blokuje také určité operace, jako je zapnutí virtuálního počítače po selháních, vyrovnávání a opravy.
Očekávaná ztráta dat: Vzhledem k tomu, že síť vSAN používá synchronní replikaci mezi zónami, během selhání zóny se neočekává žádná ztráta dat.
Redistribuce: VSphere DRS automaticky redistribuuje úlohy virtuálních počítačů do zóny dostupnosti, která je v pořádku. Směrování síťového provozu přes VMware NSX se automaticky přizpůsobí novému umístění virtuálního počítače.
Tato část popisuje, co očekávat, když je cluster nasazený v zónovém privátním cloudu a dojde k výpadku zóny dostupnosti.
- Detekce a odpověď: Potřebujete zjistit ztrátu zóny dostupnosti. V případě potřeby můžete zahájit převzetí při selhání sekundárnímu clusteru, který jste vytvořili dříve v jiné zóně dostupnosti.
- Notification: Microsoft vás při výpadku zóny automaticky neoznámí. Pomocí Azure Resource Health ale můžete monitorovat stav jednotlivých prostředků a můžete nastavit výstrahy Resource Health, které vás upozorní na problémy. Můžete také použít Azure Service Health k pochopení celkového stavu služby, včetně jakýchkoli selhání zóny, a můžete nastavit upozornění služby Service Health, která vás upozorní na problémy.
Aktivní požadavky: Aktivní požadavky a připojení k ovlivněným virtuálním počítačům se ukončí a klienti zodpovídají za jejich opakování.
Očekávaný výpadek: Pokud je zóna nedostupná, cluster a její úlohy nebudou k dispozici, dokud se zóna dostupnosti neobnoví.
Očekávaná ztráta dat: Data v ovlivněné zóně nejsou k dispozici, dokud se zóna neobnoví.
Přerozdělování: V případě potřeby zodpovídáte za přepnutí provozu na jiné clustery ve funkčních zónách.
Obnovení zóny
Když se zóna dostupnosti obnoví, může vSphere DRS volitelně distribuovat virtuální počítače zpět do obnovené zóny na základě vašich pravidel konfigurace a spřažení DRS. Umístění virtuálních počítačů můžete řídit také ručně pomocí operací vMotion.
Po obnovení zóny dostupnosti jsou clustery a hostitelé v zóně opět k dispozici. Zodpovídáte za všechny postupy obnovení zóny a synchronizaci dat, které vaše úlohy vyžadují.
Testování poruch zón
Pokud se chcete připravit na selhání zón, otestujte odolnost aplikace vůči restartování virtuálního počítače a změnám síťové cesty, zejména pokud máte roztažené clustery nebo nasazujete aplikace mezi samostatné clustery v různých zónách.
Vzhledem k tomu, že Řešení Azure VMware spravuje odezvu infrastruktury na selhání zóny, musíte primárně otestovat odpověď aplikace na restartování virtuálního počítače.
Jste zodpovědní za veškeré reakce infrastruktury na výpadky v zónách, například za převzetí služeb při selhání do jiného clusteru v jiné zóně nebo oblasti. Ujistěte se, že důkladně otestujete procesy odezvy.
Odolnost proti selháním v celé oblasti
Každý cluster Řešení Azure VMware se nasadí v jedné Azure oblasti. Pokud oblast přestane být dostupná, váš privátní cloud a všechny prostředky v ní budou nedostupné.
Můžete ale také navrhnout vlastní řešení s více oblastmi, která kombinují různé přístupy nebo integrují se stávající infrastrukturou, aby splňovala vaše konkrétní obchodní požadavky a cíle obnovení.
Vlastní řešení pro více regionů pro odolnost systémů
Pokud chcete dosáhnout odolnosti více oblastí pomocí Řešení Azure VMware, musíte nasadit samostatné privátní cloudy ve více oblastech a implementovat převzetí služeb při selhání a další řešení zotavení po havárii.
Řada možností podporuje různé požadavky na odolnost. Další informace najdete v tématu Disaster recovery solutions for Řešení Azure VMware virtual machines.
Zálohování a obnovení
Řešení Azure VMware automaticky zálohuje součásti pro správu, jako jsou vCenter Server, NSX Manager a HCX Manager, pokud je povoleno. Pokud chcete obnovit komponenty z těchto záloh správy, vytvořte žádost o podpora Azure.
Pro úlohy virtuálních počítačů Řešení Azure VMware podporuje více přístupů k zálohování. Další informace najdete v Zálohovací řešení pro virtuální počítače Řešení Azure VMware.
Odolnost vůči údržbě služeb
Azure provádí automatickou údržbu platformy, aby aplikovala aktualizace zabezpečení, nasazovala nové funkce a zlepšovala spolehlivost služeb.
Informace o tom, jak údržba ovlivňuje Řešení Azure VMware komponenty, a vysvětlení komponent, které zodpovídáte za údržbu a součásti, které Microsoft udržuje, najdete v tématu Řešení Azure VMware údržba privátního cloudu.
Časové intervaly údržby pro cluster můžete nastavit tak, aby se snížila pravděpodobnost, že údržba ovlivní vaše produkční úlohy. Další informace najdete v tématu Plán samoobslužné údržby pro Řešení Azure VMware.
Smlouva o úrovni služeb
Smlouva o úrovni služeb (SLA) pro služby Azure popisuje očekávanou dostupnost každé služby a podmínky, které musí vaše řešení splnit, aby bylo dosaženo očekávané dostupnosti. Další informace najdete v tématu SLA pro online služby.
Řešení Azure VMware poskytuje různé smlouvy SLA dostupnosti pro infrastrukturu úloh a operace správy.
Clustery, které nastavíte jako roztažené clustery, mají vyšší SLA pro dostupnost infrastruktury pro úlohy.
Pokud ale chcete získat nárok pro SLA týkající se dostupnosti, musíte cluster nastavit konkrétním způsobem. Další informace najdete v textu smlouvy SLA.