Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Azure Virtual Machine Scale Sets je výpočetní prostředek Azure, který můžete použít k vytvoření a správě skupiny instancí virtuálních počítačů. Počet instancí virtuálních počítačů se může automaticky zvýšit nebo snížit v reakci na poptávku nebo definovaný plán. Škálovací sady virtuálních počítačů pomáhají zajistit vysokou dostupnost a odolnost aplikací díky distribuci virtuálních počítačů napříč několika zónami dostupnosti a doménami selhání.
Při používání Azure je spolehlivost sdílenou odpovědností. Microsoft nabízí celou řadu možností, které podporují odolnost a obnovení. Zodpovídáte za pochopení toho, jak tyto možnosti fungují ve všech službách, které používáte, a výběrem možností, které potřebujete ke splnění vašich obchodních cílů a cílů dostupnosti.
Tento článek popisuje, jak zajistit odolnost škálovacích sad virtuálních počítačů vůči různým potenciálním výpadkům a problémům, včetně přechodných chyb, výpadků zón dostupnosti, výpadků oblastí, rekonfigurace virtuálních počítačů a údržby služeb. Popisuje také, jak můžete použít zálohy k zotavení z jiných typů problémů a zvýrazňuje klíčové informace o smlouvě SLA (Virtual Machine Scale Sets Service Level Agreement).
Důležité
Při zvažování spolehlivosti škálovací sady a jejích virtuálních počítačů je potřeba zvážit také spolehlivost disků, síťové infrastruktury a aplikací, které běží na virtuálních počítačích. Zvýšení odolnosti samotných virtuálních počítačů může mít omezený účinek, pokud ostatní komponenty nejsou stejně odolné. V závislosti na požadavcích na odolnost možná budete muset provést změny konfigurace v několika oblastech.
Doporučení pro nasazení do produkčního prostředí
Azure Well-Architected Framework poskytuje doporučení pro spolehlivost, výkon, zabezpečení, náklady a provoz. Informace o tom, jak tyto oblasti vzájemně ovlivňují a přispívají ke spolehlivému řešení Virtual Machine Scale Sets, najdete v tématu Osvědčené postupy architektury pro virtuální počítače Azure a škálovací sady v Well-Architected Frameworku.
Přehled architektury spolehlivosti
Škálovací sada seskupí několik instancí virtuálních počítačů a použije centralizovanou konfiguraci, pravidla automatického škálování a postupné upgrady.
Škálovací sady podporují dva různé režimy orchestrace:
- Flexibilní škálovací sady (doporučeno) poskytují větší flexibilitu při nasazování a správě jednotlivých instancí virtuálních počítačů.
- Jednotné škálovací sady nasazují virtuální počítače, které mají identickou konfiguraci, a spravujete je jako skupinu.
Šíření selhání v doméně
Domény selhání jsou skupiny izolace chyb v rámci datacentra. Každá doména selhání je jako serverový rack, což je sada hardwarových uzlů, které sdílejí stejné napájení, síťové připojení, chlazení a plán údržby platformy. Vzhledem k tomu, že instance virtuálních počítačů každé škálovací sady jsou rozložené mezi několik domén selhání, plánovaný nebo neplánovaný výpadek, ke kterému dochází v jedné doméně selhání, pravděpodobně neovlivní instance virtuálních počítačů v jiných doménách selhání.
Při nasazování škálovací sady můžete řídit, přes kolik domén selhání budou virtuální počítače rozprostřeny. Ve většině scénářů použijte maximální rozprostření, které používá co nejvíce domén selhání. Další informace najdete v tématu Volba správného počtu domén selhání pro škálovací sady virtuálních počítačů.
V oblastech, které mají zóny dostupnosti, má každá zóna odlišnou sadu domén selhání. Když vytvoříte škálovací sadu, která se rozpíná přes zóny, instance se rozdělí mezi domény selhání v každé zóně, kterou vaše škálovací sada používá.
Vyrovnávání zatížení
Škálovací sady se můžou integrovat se službami vyrovnávání zatížení Azure, včetně Azure Load Balanceru a Azure Application Gateway. Když škálovací sada přidá nebo odebere instance, integrovaná integrace nástroje pro vyrovnávání zatížení automaticky aktualizuje konfiguraci nástroje pro vyrovnávání zatížení. Další informace naleznete v tématu Sítě pro škálovací sady virtuálních počítačů.
Škálovací sady zahrnují mnoho dalších ovládacích prvků a možností, které ovlivňují způsob nasazení, škálování, distribuci a aktualizace instancí. Další informace najdete v tématu Přehled škálovacích sad virtuálních počítačů.
Odolnost proti přechodným chybám
Přechodné chyby jsou krátká, přerušovaná selhání ve složkách. V distribuovaném prostředí, jako je cloud, se vyskytují často a jsou normální součástí provozu. Přechodné chyby se opravují po krátké době. Je důležité, aby vaše aplikace mohly zpracovávat přechodné chyby, obvykle opakováním ovlivněných požadavků.
Všechny aplikace hostované v cloudu by měly při komunikaci se všemi cloudovými rozhraními API, databázemi a dalšími komponentami postupovat podle pokynů pro zpracování přechodných chyb Azure. Další informace najdete v tématu Doporučení pro zpracování přechodných chyb.
Aplikace, které běží na vašich virtuálních počítačích, by měly implementovat vhodné strategie zpracování chyb, aby se zajistilo, že jakákoli dočasná přerušení služby neovlivní vaši úlohu.
Odolnost proti problémům s instancemi
Když škálovací sada zahájí úlohu vytvoření nebo odstranění instance virtuálního počítače, může operace selhat. Pokud chcete automaticky opakovat neúspěšné úlohy vytvoření nebo odstranění instance virtuálního počítače, zvažte použití odolné funkce vytvoření a odstranění pro škálovací sady virtuálních počítačů (Preview).
Při spuštění instancí může dojít k problémům. Instance může například přestat reagovat kvůli chybám aplikace nebo vyčerpání prostředků. Pomocí automatických oprav instancí můžete monitorovat stav aplikace a automaticky restartovat, znovu naimazovat nebo v případě potřeby nahradit instanci virtuálního počítače.
Odolnost proti chybám zóny dostupnosti
Zóny dostupnosti jsou fyzicky oddělené skupiny datacenter v rámci oblasti Azure. Když jedna zóna selže, mohou služby přejít na jednu ze zbývajících zón.
Škálovací sady virtuálních počítačů podporují zóny dostupnosti jak v konfiguracích přesahujících zóny, tak v zónových konfiguracích.
Sada instancí pokrývající různé zóny šíří instance napříč několika vybranými zónami dostupnosti.
Rozprostření instancí virtuálních počítačů napříč zónami dostupnosti poskytuje nejvyšší smlouvu SLA. Doporučujeme, abyste pro většinu úloh založených na virtuálních počítačích v Azure použili měřítka překračující zóny.
Ve škálovací sadě zahrnující zónu jsou každá instance virtuálního počítače a její disky svázané s konkrétní zónou dostupnosti. Pokud jsou všechny zóny v pořádku, můžou instance komunikovat napříč zónami pomocí vysoce výkonné sítě s nízkou latencí. Pokud u zóny dojde k problému s výpadkem nebo připojením, zůstanou instance v ostatních zónách nedotknuty.
Ve výchozím nastavení sada škálování používá nejlepší úsilí pro rovnoměrné rozložení instancí napříč vybranými zónami. Pokud ale potřebujete přísné vyrovnávání, můžete změnit konfiguraci vyrovnávání zóny.
Následující diagram znázorňuje škálovací sadu pokrývající tři zóny s jednou instancí v každé zóně.
Rozšíření zón je podobné redundanci zón v jiných službách Azure, ale škálovací sady neposkytují automatickou replikaci dat mezi zónami nebo přepnutí při selhání, když jsou zóny nedostupné. V některých neobvyklých situacích může mít škálovací sada pro zóny nasazené také instance v jedné zóně, například když připojíte jednotlivé virtuální počítače v jedné zóně k flexibilní škálovací sadě, která má jednu instanci ve stejné zóně.
Poznámka:
Pokud používáte flexibilní režim orchestrace a připojíte, odpojíte nebo odeberete jednotlivé virtuální počítače, ujistěte se, že jsou virtuální počítače rozložené do více zón. Pokud jsou všechny virtuální počítače v jedné zóně, vaše škálovací sada nemusí být odolná vůči výpadku v této zóně.
Zónová škálovací sada, označovaná také jako zarovnaná zóna, umístí všechny její instance do jedné zóny dostupnosti, kterou zadáte. Každý virtuální počítač a jeho disky jsou zónové, takže jsou připnuté k této konkrétní zóně.
Důležité
Připnutí do jedné zóny dostupnosti se doporučuje jenom v případě, že je latence napříč zónami pro vaše potřeby příliš vysoká a po ověření, že latence nesplňuje vaše požadavky. Samotný zónový prostředek neposkytuje odolnost vůči výpadku zóny dostupnosti. Chcete-li zlepšit odolnost zónového prostředku, musíte explicitně nasadit samostatné prostředky do více zón dostupnosti a nakonfigurovat směrování provozu a zajištění převzetí služeb při selhání. Další informace najdete v tématu Zónové prostředky a odolnost zón.
Následující diagram znázorňuje zónovou škálovací sadu v jedné zóně se třemi instancemi v této zóně.
Pokud pro škálovací sadu nezadáte zóny dostupnosti, je to nezonální nebo regionální. V tomto scénáři mohou být instance umístěny v jakékoli zóně v rámci oblasti a nemusí být rovnoměrně distribuovány nebo umístěny ve stejné zóně. Při použití nezonální škálovací sady je pro disky Úrovně Ultra a Premium v2 zaručeno umístění disku ve stejné zóně. Kolokace se poskytuje s maximálním úsilím pro disky Premium v1 a není zaručena pro disky na úrovni Standard SKU, včetně SSD (Solid-State Drive) nebo pevných disků (HDD). Pokud nějaká zóna v oblasti selže, může dojít k výpadku vaší škálovací sady.
Požadavky
Podpora oblastí: Můžete nasadit škálovací sady, které pokrývají zóny a zónové škálovací sady, do libovolné oblasti, která podporuje zóny dostupnosti.
Některé typy a velikosti virtuálních počítačů jsou ale dostupné jenom v konkrétních oblastech nebo v konkrétních zónách v rámci oblasti. Pokud chcete zkontrolovat, které oblasti a zóny podporují typy virtuálních počítačů, které potřebujete, použijte následující zdroje informací:
Pokud chcete zkontrolovat typy virtuálních počítačů dostupné v jednotlivých oblastech, podívejte se na produkty dostupné v jednotlivých oblastech.
Informace o podporovaných typech a velikostech virtuálních počítačů v jednotlivých zónách konkrétní oblasti najdete v tématu Kontrola dostupnosti skladové položky virtuálního počítače.
Pokud konkrétní skladová položka virtuálního počítače není dostupná v žádné z zón, které vyberete pro škálovací sadu, nemusí být škálovací sada schopná škálovat kapacitu tak, aby splňovala vaše požadavky na kapacitu.
Vyhrazení hostitelé: Nasazení Azure Dedicated Host nepodporují zónovou nebo zónově škálovatelnou sadu.
Typy: Podpora zóny dostupnosti je dostupná pro všechny typy škálovacích sad, včetně flexibilních a jednotných škálovacích sad.
Úvahy
Šíření domény selhání: Pokud škálovací sada používá zóny dostupnosti, musíte vybrat konkrétní přístupy k šíření domény selhání. Pro většinu úloh doporučujeme použít maximální rozložení, které používá co nejvíce domén selhání. Další informace najdete v tématu Volba správného počtu domén selhání pro škálovací sady virtuálních počítačů.
Vyrovnávání zóny:Vyrovnávání zóny určuje, jestli se instance virtuálních počítačů ve škálovací sadě rovnoměrně distribuují napříč vybranými zónami. Škálovací sada se považuje za vyváženou, pokud každá zóna má stejný počet virtuálních počítačů plus nebo minus jeden virtuální počítač. Režim vyrovnávání zóny můžete nastavit tak, aby byl co nejlépe nebo striktní. Toto nastavení určuje, jestli se škálovací sada může nerovnoměrně škálovat, včetně scénářů výpadků zón.
Skupiny umístění: Pokud pro jednotné škálovací sady nakonfigurujete více skupin umístění, Azure nasadí do každé zóny, kterou vaše škálovací sada používá, několik skupin umístění.
Náklady
Mezi zónově rozšířenou, zónovou a nezonální škálovací sadou, která má stejný počet a typ instancí virtuálních počítačů, neexistuje žádný cenový rozdíl.
Konfigurujte podporu zón dostupnosti
Tato část vysvětluje, jak nakonfigurovat podporu zón dostupnosti pro vaši škálovací sadu.
Vytvořte škálovací sadu přesahující zóny nebo zónovou škálovací sadu. Zóny dostupnosti můžete nakonfigurovat při vytváření nové škálovací sady. Další informace najdete v tématu Vytvoření škálovací sady virtuálních počítačů, která používá zóny dostupnosti.
Poznámka:
Když vyberete, které zóny dostupnosti se mají použít, ve skutečnosti vybíráte logickou zónu dostupnosti. Pokud nasadíte jiné součásti úloh v jiném předplatném Azure, můžou pro přístup ke stejné zóně fyzické dostupnosti použít jiné číslo logické zóny dostupnosti. Další informace najdete v tématu Fyzické a logické zóny dostupnosti.
Převeďte existující škálovací sady tak, aby používaly zóny dostupnosti. Existující nezonální (regionální) škálovací sadu můžete převést tak, aby používala zóny dostupnosti. Další informace najdete v tématu Aktualizace škálovacích sad pro přidání zón dostupnosti.
Změňte konfiguraci zóny dostupnosti existující škálovací sady. Do existující škálovací sady můžete přidat zóny, ale zóny se nedají odebrat. Další informace najdete v tématu Aktualizace škálovacích sad pro přidání zón dostupnosti.
Důležité
Když škálovací sadu rozšíříte na více zón, původní instance virtuálních počítačů se okamžitě nemigrují ani nemění. Při škálování se vytvoří nové instance a rovnoměrně se rozmístí mezi vybrané zóny dostupnosti. Pokud potřebujete data z původních instancí, zodpovídáte za migraci dat do instancí v nových zónách. Při škálování ve škálovací sadě se nejprve upřednostní všechny regionální instance pro odebrání. Instance se pak odeberou na základě zásad škálování škálovací sady. Další informace najdete v tématu Ruční vyvážení škálovací sady.
Plánování a řízení kapacit
Pokud se chcete připravit na selhání zóny dostupnosti, zvažte nadměrné přidělení počtu instancí virtuálních počítačů ve škálovací sadě. Tento přístup umožňuje řešení tolerovat určité ztráty kapacity a nadále fungovat bez sníženého výkonu a zajišťuje, aby zbývající zóny měly dostatečnou kapacitu pro zvládnutí plného produkčního zatížení. Další informace najdete v tématu Správa kapacity pomocí nadměrného zřizování.
Chování, když jsou všechny zóny v pořádku
Tato část popisuje, co očekávat, když jsou škálovací sady nakonfigurované s podporou zóny dostupnosti a všechny zóny dostupnosti jsou funkční.
Směrování provozu mezi zónami: Zodpovídáte za směrování provozu mezi virtuálními počítači ve škálovací sadě, včetně virtuálních počítačů, které jsou v různých zónách dostupnosti. Mezi běžné přístupy patří Load Balancer a Application Gateway, které poskytují integrovanou integraci se škálovacími sadami. Další informace naleznete v tématu Sítě pro škálovací sady virtuálních počítačů.
Replikace dat mezi zónami: Zodpovídáte za veškerou replikaci dat, ke které musí dojít mezi virtuálními počítači, včetně virtuálních počítačů v různých zónách dostupnosti. Databáze a další podobné stavové aplikace, které běží na virtuálních počítačích, často poskytují možnosti replikace dat.
Chování při selhání zóny
Tato část popisuje, co očekávat, když jsou škálovací sady nakonfigurované s podporou zóny dostupnosti a dojde k výpadku v jejich zónách dostupnosti.
Detekce a odpověď: Zodpovídáte za zjištění ztráty zóny dostupnosti a rozhodování, jak reagovat.
V případě škálovacích sad pro zóny můžou být všechny instance virtuálních počítačů v ovlivněné zóně nedostupné. Instance ve zdravých zónách zůstávají funkční.
U zónových škálovacích sad nasazených v ovlivněné zóně nemusí být všechny instance virtuálních počítačů dostupné. Musíte naplánovat, jak reagovat na selhání zóny. Můžete například přesměrovat provoz do jiné škálovací sady v jiné zóně nebo oblasti.
- Oznámení: Microsoft vás automaticky neoznámí, když je zóna mimo provoz. Azure Resource Health ale můžete použít k monitorování stavu jednotlivých prostředků a můžete nastavit upozornění služby Resource Health , která vás upozorní na problémy. Pomocí služby Azure Service Health můžete také porozumět celkovému stavu služby, včetně jakýchkoli selhání zón, a můžete nastavit upozornění služby Service Health , která vás upozorní na problémy.
Aktivní požadavky: Všechny aktivní požadavky nebo jiná práce, ke kterým dochází na virtuálních počítačích v ovlivněné zóně dostupnosti, budou pravděpodobně ukončeny.
Očekávaná ztráta dat: Při selhání zóny můžou být disky virtuálních počítačů zón nedostupné.
Pokud použijete disky zónově redundantního úložiště (ZRS) a výpadek ovlivní váš virtuální počítač, můžete vynutit odpojení disků ZRS od neúspěšného virtuálního počítače. Tento přístup umožňuje připojit disky ZRS k jinému virtuálnímu počítači.
Očekávaný výpadek: Všechny virtuální počítače v ovlivněné zóně zůstanou v výpadku, dokud se zóna dostupnosti neobnoví. Pokud používáte škálovací sady přesahující zóny, virtuální počítače umístěné ve zdravých zónách budou dál fungovat.
Přesměrování provozu: Zodpovídáte za přesměrování provozu na jiné virtuální počítače v zónách, které jsou v pořádku.
Pokud nakonfigurujete zónově odolný nástroj pro vyrovnávání zatížení, který provádí kontroly stavu, nástroj pro vyrovnávání zatížení obvykle zjistí neúspěšné virtuální počítače a může směrovat provoz do jiných instancí virtuálních počítačů v zónách v pořádku.
Nahrazení instance: Služba Virtual Machine Scale Sets nezaručuje automatické přidávání nových instancí do zdravých zón.
Pokud máte škálovací sadu, která se rozkládá přes zóny, můžete škálovat do více instancí. Pokud je selhání zóny omezené na konkrétní sady serverů v této zóně, operace škálování může do stejné zóny přidat funkční instance, nebo přidat instance do jiných zón. Pokud však sada škálování používá přísné vyrovnávání zón, sada škálování blokuje operace horizontálního navýšení kapacity, které způsobují nerovnováhu.
Návod
Je vhodné nakonfigurovat pravidla automatického škálování na základě využití procesoru nebo paměti. Pravidla automatického škálování umožňují škálovací sadě reagovat na ztrátu instancí virtuálních počítačů v zóně horizontálním navýšením kapacity a přidáním nových instancí do zbývajících provozních zón.
Obnovení zóny
Pokud je zóna v pořádku, virtuální počítače v zóně se restartují. Zodpovídáte za všechny postupy obnovení zóny a synchronizaci dat, které vaše úlohy vyžadují.
Pokud do škálovací sady přidáte dočasné instance během selhání zóny, může být při obnovení zóny potřeba vertikálně snížit kapacitu škálovací sady na původní kapacitu.
Testování poruch zón
Azure Chaos Studio můžete použít k simulaci ztráty virtuálních počítačů v jedné nebo více zónách dostupnosti v rámci experimentu. Chaos Studio poskytuje zabudované poruchy pro škálovací sady, včetně možnosti vypnout virtuální počítače v konkrétních zónách. Pomocí těchto možností můžete simulovat selhání na úrovni zóny a otestovat procesy převzetí služeb při selhání.
Odolnost proti selháním v celé oblasti
Škálovací sady jsou prostředky omezené na jeden region. Pokud oblast není dostupná, nebudou k dispozici také všechny škálovací sady v dané oblasti.
Vlastní řešení pro více regionů pro odolnost systémů
Do různých oblastí můžete nasadit několik škálovacích sad, ale potřebujete implementovat procesy replikace, vyrovnávání zatížení a převzetí služeb při selhání. Můžete například nasadit stejné škálovací sady ve více oblastech a ke směrování provozu použít Azure Front Door nebo Azure Traffic Manager se sondami stavu. Zodpovídáte za replikaci stavu pomocí mechanismů aplikace nebo spravovaných datových služeb.
Zálohování a obnovení
Azure Backup poskytuje nativní podporu zálohování virtuálních počítačů. Azure Backup vytváří a spravuje zálohy a poskytuje ochranu konzistentní vzhledem k aplikacím pro celý virtuální počítač včetně všech připojených disků. Řešení zálohování virtuálních počítačů se službou Azure Backup je ideální v případě, že potřebujete koordinované zálohování více disků nebo záloh pracujících s aplikacemi. U databázových úloh ale zvažte řešení zálohování specifická pro aplikace, která poskytují ochranu konzistentní vzhledem k transakcím a rychlejší možnosti obnovení.
Pomocí služby Azure Backup pro virtuální počítače můžete přizpůsobit frekvenci zálohování, dobu uchování a konfiguraci úložiště tak, aby vyhovovala vašim potřebám. Další informace najdete v tématu Azure Backup pro virtuální počítače.
Zálohování také podporuje disky připojené k virtuálním počítačům. Další informace najdete v tématu Přehled zálohování disků Azure.
U většiny řešení byste se neměli spoléhat výhradně na zálohy. Místo toho využijte další funkce popsané v tomto průvodci k podpoře vašich požadavků na odolnost. Zálohy ale chrání před některými riziky, která jiné přístupy nechrání. Další informace najdete v tématu Co jsou redundance, replikace a zálohování?.
Odolnost proti rekonfiguraci virtuálního počítače
Škálovací sady vám umožňují řídit, jak uplatňujete změny konfigurace na vaše virtuální počítače, například změnou SKU virtuálního počítače, změnou image, kterou používá každý virtuální počítač, a přidáním nebo odebráním rozšíření VM. Můžete řídit režim zásad upgradu, který určuje způsob použití upgradů. Další informace najdete v tématu Režimy zásad upgradu pro škálovací sady virtuálních počítačů.
Některé typy upgradu vyžadují reimaging nebo opětovné nasazení instance. Pokud chcete vyloučit konkrétní instance z automatických upgradů, zvažte použití ochrany instancí. Můžete vyloučit instance, které obsahují stav, který potřebujete zachovat nebo nakonfigurovat, které nemůžete replikovat do jiných instancí.
Odolnost vůči údržbě služeb
Azure pravidelně provádí aktualizace za účelem zlepšení spolehlivosti, výkonu a zabezpečení hostitelské infrastruktury pro virtuální počítače. Škálovací sady poskytují několik způsobů, jak porozumět plánované údržbě a řídit je:
Oznámení o plánované údržbě vám řeknou, kdy je údržba splatná, a umožňují řídit, kdy k údržbě dojde.
Konfigurace údržby umožňují naplánovat časové období údržby v době, která vyhovuje vašim obchodním potřebám.
Plánované události pro virtuální počítače s Linuxem a pro virtuální počítače s Windows poskytují vaší aplikaci čas na přípravu na údržbu virtuálních počítačů. Poskytuje informace o nadcházejících událostech údržby, jako je restartování, aby se vaše aplikace na ně připravila a omezila přerušení.
Smlouva o úrovni služeb
Smlouva o úrovni služeb (SLA) pro služby Azure popisuje očekávanou dostupnost každé služby a podmínky, které musí vaše řešení splnit, aby bylo dosaženo očekávané dostupnosti. Další informace najdete v tématu Smlouvy SLA pro online služby.
Škálovací sady virtuálních počítačů sdílejí smlouvu SLA o dostupnosti pro virtuální počítače. Vyšší procento doby provozu pro virtuální počítače můžete dosáhnout pomocí škálovací sady, která splňuje obě následující kritéria:
- Škálovací sada obsahuje dvě nebo více instancí.
- Škálovací sada tyto instance rozloží do dvou nebo více zón dostupnosti.