Přehled pilíře spolehlivosti

Spolehlivost zajišťuje, že vaše aplikace dokáže splňovat závazky, které uděláte pro vaše zákazníky. Navrhování odolnosti v architektuře aplikace zajišťuje, že vaše úlohy jsou dostupné a můžou se zotavit z selhání v libovolném měřítku.

Vytváření pro spolehlivost zahrnuje:

  • Zajištění vysoce dostupné architektury
  • Zotavení z selhání, jako je ztráta dat, velký výpadek nebo incidenty ransomwaru

Pokud chcete posoudit spolehlivost úloh pomocí tenetů, které najdete v rozhraní Microsoft Azure Well-Architected Framework, projděte si kontrolu Well-Architected Microsoft Azure.

Další informace najdete v následujícím videu o hlubším prozkoumání spolehlivosti úloh Azure:


Tradiční vývoj aplikací se obvykle zaměřoval na prodloužení střední doby mezi poruchami (MTBF). Úsilí se věnovalo snaze předejít selhání systému. Vcloudch

  • Distribuované systémy jsou komplexní a selhání v jednom bodě se potenciálně může kaskádovitě přenést na celý systém.
  • Nákladynachm prostředkům se v cloudových prostředích udržují nízké, takže občas se musí očekávat selhání hardwaru.
  • Aplikace jsou často závislé na externích službách, které mohou být dočasně nedostupné nebo mohou omezovat uživatele s vysokým objemem žádostí.
  • Dnešní uživatelé očekávají aplikaci, která bude dostupná 24 hodin denně 7 dní v týdnu a nikdy nebude mít výpadek.

Všechny tyto faktory znamenají, že cloudové aplikace je nutné navrhovat s očekáváním příležitostných selhání a jejich náprav. Mnoho funkcí týkajících se odolnosti proti chybám je součástí platformy Azure. Příklad:

  • Azure Storage, Azure SQL Database a Azure Cosmos DB poskytují integrovanou replikaci dat napříč zónami dostupnosti a oblastmi.
  • Spravované disky Azure se automaticky umísťují do odlišných uložišť jednotek škálování, aby se omezily následky selhání hardwaru.
  • Virtuální počítače ve skupině dostupnosti jsou rozložené do několika domén selhání. Doména selhání je skupina virtuálních počítačů, které sdílejí společný zdroj napájení a síťový přepínač. Rozmístění virtuálních počítačů napříč několika doménami selhání omezuje dopady fyzických selhání hardwaru, výpadků sítě nebo přerušení napájení.
  • Zóny dostupnosti jsou fyzicky oddělená umístění v rámci každé oblasti Azure. Každá zóna se skládá z jednoho nebo více datacenter vybavených nezávislou napájecí, chladicí a síťovou infrastrukturou. Díky zónám dostupnosti můžete navrhovat a pracovat s aplikacemi a databázemi, které automaticky přecházejí mezi zónami bez přerušení, což zajišťuje odolnost v případě, že dojde k ovlivnění jedné zóny. Další informace najdete v referenčních oblastech a Zóny dostupnosti v Azure.

Přesto je nutné odolnost proti chybám do aplikace zabudovat. Strategie odolnosti proti chybám je možné použít na všech úrovních architektury. Některá zmírnění rizik jsou v podstatě taktická – například opakování vzdáleného volání po přechodném selhání sítě. Jiná zmírnění rizik jsou zase strategičtější – například převzetí služby při selhání celé aplikace sekundární oblastí. Taktické zmírnění rizik může mít velký rozdíl. I když je pro celou oblast vzácnější, aby došlo k přerušení, přechodné problémy, jako je zahlcení sítě, jsou běžnější – proto nejprve zaměřte na tyto problémy. Správné monitorování a diagnostika jsou také důležité. Obě tyto funkce rozpoznávají poruchy, když nastanou, a hledají původní příčiny.

Při návrhu aplikace odolné proti chybám musíte rozumět svým požadavkům na dostupnost. Jak velká doba výpadku je přijatelná? Množství výpadků je částečně funkcí nákladů. Kolik bude případný výpadek vaši firmu stát? Kolik byste měli investovat do vysoké dostupnosti aplikace?

Témata a osvědčené postupy

Pilíř spolehlivosti se věnuje následujícím tématům a osvědčeným postupům, které vám pomůžou vytvořit odolnou úlohu:

Téma spolehlivosti Description
Principy spolehlivosti Tyto kritické principy se používají jako objektivy k posouzení spolehlivosti aplikace nasazené v Azure.
Návrh pro spolehlivost Zvažte, jak systémy používají Zóny dostupnosti, provádějí škálovatelnost, reagují na selhání a další strategie, které optimalizují spolehlivost návrhu aplikací.
Kontrolní seznam k odolnosti pro konkrétní služby Azure Každá technologie má vlastní konkrétní režimy selhání, které je potřeba zvážit při návrhu a implementaci aplikace. Pomocí tohoto kontrolního seznamu zkontrolujte aspekty odolnosti pro konkrétní služby Azure.
Požadavky na cíle a nefunkční požadavky Cílové a nefunkční požadavky, jako jsou cíle dostupnosti a cíle obnovení, umožňují měřit dobu provozu a výpadky vašich úloh. Mít jasně definované cíle je zásadní pro to, aby bylo možné pracovat a měřit proti.
Odolnost a závislosti Obnovení selhání systému by mělo být součástí fází architektury a návrhu od začátku, aby se zabránilo riziku selhání. Závislosti jsou vyžadovány, aby aplikace plně fungovala.
Zóny dostupnosti Zóny dostupnosti lze použít k rozložení řešení mezi více zón v rámci oblasti, což umožňuje aplikaci pokračovat v fungování v případě selhání jedné zóny.
Dostupnost služeb Dostupnost služeb napříč oblastmi Azure závisí na typu oblasti. Obecná zásada Azure týkající se nasazování služeb do jakékoli dané oblasti je primárně řízena typem oblasti, kategoriemi služeb a poptávkou zákazníků.
Terminologie zóny dostupnosti Pokud chcete lépe porozumět oblastem a zónám dostupnosti v Azure, pomůže vám pochopit klíčové termíny nebo koncepty.
Osvědčené postupy Během fáze architektury se soustřeďte na implementaci postupů, které splňují vaše obchodní požadavky, identifikujte body selhání a minimalizujte rozsah selhání.
Testování spolehlivosti Pravidelné testování by mělo být provedeno jako součást každé hlavní změny, aby bylo možné ověřit stávající prahové hodnoty, cíle a předpoklady.
Monitorování spolehlivosti Získejte celkový přehled o stavu aplikace. Pokud něco selže, potřebujete vědět , že selhala, když selhala, a proč.
Vzory spolehlivosti Aplikace musí být navrženy a implementovány tak, aby maximalizovaly dostupnost.

Další krok