Project Flash – Pokročilé monitorování dostupnosti virtuálních počítačů Azure

Flash, protože projekt je interně známý, odvozuje jeho název z našeho stálého závazku k vytvoření robustního, spolehlivého a rychlého mechanismu, který zákazníkům umožňuje monitorovat stav virtuálního počítače. Naším primárním cílem je zajistit, aby zákazníci mohli spolehlivě přistupovat k použitelné a přesné telemetrii, rychle dostávat upozornění na změny a pravidelně monitorovat data ve velkém měřítku. Klademe také důraz na rozvoj centralizovaného a koherentního prostředí, které zákazníci mohou pohodlně využít ke splnění svých jedinečných pozorovatelných požadavků. Naším úkolem je zajistit, abyste mohli:

  • Využití přesných a použitelných dat o přerušení dostupnosti virtuálních počítačů (například restartování a restartování virtuálních počítačů, zablokování aplikace kvůli aktualizacím síťového ovladače a aktualizacím 30sekundového hostitelského operačního systému) spolu s přesnými podrobnostmi o selhání (například platforma versus restartování, restartování nebo zablokování, plánované a neplánované).
  • Analyzujte a upozorňovat na trendy v dostupnosti virtuálních počítačů za účelem rychlého ladění a generování sestav za měsíc.
  • Pravidelně monitorujte data ve velkém měřítku a vytvářejte vlastní řídicí panely, abyste zůstali aktuální o nejnovějších stavech dostupnosti všech prostředků.
  • Získejte analýzy automatizovaných hlavních příčin (RCA) s podrobnostmi o ovlivněných virtuálních počítačích, příčinách výpadků a době trvání, následných opravách a podobných opravách – to vše pro povolení cílových šetření a následných analýz.
  • Získejte okamžitá oznámení o kritických změnách dostupnosti virtuálního počítače, abyste mohli rychle aktivovat nápravné akce a zabránit dopadu koncových uživatelů.
  • Dynamicky přizpůsobovat a automatizovat zásady obnovení platformy na základě stále se měnících citlivostí úloh a potřeb převzetí služeb při selhání

Řešení Flash

Iniciativa Flash je vyhrazená pro vývoj řešení v průběhu let, která se zaměřují na různorodé potřeby monitorování našich zákazníků. Pokud potřebujete pomoct určit nejvhodnější řešení pro monitorování Flash pro vaše konkrétní požadavky, projděte si následující tabulku:

Řešení Popis
Azure Resource Graph (obecná dostupnost) V případě šetření ve velkém, centralizovaného úložiště prostředků a vyhledávání historie chtějí velké zákazníky pravidelně využívat telemetrii dostupnosti prostředků napříč všemi úlohami najednou pomocí Azure Resource Graphu (ARG).
Téma systému Event Gridu (Public Preview) Pokud chcete aktivovat časově citlivá a kritická zmírnění rizik (opětovné nasazení, restartování akcí virtuálních počítačů), aby se zabránilo dopadu koncového uživatele, zákazníci (například Pearl Abyss, Krafton) chtějí dostávat upozornění během několika sekund od kritických změn dostupnosti prostředků prostřednictvím obslužných rutin událostí ve službě Event Grid.
Azure Monitor (Public Preview) Zákazníci chtějí prostřednictvím služby Azure Monitor sledovat trendy, agregovat metriky platformy (procesor, disk atd.) a nastavit přesné upozornění na základě prahových hodnot.
Resource Health (obecná dostupnost) Pokud chcete provádět okamžité a pohodlné kontroly stavu uživatelského rozhraní portálu pro jednotlivé prostředky, můžou zákazníci rychle zobrazit okno RHC na portálu. Můžou také získat přístup k 30dennímu historickému zobrazení kontrol stavu pro daný prostředek pro rychlé a snadné řešení potíží.

Holistické monitorování dostupnosti virtuálních počítačů

Pro holistický přístup k monitorování dostupnosti virtuálních počítačů, včetně scénářů rutinní údržby, migrace za provozu, opravy služeb a snížení výkonu virtuálních počítačů, doporučujeme využít plánované události (SE) i události stavu Flash.

Naplánované události jsou navržené tak, aby nabízely včasné upozornění a před aktivitami údržby upozorňující až na 15 minut předem. Tato doba předstihu vám umožní činit informovaná rozhodnutí týkající se nadcházejícího výpadku, což vám umožní vyhnout se nebo se na ni připravit. Během tohoto 15minutového období můžete buď tyto události potvrdit, nebo zpozdit akce v závislosti na připravenosti na nadcházející údržbu.

Na druhou stranu se události stavu Flash zaměřují na sledování probíhajících a dokončených přerušení dostupnosti v reálném čase, včetně snížení výkonu virtuálních počítačů. Tato funkce vám umožňuje efektivně monitorovat a spravovat výpadky, podporovat automatizované zmírnění rizik, vyšetřování a analýzu po mortem.

Abyste mohli začít na cestě k pozorovatelnosti, můžete prozkoumat sadu produktů Azure, do kterých vysíláme vysoce kvalitní data o dostupnosti virtuálních počítačů. Mezi tyto produkty patří stav prostředků, protokoly aktivit, Graf prostředků Azure, metriky služby Azure Monitor a téma systému Azure Event Grid.

Další kroky

Další informace o nabízených řešeních najdete v příslušném článku o řešení:

Obecný přehled o monitorování virtuálních počítačů Azure najdete v tématu Monitorování virtuálních počítačů Azure a referenční informace k monitorování virtuálních počítačů Azure.