Project Flash – Monitorování dostupnosti virtuálních počítačů Azure pomocí Azure Resource Graphu

Článek
08/24/2024

Azure Resource Graph je jedno řešení, které nabízí Flash. Flash je interní název projektu vyhrazeného pro vytvoření robustního, spolehlivého a rychlého mechanismu, který zákazníkům umožňuje monitorovat stav virtuálního počítače.

Tento článek popisuje použití Azure Resource Graphu k monitorování dostupnosti virtuálních počítačů Azure. Obecný přehled řešení Flash najdete v přehledu aplikace Flash.

Pro dokumentaci specifickou pro ostatní řešení, která flash nabízí, si vyberte z následujících článků:

Azure Resource Graph – HealthResources

Tato funkce je aktuálně obecně dostupná. Je užitečné provádět rozsáhlé šetření. Nabízí vysoce uživatelsky přívětivé prostředí pro načítání informací s použitím dotazovacího jazyka Kusto (KQL). Může také sloužit jako centrální centrum pro informace o prostředcích a umožňuje snadné načítání historických dat.

Kromě stavu dostupnosti virtuálních počítačů jsme publikovali poznámky k dostupnosti virtuálních počítačů do Azure Resource Graphu (ARG) pro podrobnou analýzu přiřazování selhání a výpadků spolu s povolením 14denního mechanismu sledování změn pro sledování historických změn v dostupnosti virtuálních počítačů pro rychlé ladění. S těmito novými doplňky s radostí oznamujeme obecnou dostupnost informací o dostupnosti virtuálních počítačů v datové sadě HealthResources v ARG! S touto nabídkou můžou uživatelé:

Efektivní dotazování na nejnovější snímek dostupnosti virtuálních počítačů napříč všemi předplatnými Azure najednou a s nízkou latencí pro pravidelné a celoplošné monitorování.
Přesné posouzení dopadu na smlouvy SLA pro celou celou řadu firem a rychlé spuštění rozhodujících opatření pro zmírnění rizik v reakci na narušení a typ podpisu selhání.
Nastavte vlastní řídicí panely tak, aby dohlížely na komplexní stav aplikací připojením informací o dostupnosti virtuálních počítačů s metadaty prostředků, které jsou přítomné v ARG.
Pomocí mechanismu sledování změn pro provádění podrobných šetření můžete sledovat relevantní změny dostupnosti virtuálních počítačů v průběhu 14 dnů.

Vzorové dotazy

Začínáme

Uživatelé se můžou dotazovat na ARG prostřednictvím PowerShellu, rozhraní REST API, Azure CLI nebo webu Azure Portal. Následující postup podrobně popisuje přístup k datům z webu Azure Portal.

Na webu Azure Portal přejděte do Průzkumníka služby Resource Graph.
Vyberte kartu Tabulka a kliknutím na tabulku HealthResources načtěte nejnovější snímek informací o dostupnosti virtuálních počítačů (stav dostupnosti a poznámky ke stavu).

V tabulce HealthResources jsou vyplněné dva typy událostí:

resourcehealth /availabilitystatuses

Tato událost označuje nejnovější stav dostupnosti virtuálního počítače na základě kontrol stavu provedených základní platformou Azure. Stavy dostupnosti, které aktuálně vysíláme pro virtuální počítače, jsou:

K dispozici: Virtuální počítač je spuštěný podle očekávání.
Nedostupné: Zjistili jsme přerušení normálního fungování virtuálního počítače, a proto se aplikace nespustí podle očekávání.
Neznámé: Platforma nemůže přesně zjistit stav virtuálního počítače. Uživatelé se obvykle můžou v aktualizovaném stavu vrátit za několik minut.

Pokud chcete dotazovat nejnovější stav dostupnosti virtuálního počítače, projděte si pole vlastností, které obsahuje následující podrobnosti:

Vzorek

{
 "targetResourceType": "Microsoft.Compute/virtualMachines",
 "previousAvailabilityState": "Available",
 "targetResourceId": "/subscriptions//resourceGroups//providers/Microsoft.Compute/virtualMachines/",
 "occurredTime": "2022-10-11T11:13:59.9570000Z",
 "availabilityState": "Unavailable"
 }

Popis vlastnosti

Vlastnost	Popis	Odpovídající kategorie stavu prostředků (RHC)
targetResourceType	Typ prostředku, pro který proudí data o stavu	resourceType
targetResourceId	ID zdroje	resourceId
occurredTime	Časové razítko, kdy platforma generuje nejnovější stav dostupnosti	eventTimestamp
previousAvailabilityState	Předchozí stav dostupnosti virtuálního počítače	previousHealthStatus
availabilityState	Aktuální stav dostupnosti virtuálního počítače	currentHealthStatus

Seznam úvodních dotazů pro další zkoumání těchto dat najdete v části HealthResources v dokumentaci k ukázkovým dotazům.

resourcehealth /resourceannotations (NOVĚ PŘIDANÉ)

Tato událost v kontextualizuje všechny změny dostupnosti virtuálního počítače tím, že podrobně popisuje nezbytné atributy selhání, které uživatelům pomůžou prozkoumat a zmírnit přerušení podle potřeby. Podívejte se na úplný seznam poznámek k dostupnosti virtuálních počítačů generovaných platformou. Tyto poznámky lze široce klasifikovat do tří kontejnerů:

Poznámky k výpadkům: Tyto poznámky se vygenerují, když platforma zjistí, že dostupnost virtuálního počítače přejde na nedostupný. (Například při neočekávaných chybových ukončeních hostitele, restartování operací opravy).
Informační poznámky: Tyto poznámky se vygenerují během aktivit roviny řízení bez dopadu na dostupnost virtuálních počítačů. (Například přidělení virtuálního počítače, zastavení, odstranění, spuštění). Obvykle se nevyžaduje žádná další akce zákazníka v reakci.
Degradované poznámky: Tyto poznámky se vygenerují, když se zjistí, že je dostupnost virtuálního počítače ohrožená. (Pokud například modely predikce selhání predikují degradovanou hardwarovou komponentu, která může způsobit restartování virtuálního počítače v libovolném okamžiku). Důrazně vyzýváme uživatele, aby se do konečného termínu zadaného ve zprávě poznámky znovu nasadily, aby nedošlo k neočekávané ztrátě dat nebo výpadků. V jednom z následujících scénářů můžete obdržet upozornění ve službě Azure Virtual Machine Scale Sets Resource Health nebo v protokolu aktivit:
- Virtuální počítače ve škálovacích sadách virtuálních počítačů Azure jsou v procesu zastavení, zrušení přidělení, odstranění nebo spuštění.
- Provedli jste operace horizontálního navýšení nebo snížení kapacity ve škálovacích sadách virtuálních počítačů.
- Výstraha indikuje, že agregovaný stav platformy škálovacích sad virtuálních počítačů je v přechodném stavu Degradováno.

Pokud chcete dotazovat přidružené poznámky k dostupnosti virtuálního počítače pro prostředek( pokud existuje), projděte si pole vlastností, které obsahuje následující podrobnosti:

Vzorek

{
 "targetResourceType": "Microsoft.Compute/virtualMachines", "targetResourceId": "/subscriptions//resourceGroups//providers/Microsoft.Compute/virtualMachines/",
 "annotationName": "VirtualMachineHostRebootedForRepair",
 "occurredTime": "2022-09-25T20:21:37.5280000Z",
 "category": "Unplanned",
 "summary": "We're sorry, your virtual machine isn't available because an unexpected failure on the host server. Azure has begun the auto-recovery process and is currently rebooting the host server. No further action is required from you at this time. The virtual machine will be back online after the reboot completes.",
 "context": "Platform Initiated",
 "reason": "Unexpected host failure"
 }

Popis vlastnosti

Vlastnost	Popis	Odpovídající RHC
targetResourceType	Typ prostředku, pro který proudí data o stavu	resourceType
targetResourceId	ID zdroje	resourceId
occurredTime	Časové razítko, kdy platforma vygeneruje nejnovější stav dostupnosti	eventTimestamp
annotationName	Název generované poznámky	eventName
reason	Stručný přehled dopadu dostupnosti pozorovaného zákazníkem	title
category	Označuje, jestli aktivita platformy, která aktivovala poznámku, byla plánovaná údržba nebo neplánovaná oprava. Toto pole se nevztahuje na události iniciované zákazníkem nebo virtuálním počítačem. Možné hodnoty: Plánované, Neplánované, Nepoužitelné, Null	category
kontext	Označuje, jestli aktivita, která aktivovala poznámku, byla způsobená autorizovaným uživatelem nebo procesem (iniciovaným zákazníkem), platformou Azure (iniciovanou platformou) nebo aktivitou v hostovaném operačním systému, které způsobily dopad na dostupnost (iniciovaný virtuální počítač). Možné hodnoty: Iniciované platformou, iniciované uživatelem, inicializováno virtuální počítač, nepoužitelné, Null	kontext
Souhrn	Prohlášení s podrobnostmi o příčině emisí poznámek spolu s nápravnými kroky, které mohou uživatelé provést	Souhrn

Seznam úvodních dotazů pro další zkoumání těchto dat najdete v části HealthResources v dokumentaci k ukázkovým dotazům.

Pro metadata poznámek, která se nacházejí v datové sadě HealthResources, plánujeme několik vylepšení. Díky těmto rozšiřováním mají uživatelé přístup k bohatším atributům selhání, aby mohli rozhodujícím způsobem připravit odpověď na přerušení. Současně se snažíme prodloužit dobu trvání historického zpětného vyhledávání na minimálně 30 dnů, aby uživatelé mohli komplexně sledovat minulé změny dostupnosti virtuálních počítačů.

Další kroky

Další informace o nabízených řešeních najdete v příslušném článku o řešení:

Obecný přehled o monitorování virtuálních počítačů Azure najdete v tématu Monitorování virtuálních počítačů Azure a referenční informace k monitorování virtuálních počítačů Azure.

Sdílet prostřednictvím

Project Flash – Monitorování dostupnosti virtuálních počítačů Azure pomocí Azure Resource Graphu

Azure Resource Graph – HealthResources

Vzorové dotazy

Začínáme

Vzorek

Popis vlastnosti

Vzorek

Popis vlastnosti

Další kroky

Váš názor

Další materiály