Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Azure Managed Grafana poskytuje hostované pracovní prostory Grafana pro vytváření řídicích panelů a vizualizací. Microsoft spravuje veškerou základní infrastrukturu, včetně výpočetních prostředků, sítí, úložiště a aktualizací služeb.
Při použití Azure je spolehlivost sdílenou odpovědností. Microsoft poskytuje řadu funkcí pro podporu odolnosti a obnovení. Zodpovídáte za pochopení toho, jak tyto možnosti fungují ve všech službách, které používáte, a výběrem možností, které potřebujete ke splnění vašich obchodních cílů a cílů dostupnosti.
Tento článek popisuje, jak zajistit odolnost Azure Managed Grafana vůči nejrůznějším potenciálním výpadkům a problémům, včetně přechodných chyb, výpadků zón dostupnosti a výpadků oblastí. Popisuje také, jak můžete zálohovat a obnovovat z jiných typů problémů a zvýrazňuje klíčové informace o smlouvě o úrovni služeb (SLA) Azure Managed Grafana.
Doporučení pro produkční nasazení pro spolehlivost
Pokud chcete zvýšit spolehlivost produkčních nasazení pomocí Azure Managed Grafana, doporučujeme provést následující akce:
Při vytváření pracovního prostoru povolte redundanci zón, abyste zajistili odolnost proti chybám zóny dostupnosti.
Storové řídicí panely a další prostředky Grafana jako kód, například jejich exportem z rozhraní API Grafany nebo rozhraní příkazového řádku a jejich uložením do úložiště správy zdrojového kódu, jako je GitHub. Pomocí kanálů kontinuální integrace a průběžného doručování (CI/CD) nasaďte řídicí panely do Azure Managed Grafana. Tento přístup podporuje scénáře obnovení. V případě potřeby také umožňuje nasazení do několika instancí Grafana, včetně instancí v různých Azure oblastech.
Přehled architektury spolehlivosti
Tato část popisuje některé důležité aspekty fungování služby, které jsou z hlediska spolehlivosti nejrelevantní. Tato část představuje logickou architekturu, která obsahuje některé prostředky a funkce, které nasazujete a používáte. Popisuje také fyzickou architekturu, která poskytuje podrobnosti o tom, jak služba funguje v zákulisí.
Logická architektura
Primárním prostředkem Azure, který nasadíte, je workspace. Po nasazení pracovního prostoru použijete koncový bod Grafana pracovního prostoru ke konfiguraci a interakci se zdroji dat, řídicími panely, vizualizacemi a dalšími prostředky Grafany.
Fyzická architektura
Při vytváření pracovního prostoru interně zřídí platforma Azure následující základní komponenty:
Servery Grafana: Vyhrazené virtuální počítače, na kterých běží aplikace Grafana. Ve výchozím nastavení jsou pro vysokou dostupnost a redundanci zřízeny dva servery. Microsoft tyto servery plně spravuje. Nevidíte je ve svém předplatném, nemůžete k nim přistupovat a nejste zodpovědní za opravy, škálování ani údržbu.
Nástroj pro vyrovnávání zatížení: Nástroj pro vyrovnávání zatížení sítě, který distribuuje příchozí požadavky prohlížeče mezi servery Grafana. Nástroj pro vyrovnávání zatížení monitoruje stav serveru a automaticky směruje provoz ze serverů, které nejsou v pořádku.
Backend database: Databáze Azure Database for PostgreSQL, která ukládá konfiguraci pracovního prostoru a další trvalá data. Všechny servery Grafana v pracovním prostoru sdílejí tuto databázi. Další informace o odolnosti databáze najdete v tématu Reliability in Azure Database for PostgreSQL.
Tyto komponenty nevidíte ani nespravujete. Microsoft je nasazuje a spravuje vaším jménem.
Nástroj pro vyrovnávání zatížení sleduje, které servery Grafana jsou k dispozici. Pokud jeden server není v nastavení se dvěma servery v pořádku, nástroj pro vyrovnávání zatížení odešle všechny požadavky na zbývající server. Tento server přebírá relace prohlížeče, které dříve zpracovával selhavší server, na základě informací ve sdílené databázi. Mezitím Azure Managed Grafana opraví nebo nahradí server, který není v pořádku.
Diagram architektury znázorňující Azure Managed Grafana pracovní prostor za sdílenou bránou Nástroj pro vyrovnávání zatížení distribuuje provoz na dva servery Grafana, které se připojují ke sdílené databázi.
Odolnost proti přechodným chybám
Přechodné chyby jsou krátká, přerušovaná selhání ve složkách. V distribuovaném prostředí, jako je cloud, se vyskytují často a jsou normální součástí provozu. Přechodné chyby se opravují po krátké době. Je důležité, aby vaše aplikace mohly zpracovávat přechodné chyby, obvykle opakováním ovlivněných požadavků.
Všechny aplikace hostované v cloudu by měly postupovat podle Azure pokynů pro zpracování přechodných chyb, když komunikují s libovolnými rozhraními API, databázemi a dalšími komponentami hostovanými v cloudu. Další informace najdete v tématu Doporučení pro zpracování přechodných chyb.
Klientské aplikace můžete vytvářet pro interakci s pracovním prostorem Grafana prostřednictvím rozhraní Grafana API. Ujistěte se, že tyto aplikace dodržují příslušné pokyny Azure pro opakování neúspěšných požadavků.
Odolnost proti chybám zóny dostupnosti
zóny dostupnosti jsou fyzicky oddělené skupiny datacenter v rámci Azure oblasti. Když jedna zóna selže, mohou služby přejít na jednu ze zbývajících zón.
Azure Managed Grafana pracovní prostory podporují redundanci zón v podporovaných Azure regionech. Pokud je povolená redundance zón, servery Grafana pracovního prostoru se distribuují napříč několika zónami dostupnosti. Microsoft vybere zóny, které váš pracovní prostor používá. Další prostředky, jako je nástroj pro vyrovnávání zatížení sítě, databáze a sdílená brána, jsou také nakonfigurované tak, aby používaly více zón dostupnosti.
Diagram architektury znázorňující pracovní prostor Azure Managed Grafana nasazený ve třech zónách dostupnosti Nástroj pro vyrovnávání zatížení směruje provoz na servery Grafana v zóně 1 a 2 a sdílené databázi, která zahrnuje všechny zóny.
Pokud nepovolíte redundanci zón, pracovní prostor je nezonální nebo regionální, což znamená, že servery a další komponenty můžou být umístěné v jakékoli zóně dostupnosti v rámci oblasti nebo ve stejné zóně. Pokud má nějaká zóna dostupnosti v dané oblasti problém, může dojít k výpadku vašeho pracovního prostoru.
Požadavky
Podpora oblastí: Podpora redundance zón je dostupná v následujících oblastech.
| Severní a Jižní Amerika | Evropa | Asie a Tichomoří |
|---|---|---|
| USA – východ | Severní Evropa | Austrálie – východ |
| Střed USA – jih | Východní Asie | |
| USA – západ 3 |
Náklady
Redundance zón přidává další náklady. Pro více informací viz ceníky služby Azure Managed Grafana.
Konfigurujte podporu zón dostupnosti
Vytvoření nového pracovního prostoru s povolenými zónami dostupnosti: Povolení redundance zón během vytváření pracovního prostoru prostřednictvím portálu Azure, Azure CLI, Bicep nebo šablon Azure Resource Manager (šablon ARM).
Další informace najdete v tématu Povolit zónovou redundanci v Azure Managed Grafana.
Konfigurace redundance zón v existujícím pracovním prostoru: V existujícím pracovním prostoru nemůžete povolit ani zakázat redundanci zón. Místo toho musíte vytvořit nový pracovní prostor, který používá požadovanou konfiguraci redundance zón, migrovat řídicí panely a konfiguraci a pak odstranit existující pracovní prostor.
Chování, když jsou všechny zóny v pořádku
Tato část popisuje, co očekávat, když nakonfigurujete zónově redundantní pracovní prostor a všechny zóny dostupnosti jsou funkční.
Směrování provozu mezi zónami: Zónově redundantní nástroj pro vyrovnávání zatížení automaticky distribuuje příchozí požadavky mezi servery Grafana. Oba servery můžou zpracovávat provoz.
Replikace dat mezi zónami: Změny dat pracovního prostoru se synchronně replikují napříč několika zónami dostupnosti. Azure Database for PostgreSQL provádí replikaci dat. Další informace najdete v tématu Reliability in Azure Database for PostgreSQL. Azure Managed Grafana neimplementuje další logiku vlastní replikace nad rámec toho, co poskytuje databázová platforma.
Chování při selhání zóny
Tato část popisuje, co očekávat, když nakonfigurujete zónově redundantní pracovní prostor a v jedné z zón dojde k výpadku.
- Detection a response: Platforma Azure detekuje a reaguje na selhání v zóně dostupnosti. Nemusíte zahájit převzetí zóny při selhání.
- Notification: Microsoft vás při výpadku zóny automaticky neoznámí. Pomocí Azure Resource Health ale můžete monitorovat stav jednotlivých prostředků a můžete nastavit výstrahy Resource Health, které vás upozorní na problémy. Můžete také použít Azure Service Health k pochopení celkového stavu služby, včetně jakýchkoli selhání zóny, a můžete nastavit upozornění služby Service Health, která vás upozorní na problémy.
Očekávaná ztráta dat: Během výpadku zóny dostupnosti se neočekává žádná ztráta dat.
Očekávaný výpadek: U vašeho pracovního prostoru může docházet k malému výpadku, obvykle omezenému na několik sekund, zatímco provoz se směruje na servery, které jsou v pořádku. Zajistěte, aby klientské aplikace mohly správně zpracovávat přechodné chyby , aby se minimalizovaly dopady výpadků.
Přesměrování provozu: Příchozí provoz se automaticky směruje na server v zóně, která je v pořádku. Služba běží se sníženou kapacitou během výpadku zóny. Náhradní servery nejsou během výpadku zřizovány v zónách, které fungují správně.
Obnovení zóny
Microsoft automaticky spravuje obnovení zóny, včetně obnovy kapacity služby, když je ovlivněná zóna znovu funkční.
Testování poruch zón
Platforma Azure spravuje směrování provozu, převzetí služeb při selhání a navrácení služeb po obnovení pro zónově redundantní pracovní prostory. Tato funkce je plně spravovaná, takže nemusíte zahajovat ani ověřovat procesy selhání zóny dostupnosti.
Odolnost proti selháním v celé oblasti
Azure Managed Grafana je služba s jednou oblastí. Pokud oblast není dostupná, váš pracovní prostor je také nedostupný.
Vlastní řešení pro více regionů pro odolnost systémů
Pokud chcete dosáhnout odolnosti vůči oblastním výpadkům, můžete nasadit několik pracovních prostorů Grafana v různých oblastech. V tomto typu řešení zodpovídáte za:
Replikace řídicích panelů a konfigurace mezi oblastmi Můžete například použít konzistentní konfiguraci napříč několika pracovními prostory pomocí CI/CD a správy zdrojového kódu.
Implementace směrování provozu a přepnutí při selhání na úrovni aplikace nebo klienta
Zálohování a obnovení
Azure Managed Grafana neposkytuje vestavěné funkce zálohování a obnovy pro řídicí panely nebo jiné objekty datové roviny. Ochrana před náhodným odstraněním nebo poškozením:
K exportu řídicích panelů a dalších konfigurací Grafany použijte rozhraní API grafany nebo rozhraní příkazového řádku.
Ukládejte exportované řídicí panely do úložiště správy zdrojového kódu, například GitHub.
Pomocí automatizace nebo kanálů CI/CD nasaďte řídicí panely a další konfiguraci Grafany.
U většiny řešení byste se neměli spoléhat výhradně na zálohy. Místo toho využijte další funkce popsané v tomto průvodci k podpoře vašich požadavků na odolnost. Zálohy ale chrání před některými riziky, která jiné přístupy nechrání. Další informace najdete v tématu Co jsou redundance, replikace a zálohování?.
Odolnost vůči údržbě služeb
Microsoft pravidelně používá aktualizace služeb a provádí další údržbu. Platforma Azure tyto aktivity zpracovává automaticky a zajišťuje, aby byla údržba pro vás bezproblémová a transparentní. Během údržby můžete pozorovat krátké přerušení. Obvykle tato přerušení trvají několik sekund. Zajistěte, aby klientské aplikace byly nakonfigurované tak, aby zpracovávaly přechodné chyby , aby byly odolné vůči krátkým přerušením.
Smlouva o úrovni služeb
Smlouva o úrovni služeb (SLA) pro služby Azure popisuje očekávanou dostupnost každé služby a podmínky, které musí vaše řešení splnit, aby bylo dosaženo očekávané dostupnosti. Další informace najdete v tématu SLA pro online služby.
Související obsah
- Reliability in Azure
- Azure Managed Grafana - přehled