Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Azure Event Grid je škálovatelná spravovaná služba publikování a odběru, která distribuuje zprávy. Event Grid poskytuje flexibilní vzorce spotřeby zpráv. Používá protokoly MQTT (Message Queuing Telemetry Transport) a HTTP k povolení bezserverových architektur, datových kanálů a integrace aplikací řízených událostmi.
Tento článek předpokládá, že jste jako architekt zkontrolovali rozhodovací strom zasílání zpráv a jako službu zasílání zpráv pro vaši úlohu zvolili Event Grid.
Pokyny v tomto článku poskytují architektonická doporučení, která odpovídají principům pilířů Well-Architected Framework.
Rozsah technologií
Tato kontrola se zaměřuje na vzájemně nesouvisející rozhodnutí pro následující prostředky Azure:
- Azure Event Grid
Reliability
Účelem pilíře spolehlivosti je zajistit nepřetržitou funkčnost budováním dostatečné odolnosti a schopnosti rychle se zotavit ze selhání.
principy návrhu spolehlivosti poskytují základní strategii návrhu použitou pro jednotlivé komponenty, systémové toky a systém jako celek.
Kontrolní seznam návrhu úloh
Zahajte strategii návrhu na základě kontrolního seznamu pro kontrolu návrhů z hlediska spolehlivosti. Určete její význam pro vaše obchodní požadavky a přitom mějte na paměti povahu vaší aplikace a důležitost jejích součástí. Rozšiřte strategii tak, aby podle potřeby zahrnovala více přístupů.
Zkontrolujte limity a kvóty služeb a použijte je k vedení plánování spolehlivosti a rozhodování o kapacitě propustnosti. Zohledněte omezení throttlování předplatného, která ovlivňují doručování událostí, když spotřebitelé nedokáží zpracovávat události v požadované rychlosti.
Navrhujte datové části událostí tak, aby se vešly do mezí velikosti zpráv (1 MB na událost), a v případě potřeby rozdělte zprávy. Při plánování strategií nasazení a potřeb kapacity zvažte kvóty specifické pro jednotlivé oblasti.
Předvídání potenciálních selhání prostřednictvím systematických analýz: Pomocí analýzy režimu selhání identifikujte potenciální scénáře selhání a vytvořte strategie pro zmírnění rizik, které zajistí odolnost služby Event Grid.
Failure Zmírnění Selhání doručování událostí příjemcům Nakonfigurujte politiky exponenciálního zálohování a cílové destinace dead letter. Implementujte monitorování stavu uživatelů pomocí automatizovaných výstrah. Nedostupnost služby pro zákazníky Nasaďte vzory obvodových jističů a alternativní způsoby zpracování. Použijte více instancí příjemců napříč zónami dostupnosti. Regionální výpadek Event Gridu Replikujte témata napříč několika oblastmi a nasaďte uživatele ve více oblastech s možnostmi směrování provozu. Implementace strategií redundance pro dosažení vysoké dostupnosti: Témata event Gridu automaticky používají zóny dostupnosti v podporovaných oblastech. Toto nastavení poskytuje redundanci na úrovni zóny bez jakékoli konfigurace. Oblasti s podporou zóny dostupnosti umožňují tuto funkci ve výchozím nastavení.
Nasaďte aplikace příjemců napříč zónami dostupnosti pomocí služby Azure Kubernetes Service (AKS) nebo zónově redundantních nasazení služby Azure App Service. Tento přístup umožňuje převzetí služeb při selhání na úrovni zóny. Pro aktivně-aktivní redundanci mezi regiony použijte infrastrukturu jako kód (IaC) k nasazení konfigurací Event Grid v několika regionech. Patří sem témata, domény, obory názvů a odběry událostí.
Nakonfigurujte aplikace producenta tak, aby publikovaly události do prostředků Event Gridu ve všech nasazených oblastech současně. Toto nastavení dosahuje redundance dat událostí napříč oblastmi. Pokud chcete implementovat redundanci aktivní-aktivní pro vaši pracovní zátěž, nasazujte koncové aplikace ve více oblastech a využijte směrování pomocí Azure Traffic Manager nebo Azure Front Door. Pomocí vzoru razítka nasazení můžete dosáhnout redundance na úrovni úloh napříč oblastmi.
Navrhněte spolehlivé škálování pro zpracování proměnných zátěží událostí: Pomocí automatického škálování ve službě Event Grid můžete zpracovávat různé objemy událostí bez ručního zásahu. Nakonfigurujte zásady doručování předplatného pro zpracování operací škálování, včetně zásad opakování a cílů nedoručených písmen. Návrh strategií jednotek škálování pro spotřebitelské aplikace pomocí horizontálního škálování napříč instancemi a oblastmi
Monitorování operací škálování za účelem zachování průběžného zpracování událostí při změně vzorů zatížení Při návrhu strategií škálování zastavte omezení předplatného, abyste zabránili selháním doručení. Nastavte automatické škálování pro spotřebitelské aplikace, aby mohly zpracovávat nárazové zvýšení počtu událostí. Založte rozhodnutí o škálování uživatelů na metrikách Event Gridu, jako jsou nezřetězené události a počty pokusů o doručení.
Implementace monitorování a upozorňování pro zajištění spolehlivosti: Nakonfigurujte metriky pro sledování klíčových indikátorů spolehlivosti, jako jsou míra úspěšnosti doručení, počty neúspěšných doručení a objemy nedoručených písmen. Nastavte monitorování pro sledování dostupnosti témat a stavu koncového bodu uživatele.
Implementujte upozornění detekce selhání s definovanými prahovými hodnotami pro selhání doručení, nedostupnost spotřebitele a stav závislostí. Sledujte dobu obnovení a změřte zpoždění zpracování oproti vašim cílům. Monitorujte stav závislostí, jako jsou účty úložiště, Azure Functions a služby příjemců, které ovlivňují zpracování událostí.
Nastavte monitorování složeného stavu pro kombinování metrik Event Gridu s indikátory výkonu uživatelů. Nakonfigurujte postupy eskalace výstrah pro kritické události spolehlivosti.
Implementace strategií testování spolehlivosti pro systémy řízené událostmi: Generování syntetických událostí pro testování spolehlivosti doručení v různých scénářích, včetně velkých objemů zatížení a hraničních případů Pomocí chaosu můžete ověřit odolnost zpracování událostí během simulovaných selhání infrastruktury. Nakonfigurujte automatizované testování, abyste ověřili, že zásady opakování, zpracování nedoručených dopisů a převzetí služeb při selhání uživatelů fungují podle očekávání.
Návrh strategie zotavení po havárii pro kontinuitu podnikání: Vyberte si ze dvou možností převzetí služeb při selhání. Pro převzetí služeb při selhání iniciované Microsoftem použijte nastavení mezi geografickými oblastmi. Toto nastavení automaticky replikuje metadata do spárovaných oblastí a pokusí se o nejlepší možné přepnutí při výpadku oblasti. Pro převzetí služeb při selhání iniciované zákazníkem použijte místní nastavení a implementujte vzory zotavení po havárii na straně klienta, pokud potřebujete úplnou kontrolu nad výběrem sekundární oblasti a načasováním převzetí služeb při selhání.
Použijte IaC k nastavení automatizovaného zálohování pro konfigurace předplatného a pravidla směrování. Návrh aktivně-pasivní zotavení po havárii s nasazením záložních spotřebitelů v sekundárních regionech. Definujte cíl doby obnovení (RTO) a cíl bodu obnovení (RPO) na základě vašich obchodních potřeb.
Nakonfigurujte geograficky redundantní cíle pro nepřijaté zprávy pomocí replikace úložiště mezi regiony, abyste zabránili ztrátě událostí. Pravidelně testujte postupy zotavení po havárii, včetně převzetí služeb při selhání mezi regiony a přesměrování producentů. Navrhněte funkce přehrávání událostí ze zásilek nedoručených zpráv za účelem obnovení ztraceného zpracování během výpadků.
Implementujte techniky sebezáchovy, abyste zajistili provozní odolnost: Zabudujte do náplně Event Gridu funkce sebezáchovy, aby se mohl rychle zotavit ze selhání a pokračovat v činnosti.
Nakonfigurujte zásady opakování s exponenciálním zpožděním, které automaticky zpracovávají přechodné chyby spotřebitelů.
Cíle nedoručitelného dopisu můžete použít k zachování nedoručitelných událostí a zabránění ztrátě dat.
Přidejte vzory jističe do vašich uživatelských aplikací, abyste zabránili kaskádovaným chybám.
Nakonfigurujte filtry předplatného a směrování, abyste izolovali selhání a minimalizovali jejich dopad.
Vytvořte strategie degradace, které udržují zpracování kritických událostí spuštěné, když selžou nepodstatné závislosti.
Používejte integrované záruky doručení a objednávání, abyste během částečných selhání zachovali konzistenci dat.
Nastavte odpovídající hodnoty TTL (Time to Live) pro události, aby se zabránilo vyčerpání prostředků během rozšířených výpadků.
Doporučení pro konfiguraci
| Recommendation | Prospěch |
|---|---|
| Nastavte škálování aplikace příjemce na základě metrik Event Gridu, jako jsou počty nedoručených událostí a pokusy o doručení. Vytvořte vlastní pravidla škálování, která se aktivují při objemu fronty nedoručených zpráv. Implementujte monitorování na úrovni předplatného, které zahrnuje různé prahové hodnoty pro každý typ události. Využijte Azure Logic Apps nebo Functions k automatizaci odpovědí škálování na základě těchto metrik. |
Škáluje uživatele na základě skutečné poptávky po zpracování událostí místo použití pouze prostředků. Zachytává problémy s kapacitou včas, aby se zabránilo selháním doručení. Umožňuje přizpůsobit strategie škálování pro různé typy událostí. |
| Monitorujte metriky úspěšnosti doručení a konfigurujte výstrahy , které mají prahové hodnoty sladěné s cílem na úrovni služby (SLO). Vytvořte řídicí panely, které zobrazují procento úspěšnosti doručení, latenci a dobu odezvy uživatelů. Agregujte metriky v příslušných časových oknech za účelem měření indikátorů úrovně služeb (SLA). | Ukazuje, jak dobře splňujete své SLO pomocí metrik v reálném čase. Pomáhá identifikovat problémy se spolehlivostí dříve, než ovlivní vaši firmu. Poskytuje historická data ke zlepšením. |
| Nastavte monitorování fronty nedoručených zpráv s upozorněními pro případy, kdy objem překročí prahovou hodnotu, obvykle při 1% událostí. Nakonfigurujte kontroly stavu koncového bodu uživatele, které monitorují dostupnost a dobu odezvy. Vytvořte složené zdravotní kontroly, které kombinují metriky služby Event Grid a spotřebitelské metriky. Nastavte eskalaci upozorňování, když se současně sníží více indikátorů. |
Detekuje systémové problémy v rané fázi kanálu událostí. Umožňuje rychle reagovat na incidenty tím, že při eskalaci problémů automaticky upozorní správné lidi. Poskytuje ucelenou viditelnost od publikování událostí až po zpracování příjemce. |
| Vytvořte automatizované testovací sady, které generují syntetické události s různými velikostmi a typy datových částí. Pomocí zátěžového testování Azure můžete simulovat reálné svazky událostí. Nastavte automatizované testy, abyste ověřili, že zásady opakování fungují správně pro přechodné i trvalé selhání. | Kontroluje spolehlivost doručení za realistických podmínek zatížení. Před nasazením do produkčního prostředí ověří opakování a zpracování chyb. Ověřuje vaše nastavení nepřetržitě přes řetězec kontinuální integrace a průběžného nasazování (CI/CD). |
| Pomocí nástroje Azure Chaos Studio vložte chyby do vašich příjemců a závislostí. Nastavte řízené scénáře selhání, jako jsou výpadky zón, výpadky služeb pro uživatele a síťové přerušení. Navrhujte testy injektáže chyb pro účty úložiště, které podporují cíle nedoručených písmen. Nastavte automatizované kontroly obnovení, abyste ověřili, že se vaše systémy vrátí do stavu, který je v pořádku. |
Ověřuje odolnost zpracování událostí za realistických podmínek selhání. Identifikuje mezery ve spolehlivosti dříve, než způsobí produkční incidenty. Vytváří důvěru v postupy zotavení po havárii prostřednictvím systematických simulací. |
| Povolte převzetí služeb při selhání iniciované Microsoftem tím, že nakonfigurujete témata s výchozím nastavením rezidence dat napříč geografiemi. Toto nastavení automaticky replikuje metadata do spárovaných oblastí během výpadků. Nebo můžete nakonfigurovat regionální nastavení rezidence dat a implementovat převzetí služeb při selhání iniciované zákazníkem pomocí strategií zotavení po havárii na straně klienta. Tuto možnost použijte, pokud potřebujete úplnou kontrolu nad sekundárními oblastmi. Nastavte automatizované postupy failoveru pro aplikace producenta, aby se při selhání primárního regionu přesměrovávaly na sekundární regionální témata. |
Při použití konfigurace mezi geografickými oblastmi automaticky přepne metadata do spárovaných regionů během oblastních výpadků. Poskytuje úplnou kontrolu nad tím, které sekundární oblasti použít a kdy aktivovat převzetí služeb při selhání při použití místní konfigurace a zotavení po havárii na straně klienta. Snižuje ruční zásah během havárií prostřednictvím automatického přepnutí. |
| Implementace automatizovaného zálohování konfigurace pomocí Azure CLI nebo skriptů Azure PowerShellu Ukládejte skripty zálohování a šablony ve správě verzí spolu s runbooky pro zotavení po havárii. Pokud chcete chránit nedoručené události před regionálními selháními, nakonfigurujte geograficky redundantní úložiště pro destinace nedoručených zpráv. | Umožňuje rychlé obnovení konfigurace během scénářů havárie a zabraňuje ztrátě událostí prostřednictvím geograficky redundantního úložiště. Zajišťuje konzistentní postupy obnovení pomocí automatizace s kontrolou verzí. |
| Konfigurace pohotovostních uživatelských aplikací v sekundárních oblastech, které mají předem zřízenou infrastrukturu Pokud chcete aktivovat sekundární příjemce, implementujte automatizované převzetí služeb při selhání pomocí Azure Automation nebo Logic Apps. Nastavte funkce pro přehrání událostí z úložiště nedoručených zpráv pro obnovení ztraceného zpracování. | Umožňuje rychle aktivovat zákazníky během regionálních havárií a pomůže vám splnit cíle RTO a RPO prostřednictvím otestovaných postupů. Umožňuje plně obnovit zpracování prostřednictvím funkcí pro přehrání. |
| Nakonfigurujte zásady opakování s exponenciálním zpomalováním (s počátečním 1sekundovým zpožděním a maximem 24 hodin) ke zpracování přechodných výpadků příjmu. Nastavte cíle pro nedoručené zprávy pomocí front Azure Storage nebo front Azure Service Bus, aby se zachovaly nedoručené události. Nastavte hodnotu TTL události na základě obchodních požadavků (obvykle jeden až sedm dnů), aby se zabránilo vyčerpání prostředků. Filtrování odběru slouží k odesílání typů událostí do příslušných cílů a minimalizaci poloměru výbuchu. |
Umožňuje platformě automaticky zotavit se z přechodných selhání bez ručního zásahu. Zachovává události během dlouhých výpadků, abyste je mohli později znovu zpracovat a analyzovat. Obsahuje chyby prostřednictvím směrování událostí a hodnoty TTL, aby se zabránilo přetížení celého systému. |
| Implementujte vzory jističe pomocí knihoven odolnosti, jako je Polly pro .NET nebo resilience4j pro Javu, abyste zabránili kaskádovým selháním. Nakonfigurujte jistič tak, aby po pěti po sobě jdoucích selhání přestal odesílat požadavky nefunkčnímu příjemci. Návrh záložních mechanismů tak, aby důležité události zůstaly ve zpracování, když selžou jiné než nezbytné závislosti. Nastavte koncové body kontroly stavu pro monitorování uživatelů, aby se provoz mohl automaticky směrovat. |
Zastaví kaskádové selhání tím, že automaticky izoluje závislosti, když příjemci selžou. Udržuje zpracování kritických událostí prostřednictvím záložních mechanismů během částečných selhání systému. Umožňuje automatické obnovení a inteligentní správu provozu prostřednictvím směrování na základě stavu. |
Zabezpečení
Účelem pilíře zabezpečení je poskytnout záruky důvěrnosti, integrity a dostupnosti úloh.
Principy návrhu zabezpečení poskytují strategii návrhu vysoké úrovně pro dosažení těchto cílů použitím přístupů k technickému návrhu Event Gridu.
Kontrolní seznam návrhu úloh
Zahajte strategii návrhu na základě kontrolního seznamu pro kontrolu návrhu pro zabezpečení a identifikujte ohrožení zabezpečení a kontrolní mechanismy, které zlepšují stav zabezpečení.
Vytvoření standardních hodnot zabezpečení pro nasazení: Zkontrolujte standardní hodnoty zabezpečení a použijte ho k nastavení ovládacích prvků pro vaše operace, ochranu dat a správu přístupu. Vaše implementace by měla zahrnovat správu identit a přístupu, zabezpečení sítě, šifrování a protokolování.
Použijte základní pokyny pro potřeby služby Event Grid, jako je řízení přístupu k tématům a zabezpečení předplatného. Zarovnejte se s kontrolními mechanismy srovnávacích testů Microsoft Cloud Security, abyste zachovali konzistentní stav zabezpečení. Pravidelně kontrolujte základní úroveň, jakmile se mění vaše požadavky a hrozby.
Implementace kontrolních mechanismů segmentace pro izolaci úloh řízených událostmi: Vytvořte identitu jako primární hranici zabezpečení pomocí řízení přístupu na základě role (RBAC) Azure k řízení přístupu k prostředkům Event Gridu. Přiřaďte vestavěné role RBAC, včetně přispěvatele Event Grid, přispěvatele předplatného událostí Event Grid a odesílatele dat Event Grid.
Pomocí samostatných témat můžete izolovat různé domény aplikací a obchodní funkce. Nastavte řízení přístupu na úrovni předplatného tak, aby události mohli přijímat pouze autorizovaní příjemci. Pokud chcete vytvořit jasné oddělení a hranice přístupu, uspořádejte prostředky Event Gridu pomocí skupin prostředků a předplatných.
Udržujte identity vydavatele a odběratele oddělené pomocí spravovaných identit a služebních principálů. Nastavte filtrování událostí a směrování, abyste minimalizovali poloměr výbuchu a směrovali události pouze jejich zamýšleným příjemcům.
Integrace s Microsoft Entra ID pro centralizovanou správu identit a přístupu: Ke zpracování ověřování a autorizace pro Event Grid použijte ID Microsoft Entra. Nastavte spravované identity pro ověřování mezi službami, abyste nemuseli ukládat přihlašovací údaje. Nakonfigurujte zásady podmíněného přístupu Microsoft Entra, které reagují na kontext uživatele, stav zařízení a umístění v síti.
Udržujte oprávnění roviny dat (publikování a využívání událostí) odděleně od oprávnění řídicí roviny (správa prostředků). Uplatněte zásady "just-in-time" přístupu a "just-enough" přístupu pro administrativní operace.
Nastavte trasu auditu prostřednictvím protokolu aktivit ve službě Azure Monitor, abyste mohli sledovat rozhodnutí o přístupu k identitě a autorizaci. Skupiny ID Microsoft Entra slouží k přiřazování rolí a správě přístupu.
Použití ovládacích prvků zabezpečení sítě pro zabezpečenou komunikaci událostí: Nastavte privátní koncové body pro témata Event Gridu, abyste eliminovali ohrožení internetu a integrovali privátní koncové body s vaší virtuální sítí. Nakonfigurujte filtrování IP adres a firewallová pravidla na úrovni tématu, aby byl povolen přístup pouze z autorizovaných zdrojových adres nebo rozsahů.
Naplánujte integraci virtuální sítě a připojte vydavatele, Event Grid a uživatele v rámci hranic vaší sítě. Pomocí skupin zabezpečení sítě (NSG) a směrovacích tabulek můžete řídit tok provozu a vytvářet mikros segmentace.
Nastavte monitorování sítě a protokolování pro sledování vzorů provozu služby Event Grid a pokusů o připojení.
Implementace šifrování dat pro ochranu událostí: Event Grid automaticky šifruje neaktivní uložená data pomocí klíčů platformy spravovaných Microsoftem pro uložené události a metadata. Vyžadovat protokol TLS (Transport Layer Security) 1.2 jako minimální verzi pro veškerou komunikaci event Gridu, včetně publikování a využívání událostí. Nastavení správy certifikátů pro připojení TLS pro automatizaci obnovení a ověření
Platforma šifruje dočasné úložiště událostí během zpracování a scénářů opakování doručení. Témata a domény služby Event Grid nepodporují klíče spravované zákazníkem (CMK).
Posílení konfigurací Event Gridu za účelem minimalizace prostoru pro útoky: Minimalizujte prostor pro útoky Event Gridu tím, že systematicky posilujete konfigurace:
Zakažte nepotřebné metody ověřování a protokoly. Zachovat pouze požadované mechanismy.
Nastavení tématu a odběru můžete nastavit podle principů nejnižších oprávnění. Odeberte nepoužívané funkce.
Odeberte nebo zakažte starší metody podpory protokolu a ověřování, které vytvářejí bezpečnostní rizika.
Nakonfigurujte nastavení na úrovni prostředků s výchozími nastaveními zaměřenými na zabezpečení pro hodnoty časového limitu a zásady opakování.
Používejte zabezpečené zásady vytváření názvů a uspořádejte prostředky, abyste zabránili úniku informací.
Nakonfigurujte minimální požadovaná oprávnění pro instanční objekty služby Event Grid a spravované identity.
Přiřaďte předdefinované zásady služby Azure Policy pro Event Grid na úrovni předplatného, například témata služby Azure Event Grid by měla používat privátní propojení.
Zabezpečení tajných kódů a přihlašovacích údajů pro integrace služby Event Grid: Důrazně doporučujeme používat Microsoft Entra ID se spravovanými identitami, protože eliminuje potřebu uložených tajných kódů. Pokud nepoužíváte MICROSOFT Entra ID, uložte připojovací řetězce, klíče rozhraní API a ověřovací tokeny ve službě Azure Key Vault pomocí řízení přístupu a zásad obměny.
Pro různá prostředí a uživatele používejte samostatné klíče, takže přihlašovací údaje nesdílíte. Nastavte automatickou obměnu tajných kódů pro přístupové klíče a tokeny webhooku služby Event Grid, abyste minimalizovali přerušení. Nezakódujte tajné kódy v aplikacích, konfiguračních souborech ani kanálech nasazení obslužné rutiny událostí.
Monitorujte vzory přístupu k tajným kódům prostřednictvím auditování služby Key Vault a nastavte upozornění na neobvyklé pokusy. Vytvořte postupy obnovení pro ohrožené přihlašovací údaje, včetně postupu rychlého opětovného vygenerování klíčů.
Implementace monitorování zabezpečení a protokolování pro Event Grid: Nastavte nastavení diagnostiky služby Azure Monitor tak, aby zaznamenávala události související se zabezpečením, včetně pokusů o přístup a změn konfigurace. Implementujte protokolování aktivit pro operace Event Gridu, včetně vytváření témat, správy předplatného a změn zásad. Monitorování vzorů identit a přístupu prostřednictvím protokolu aktivit ve službě Azure Monitor za účelem identifikace neobvyklých vzorů a selhání autorizace
Nastavte výstrahy pro události zabezpečení, jako je neúspěšné ověřování, neoprávněný přístup a podezřelé vzory. Integrace protokolů Event Gridu s Microsoft Sentinelem pro detekci hrozeb a analýzu zabezpečení Strukturované protokolování používejte s časovými razítky a metadaty událostí, abyste mohli analyzovat problémy se zabezpečením a zkoumat incidenty.
Monitorujte vzory doručování událostí a sledujte neobvyklé chování, které může signalizovat incidenty zabezpečení. Nastavte zásady uchovávání protokolů, které splňují požadavky vaší organizace na zabezpečení a dodržování předpisů.
Ověřování bezpečnostních kontrol prostřednictvím systematického testování a hodnocení: Spouštění pravidelných ověřovacích testů u řízení přístupu ke službě Event Grid, zabezpečení sítě a nastavení šifrování
Testování průniku, které se zaměřuje na koncové body, mechanismy ověřování a pokusy o obejití řízení přístupu
Otestujte kontrolní mechanismy zabezpečení sítě, jako je konfigurace privátního koncového bodu, filtrování IP adres a integrace virtuální sítě.
Otestujte správu identit a přístupu, včetně přiřazení RBAC, zásad podmíněného přístupu a ověřování spravovaných identit. Ověřte, že události zůstávají v celém kanálu zabezpečené, od vydavatelů přes Event Grid až po uživatele.
Implementujte automatizované testování zabezpečení v kanálech nasazení, abyste zachytili chybné konfigurace.
Doporučení pro konfiguraci
| Recommendation | Prospěch |
|---|---|
| Přiřaďte předdefinované role RBAC v příslušných oborech, abyste mohli sledovat přístup s nejnižšími oprávněními. Přiřaďte roli Přispěvatel event Gridu uživatelům, kteří spravují témata a odběry. Přiřaďte uživatelům, kteří spravují jen předplatná událostí, roli Přispěvatel k odběru událostí v Event Gridu. A přiřaďte roli Odesílatele dat Event Gridu pro aplikace, které publikují události. | Porovnává řízení přístupu s provozními odpovědnostmi. Vynucuje přístup s minimálními oprávněními tím, že odděluje operace správy od operací datové roviny. |
| Uspořádejte témata pomocí skupin prostředků, které odpovídají provozním a bezpečnostním hranicím. Použijte zásady vytváření názvů, které odrážejí hranice zabezpečení a požadavky na přístup. Nastavte filtrování odběru tak, aby odesílala události jenom autorizovaným uživatelům. | Odděluje toky událostí na základě zásad zabezpečení a snižuje poloměr výbuchu prostřednictvím izolovaných struktur témat. Vytvoří jasné hranice organizace pro dodržování předpisů. |
| Přiřaďte spravované identity k tématům, odběrům a obslužným rutinám událostí Event Grid pro ověřování služby Azure. Pokud potřebujete sdílet identity, použijte identity přiřazené systémem pro scénáře s jedním prostředkem nebo identity přiřazené uživatelem. Nastavte spravované identity pro účty Azure Functions, Logic Apps a úložiště, které zpracovávají události. | Eliminuje uložená pověření a související bezpečnostní rizika. Poskytuje automatickou obměnu přihlašovacích údajů prostřednictvím Azure a umožňuje zabezpečené ověřování mezi službami bez ruční správy tajných kódů. |
| Povolte zásady podmíněného přístupu pro operace správy služby Event Grid. Vyžadovat vícefaktorové ověřování (MFA) pro privilegované operace, jako je vytvoření tématu a změny zásad. Nastavte ovládací prvky založené na umístění, které omezují správu na autorizované oblasti. Ujistěte se, že zařízení splňují požadavky na dodržování předpisů pro přístup pro správu. |
Použije bezpečnostní prvky na základě rizika a kontextu. Snižuje neoprávněný přístup tím, že vyžaduje dodatečné ověřování. Umožňuje přizpůsobit zásady zabezpečení při změně hrozeb. |
| Nasaďte privátní koncové body pro témata Event Gridu ve vaší virtuální síti. Nastavte nastavení DNS (Domain Name System) pro správné řešení názvů. Nastavte skupiny zabezpečení sítě a směrovací tabulky pro řízení toku provozu. |
Eliminuje vystavení internetu prostřednictvím izolace na úrovni sítě a umožňuje zabezpečenou komunikaci ve vaší virtuální síti. Poskytuje centralizované řízení přístupu prostřednictvím skupin zabezpečení. |
| Nastavte pravidla filtrování IP adres na úrovni tématu pomocí seznamu povolených adres. Odepřít přístup ve výchozím nastavení a povolit pouze autorizované zdrojové adresy a rozsahy CIDR (Classless Inter-Domain Routing). Nastavte monitorování a upozorňování na blokované pokusy o přístup. | Řídí přístup k síti na úrovni služby a snižuje prostor pro útoky omezením přístupu ke známým zdrojům. Pomáhá zjišťovat pokusy o neoprávněný přístup. |
| Pro veškerou komunikaci event Gridu vyžadovat protokol TLS 1.2 jako minimální verzi. Nastavte nastavení protokolu TLS pro vlastní koncové body domény a cíle webhooku. Implementujte ověření certifikátu pro koncové body webhooku, které přijímají události. | Chrání před útoky na snížení úrovně protokolu pomocí šifrování dat během přenosu průmyslového standardu. Zabraňuje útokům typu man-in-the-middle prostřednictvím ověřování certifikátů. |
| Pomocí služby Azure Policy vynucujte standardy konfigurace zabezpečení a zabraňte posunu. Používejte IaC pro konzistentní konfigurace zabezpečení napříč prostředími. Zakažte nepotřebné metody ověřování a podporu starší verze protokolu. Nastavte minimální požadované hodnoty časového limitu a zásady opakování. Monitorujte změny konfigurace a nastavte automatizovaná upozornění na neoprávněné úpravy. |
Snižuje prostor pro útoky odebráním nepotřebných funkcí a zabraňuje posunu konfigurace vynucením zásad. Udržuje stav zabezpečení konzistentní napříč prostředími a pomáhá rychle rozpoznat neoprávněné změny. |
| Ukládání přihlašovacích údajů klienta Event Gridu ve službě Key Vault pomocí řízení přístupu RBAC Povolte automatizovanou obměnu tajných kódů pro přístupové klíče a tokeny webhooku. Pro každé prostředí a aplikaci používejte samostatné klíče. |
Poskytuje zabezpečené úložiště s řízením přístupu a auditováním. Automatizuje správu životního cyklu přihlašovacích údajů a udržuje přístup oddělený prostřednictvím klíčů specifických pro prostředí. |
| Povolte nastavení diagnostiky pro odesílání protokolů Event Gridu do pracovního prostoru služby Log Analytics. Nastavte pravidla upozornění pro neúspěšné ověřování, neoprávněný přístup a změny konfigurace. Integrace s Microsoft Sentinelem pro detekci hrozeb a analýzu zabezpečení Nastavte zásady uchovávání protokolů, které splňují vaše požadavky na dodržování předpisů. |
Poskytuje přehled o událostech zabezpečení a potenciálních hrozbách. Umožňuje rychle reagovat na incidenty prostřednictvím automatizovaného upozorňování a podporuje dodržování předpisů prostřednictvím strukturovaného protokolování a uchovávání informací. Detekuje hrozby prostřednictvím analýzy zabezpečení. |
Optimalizace nákladů
Optimalizace nákladů se zaměřuje na odhalování vzorců výdajů, upřednostnění investic do klíčových oblastí a optimalizaci jiných oblastí pro splnění rozpočtu organizace a zároveň obchodních požadavků.
Principy návrhu optimalizace nákladů poskytují strategii návrhu vysoké úrovně pro dosažení těchto cílů a dosažení kompromisů v technickém návrhu souvisejícím s Event Gridem a jeho prostředím.
Kontrolní seznam návrhu úloh
Zahajte svou strategii návrhu na základě kontrolního seznamu přezkumu návrhu pro optimalizaci nákladů pro investice. Dolaďte návrh tak, aby úloha byla v souladu s rozpočtem přiděleným pro danou úlohu. Váš návrh by měl využívat správné možnosti Azure, monitorovat investice a hledat příležitosti k optimalizaci v průběhu času.
Analýza cenových modelů a nákladových struktur za účelem optimalizace výdajů služby Event Grid: Vyhodnoťte úrovně Event Grid Basic a Standard, abyste pochopili, jak cenové modely ovlivňují náklady na vaše řešení. Úroveň Basic používá ceny jednotlivých operací, které poskytují předvídatelné náklady pro scénáře s nízkým objemem a jednoduchým doručováním typu push. Úroveň Standard kombinuje předem zakoupené jednotky propustnosti (TU) s poplatky za jednotlivé operace.
Každá jednotka TU poskytuje pevnou kapacitu pro relace, příchody zpráv za sekundu a témata na obor názvů. Jednotky TU mají pevné hodinové náklady bez ohledu na využití. Poddimenzování způsobuje omezení služeb a degradaci služby. Nadměrné přidělení plýtvá penězi na nevyužitou kapacitu.
Operace MQTT stojí více než událostní operace. Naplánujte poplatky za šířku pásma přenosu dat mezi oblastmi při doručování událostí do různých oblastí Azure. Zahrňte náklady na uchovávání událostí a úložiště nedoručených písmen nad rámec základních cen služby Event Grid.
Optimalizace kapacity a propustnosti pro nákladově efektivní zpracování událostí: Nakonfigurujte dávkování událostí pro doručování více událostí v jednotlivých operacích a snižte náklady na provoz. Optimalizujte velikost dávky během zátěžového testování. Použijte filtrování událostí na úrovni předplatného, abyste zabránili zbytečnému zpracování a doručení irelevantních událostí. Nakonfigurujte zpracování nedoručených zpráv a zásady opakování pro správu pokusů o zpracování a nákladů na úložiště.
Definujte zásady uchovávání událostí pro vyvážení dostupnosti dat s náklady na úložiště. Naplánujte kapacitu tak, aby zohlednila objemy událostí ve špičce a vzory zpracování.
Eliminujte plýtvání prostředky a optimalizujte konfigurace: Systematicky odstraňte plýtvání prostředky Event Gridu prostřednictvím postupů optimalizace:
Odeberte nepoužívané témata, odběry a koncové body služby Event Grid, které generují náklady bez hodnoty.
Vyčistěte opuštěné prostředky, včetně cílů nedoručených dopisů a nepoužívaných vlastních témat.
Nakonfigurujte zásady uchovávání událostí tak, aby vyvažovaly dostupnost dat s náklady na úložiště.
Optimalizujte nastavení doručení, zásady opakování a pravidla filtrování, abyste zlepšili nákladovou efektivitu.
Proveďte pravidelné audity zdrojů a identifikujte nevyužité prostředky, které můžete konsolidovat nebo vyřadit z provozu.
Konsolidovat podobná předplatná, aby se snížila režie na správu.
Implementace mechanismů monitorování nákladů a kontroly: Sledujte vzorce využití, objemy operací a trendy útraty za účelem zajištění viditelnosti nákladů. Analýza nákladů slouží k identifikaci nákladových faktorů, včetně objemů událostí, pokusů o doručení a přenosu dat mezi oblastmi.
Nastavte upozornění na rozpočet, limity útraty a automatizované zásady pro řízení nákladů. U úrovně Standard monitorujte využití TU podle procent, abyste našli příležitosti pro optimalizaci a konfigurovali upozornění na prahové hodnoty využití. Povolte monitorování v reálném čase, abyste včas zachytili nákladové anomálie.
Implementujte vykazování nákladů, abyste získali podrobnou viditelnost podle prostředků, prostředí a obchodních jednotek. Pokud chcete pomoct předpovídat budoucí náklady, spusťte historickou analýzu a identifikujte trendy a sezónní vzory.
Vytvoření zásad správného řízení a řízení nákladů: Definujte zásady správného řízení nákladů pomocí zásad organizace, které podporují zodpovědné výdaje. Pomocí zásad prostředků vynucujte konfigurace s vědomím nákladů a zabraňte drahým chybným konfiguracím.
Vytvářejte pracovní postupy schvalování pro vysoce nákladná nasazení a využití funkcí. Spusťte pravidelné kontroly nákladů a hodnocení optimalizace, abyste zachovali disciplínu nákladů. Pomocí ovládacích prvků založených na zásadách vynucujte požadavky na označování, limity prostředků a standardy přidělování nákladů.
Doporučení pro konfiguraci
| Recommendation | Prospěch |
|---|---|
| Použijte doporučení pro porovnání úrovní k výběru úrovně Event Gridu na základě požadovaných funkcí a nákladových omezení. Pravidelně kontrolujte vzory využití a ověřte výběr úrovně. | Zabraňuje placení za nepoužívané prémiové funkce a odpovídá možnostem úrovně vašim vzorům využití. |
| Nastavte dávkování událostí pro doručování více událostí v jednotlivých operacích. Použijte filtry událostí na úrovni předplatného pro zpracování pouze relevantních událostí. | Snižuje náklady na provoz prostřednictvím dávkového doručování a eliminuje náklady na zpracování irelevantních událostí. |
| Monitorujte vzory zpracování událostí a využití ve špičce pomocí monitorování doručení událostí k určení základní kapacity. K optimalizaci vašich prostředků použijte metriky propustnosti. Při plánování kapacity můžete počítat se sezónními variacemi a projekcemi růstu. |
Zabraňuje nadměrnému zřizování. Zajišťuje, že máte dostatečný výkon pro zatížení ve špičce tím, že upravíte kapacitu na základě vzorů využití. |
| Optimalizujte konfigurace doručování, jako je vypršení časového limitu a nastavení opakování, a vyrovnáte tak spolehlivost s náklady. Další informace najdete v tématu Doručení a opakování. Ke konfiguraci zásad pro nedoručené zprávy použijte filtrování událostí. | Snižuje náklady na pokusy o opakování a udržuje spolehlivost a současně minimalizuje náklady na úložiště a zachovává viditelnost chyb. |
| Využijte Microsoft Cost Management ke sledování vzorců útraty a implementaci analýzy nákladů. Nastavte automatizované vytváření sestav nákladů, které uspořádá náklady podle prostředků, prostředí a obchodní jednotky. Využijte analýzu nákladů k identifikaci vysoce nákladných operací a příležitostí optimalizace. |
Poskytuje přehled o vzorech útraty. Pomáhá přiřazovat náklady týmům a identifikovat vysoce nákladné operace. |
| Nakonfigurujte upozornění na náklady , které zahrnují více úrovní prahových hodnot na úrovních předplatného, skupiny prostředků a tématu. Povolte detekci nákladových anomálií, abyste identifikovali neobvyklé vzorce útraty. Nastavte limity rozpočtu s automatizovanými upozorněními a limity útraty. Implementujte prognózování rozpočtu na základě trendů zpracování. |
Zabraňuje přetečení nákladů s včasnými upozorněními na více úrovních organizace, zachytává problémy s konfigurací nebo neobvyklými vzory využití a pomáhá plánovat budoucí útraty na základě předpokládaného růstu. |
| Značky prostředků můžete použít pomocí konzistentních konvencí pojmenování, jako jsou prostředí, aplikace, obchodní jednotka, nákladové středisko a projekt. Přidejte značky na úrovni tématu, předplatného a koncového bodu pro podrobné sledování. | Umožňuje přiřadit náklady konkrétním obchodním jednotkám a projektům pro vrácení peněz a pomáhá identifikovat vzory zpracování událostí s vysokými náklady. |
Efektivita provozu
Operační dokonalost se primárně zaměřuje na vývojové postupy, pozorovatelnost a správu verzí. Principy návrhu efektivity provozu poskytují strategii návrhu vysoké úrovně pro dosažení těchto cílů pro provozní požadavky úlohy.
Kontrolní seznam návrhu úloh
Zahajte strategii návrhu založenou na kontrolním seznamu pro kontrolu návrhu pro efektivitu provozu pro definování procesů pozorovatelnosti, testování a nasazení souvisejících s Event Gridem.
Posouzení připravenosti týmu pro operace Event Gridu: Vyvíjejte provozní znalosti vašeho týmu v návrhu schématu událostí, konfiguraci směrování, vzorech příjemců, zpracování nedoručených dopisů, zásadách opakování a správě předplatného.
Vytvořte dokumentaci pro pokyny k návrhu schématu, vzory pro konfiguraci předplatného a řešení potíží s runbooky. Zdokumentování vzorů směrování událostí, požadavků na koncové body a strategií zpracování chyb
Stanovte standardy pro verzování schématu a postupy nasazení uživatelů. Definujte procesy správy životního cyklu služeb, včetně zřizování témat, životního cyklu předplatného a vyřazení pracovních postupů z provozu.
Vytvoření postupů bezpečného nasazení: Implementace modrého zeleného nasazení pomocí paralelních konfigurací témat se směrováním provozu Použijte progresivní nasazení s verzováním schématu v zátěžích událostí a postupném zavádění příjemců.
Definujte postupy vrácení zpět pro rychlé obnovení prostřednictvím obnovení konfigurace a vrácení zpět nasazení. Nastavte brány pro zvýšení kvality, včetně ověření schématu, kontrol stavu koncového bodu a ověření doručení.
Implementace IaC pro správu prostředků: K nastavení prostředků a správě konfigurací použijte nástroje IaC, jako jsou šablony Azure Resource Manageru (šablony ARM), Bicep a Terraform. Nakonfigurujte soubory parametrů pro nastavení specifická pro prostředí, jako jsou názvy témat, filtry předplatného a zásady zabezpečení. Do konfigurace můžete zahrnout témata, odběry, filtry událostí, cíle nedoručených dopisů a nastavení zabezpečení.
Implementujte vrstvené nasazení pro zpracování závislostí mezi prostředky Event Gridu, službami příjemců a zprostředkovateli identit. Nastavte detekci odchylek, abyste zachytili odchylky od požadovaných filtrů předplatného, zásad opakování a nastavení zabezpečení.
Navrhování kanálů pro sestavení a nasazení úloh: Navrhování architektury kanálu pro koordinaci nasazení témat, konfigurace předplatného a vydání verzí spotřebitelských aplikací. Implementujte nasazení specifické pro prostředí pro různé konfigurace, jako jsou pojmenování témat, filtry předplatného a zásady zabezpečení.
Pomocí nástrojů CI/CD, jako jsou Azure DevOps a GitHub Actions, můžete podporovat nasazení prostředků a koordinaci příjemců. Nastavte brány zabezpečení, jako je ověřování schématu, ověření zabezpečení koncového bodu a kontroly dodržování předpisů.
Implementujte správu artefaktů pro šablony konfigurace, definice schématu a balíčky pro nasazení klientů. Nastavte integraci monitorování pro přehled o úspěšném nasazení a stavu po nasazení.
Implementace monitorování a protokolování pro operace: Definujte strategii pozorovatelnosti pro sledování metrik doručení, zpracování telemetrie příjemců a kompletního toku událostí. Monitorujte metriky služeb, jako jsou míra úspěšnosti doručení, počty opakování, svazky nedoručených písmen a latence zpracování. Implementujte strukturované protokolování pro zachycení ID korelace událostí, zpracování výsledků, podrobností o chybách a kontextu řešení potíží.
Integrujte Azure Monitor, abyste získali analýzy Event Gridu, jako jsou provozní trendy a přehledy. Nakonfigurujte architekturu pro upozorňování, která podporuje výstrahy specifické pro pilíře pro spolehlivost, výkon, zabezpečení a náklady.
Povolte distribuované trasování pro sledování od začátku do konce, od publikování událostí až po zpracování spotřebitelem. Vytvářejte řídicí panely monitorování pro přehled o operacích úloh a stavu služby Event Grid v reálném čase.
Stanovení operací a postupů reakce na tísňové volání: Definujte procesy reakce na incidenty pro selhání doručení, výpadky uživatelů, regionální přerušení služeb a kaskádové selhání. Vytvořte operace převzetí služeb při selhání pro regionální výpadky prostřednictvím replikace témat napříč oblastmi a koordinace příjemců.
Vytvořte postupy reakce na mimořádné události pro scénáře doručení při krizových událostech, včetně priorit zpracování a obnovení klíčových pro podnikání. Definujte komunikační protokoly pro koordinaci reakce na incidenty napříč distribuovanými týmy, které spravují infrastrukturu a aplikace.
Automatizace operací správy a podpory služby Event Grid: Automatizujte úlohy správy, jako je vytváření témat, správa předplatného, konfigurace filtru událostí a nastavení nedoručených zpráv. Automatizace operací podpory, jako je řešení potíží se shromažďováním dat, agregací protokolů, přehráním událostí a úlohami údržby Nakonfigurujte detekci odchylek pro monitorování filtrů předplatného, zásad opakování a nastavení zabezpečení.
K vytvoření automatizace použijte rozhraní API služby Automation, Logic Apps a Event Grid. Vytvořte opakovaně použitelné automatizační moduly, které můžete sdílet napříč úlohami.
Implementace strategií testování a ověřování: Definujte strategie testování, jako je ověřování schématu, ověření koncového bodu, kompletní zpracování a testování integrace. Implementujte architektury automatizace testů, které nepřetržitě ověřují kompatibilitu schématu a zpracování příjemců.
Vytvořte testovací prostředí, která odpovídají produkčnímu nastavení, včetně konfigurací témat, předplatných a uživatelských nasazení. Použijte přístupy k produkčnímu testování, jako je kanárové publikování událostí, ověřování stavu klienta a řízené přehrávání událostí. Používejte testovací nástroje, jako jsou architektury ověřování schématu, nástroje pro testování koncových bodů a možnosti simulace.
Otestujte postupy vrácení zpět, abyste zajistili, že můžete obnovit konfiguraci a vrátit nasazení zpět.
Doporučení pro konfiguraci
| Recommendation | Prospěch |
|---|---|
| Vyvíjejte moduly IaC pomocí šablon ARM, Bicep nebo Terraformu pro témata, předplatná, domény a konfigurace zabezpečení. Vytvářejte modulární návrhy, které mají parametry pro různé scénáře a nastavení specifické pro prostředí. | Poskytuje konzistentní nasazení napříč prostředími, umožňuje opakovaně používat komponenty a zjednodušuje údržbu. |
| Nakonfigurujte nastavení diagnostiky pro směrování témat systému Event Gridu, vlastních témat a protokolů domény do pracovního prostoru služby Log Analytics. Povolte protokoly prostředků pro operace datové roviny, jako jsou pokusy o doručení událostí a odpovědi ze systému webhooku. Vytvářejte řídicí panely monitorování pomocí sešitů služby Azure Monitor , které zobrazují metriky, jako jsou míra úspěšnosti doručení, počty opakování, svazky nedoručených písmen a latence zpracování. Nakonfigurujte pravidla upozorňování pro provozní problémy, jako jsou selhání doručení, vysoká latence a akumulace dead letter. |
Poskytuje přehled o výkonu doručování událostí a stavu služby. Pomáhá rychle zjišťovat problémy a řešit potíže prostřednictvím centralizovaného protokolování a upozorňování. |
| Monitorování selhání doručení, snížení latence a akumulace front nedoručených zpráv pomocí upozornění služby Azure Monitor Ke sledování těchto problémů použijte pravidla upozornění založená na metrikách . Nastavte skupiny akcí tak, aby automaticky reagovaly odesíláním oznámení, spouštěním pracovních postupů Logic Apps nebo vyvoláním runbooků. Implementace inteligentního upozorňování pomocí dynamických prahových hodnot Tato funkce se učí vaše běžné vzorce a upozorňuje pouze v případě, že se metriky odchylují od základní linie, což snižuje falešné poplachy. Potlačit upozornění během časových období a nasazení plánované údržby, aby se snížila oznámení o očekávaných změnách. |
Pomáhá rychle reagovat na provozní problémy prostřednictvím automatizovaných výstrah a akcí. Inteligentní upozorňování snižuje falešná alarmy a provozní režii a přitom vám stále pomáhá informovat o stavu služby. |
| Vyvíjejte postupy reakce na incidenty pro selhání doručení, výpadky uživatelů a regionální převzetí služeb při selhání. Vytvořte runbooky , které automatizují běžné úlohy, jako je zpracování front nedoručených zpráv, vrácení konfigurací zpět a obnovení služby. Navazujte komunikační protokoly, které definují, komu se má eskalovat, jak informovat zúčastněné strany a jak hlásit stav. Definujte RTO a postupy pro různé scénáře selhání, od částečných výpadků po úplné přerušení služeb. |
Umožňuje koordinovanou reakci na incidenty, která minimalizuje dopad služby a dobu obnovení. Poskytuje standardizované postupy, které zajišťují konzistentní reakci v různých scénářích selhání. |
| Automatizujte administrativní úlohy, jako je správa předplatných, zřizování témat a údržba konfigurací, pomocí Automation, Logic Apps a Event Grid APIs. Vytvořte opakovaně použitelné automatizační moduly pro běžné operace, jako jsou aktualizace filtrů, konfigurace koncových bodů a aplikace zásad zabezpečení. Pomocí Služby Azure Policy můžete zjišťovat odchylky konfigurace u filtrů předplatného, zásad opakování a nastavení zabezpečení. Implementujte automatizovanou nápravu, která tyto odchylky opraví bez ručního zásahu. |
Snižuje ruční provozní úsilí a současně zajišťuje konzistenci konfigurace a dodržování předpisů. Umožňuje proaktivně spravovat konfiguraci, abyste zabránili provozním problémům prostřednictvím automatizovaného monitorování a nápravy. |
Efektivita výkonu
Výkonnostní efektivita se týká zachování uživatelského zážitku i při rostoucím zatížení řízením kapacity. Strategie zahrnuje škálování prostředků, identifikaci a optimalizaci potenciálních kritických bodů a optimalizaci výkonu ve špičce.
Návrhové principy efektivity výkonu poskytují strategii návrhu na vysoké úrovni pro dosažení cílů kapacity s ohledem na očekávané využití.
Kontrolní seznam návrhu úloh
Zahajte strategii návrhu na základě kontrolního seznamu pro kontrolu efektivity výkonu. Definujte směrný plán založený na klíčových ukazatelích výkonu pro Event Grid.
Plánování kapacity pro propustnost a škálovatelnost událostí: Odhadněte požadavky na objem událostí na základě vašich obchodních potřeb, jako jsou špičky míry událostí, velikosti zpráv a vzorce odběru. Analyzujte historické trendy událostí, sezónní odchylky a projekce obchodního rozšíření pro plánování růstu. Začleňte do návrhu limity a kvóty služeb, včetně událostí na téma, limitů předplatného a limitů propustnosti v jednotlivých oblastech.
Při plánování průchodnosti zvažte kapacitu zpracování spotřebitelů. Pomalí uživatelé způsobují "backpressure," který má vliv na výkon systému.
Před produkčním prostředím ověřte odhady kapacity prostřednictvím zátěžového testování a testování konceptu nasazení.
Definování strategií škálování pro témata a uživatele: Vyberte si mezi dvěma přístupy ke škálování. Použití škálování tématu nebo škálování uživatelů na základě charakteristik vašich úloh Pokud chcete škálovat téma, distribuujte zatížení napříč několika tématy, když se blížíte limitům propustnosti. Uspořádejte témata podle funkčních hranic nebo geografických oblastí. Pro škálování uživatelů použijte plány Functions Premium, Azure Container Apps nebo AKS k automatickému škálování na základě hloubky fronty a požadavků na zpracování.
Nakonfigurujte filtrování a směrování předplatného tak, aby distribuovali zatížení mezi příjemce. Pokud chcete navrhnout automatizaci škálování, použijte metriky Azure Monitoru a možnosti automatického škálování.
Testování efektivity škálování prostřednictvím zátěžového testování za účelem ověření aktivačních událostí, zpoždění a dopadu na výkon
Monitorování výkonu doručování událostí: Nastavte standardní hodnoty výkonu, jako jsou prahové hodnoty latence (p50, p95, p99 percentilů), cíle propustnosti a srovnávací testy doby zpracování. Monitorujte využití kapacity a určete, kdy upravit škálování nebo optimalizaci. Monitorujte kritické body v rámci kanálu doručování, včetně výkonu vydavatele, latence služby, síťového připojení a doby zpracování příjemců.
Nakonfigurujte upozorňování na snížení výkonu, včetně špiček latence, snížení propustnosti a zpomalení zpracování. Analyzujte trendy výkonu a identifikujte vzory, sezónní variace, postupné snížení výkonu a příležitosti optimalizace.
Pomocí distribuovaného trasování můžete analyzovat výkon na úrovni transakce a identifikovat kritické body v kanálu pro doručování událostí.
Proveďte testování výkonu pro vzory doručení událostí a kapacitu příjemce: Navrhněte testovací scénáře, které simulují normální zatížení, zatížení ve špičce a stresové podmínky s realistickými vzory publikování událostí. Pokud co nejvíce přizpůsobíte konfiguraci produkčnímu prostředí, získáte smysluplné výsledky. Pomocí nástrojů pro zátěžové testování otestujte výkon doručení, včetně nárazového provozu a udržitelného zatížení.
Provedením systematických testů stanovte referenční hodnoty. Tento přístup vám pomůže pochopit možnosti služeb, latence a omezení propustnosti. Otestujte nastavení automatického škálování, abyste měli jistotu, že se správně aktivuje a správně distribuuje zatížení za různých podmínek.
Analyzujte výsledky a identifikujte kritické body, zpoždění škálování a příležitosti optimalizace.
Optimalizace konfigurace doručování událostí a výkonu uživatelů: Nakonfigurujte nastavení doručení, jako jsou zásady opakování, vypršení časových limitů a cíle nedoručených dopisů, abyste maximalizovali míru úspěšnosti a minimalizovali latenci. Implementujte filtry předplatného, abyste snížili nepotřebné zpracování a doručovali pouze relevantní události. Pokud chcete maximalizovat propustnost, optimalizujte vzory příjemců, včetně dávkování, paralelního zpracování a sdružování připojení.
Optimalizujte datové části prostřednictvím efektivní serializace, komprese a návrhu schématu. Monitorování a optimalizace výkonu pomocí metrik, telemetrie a výsledků testování
Doporučení pro konfiguraci
| Recommendation | Prospěch |
|---|---|
| Vytvořte více témat a uspořádejte je podle funkčních hranic, geografických oblastí nebo typů událostí. Nakonfigurujte zásady vytváření názvů témat a logiku směrování pro automatický výběr tématu. Monitorujte metriky na úrovni tématu a zjistěte, kdy témata přistupují k limitům propustnosti. |
Překonává omezení propustnosti jednoho tématu a upevňuje logické oddělení, které zlepšuje udržovatelnost a zabezpečení. Umožňuje nezávisle škálovat konkrétní domény událostí. |
| Navrhněte koncové aplikace tak, aby se škálují automaticky na základě objemu událostí Event Gridu. Pro doručování nabízených oznámení implementujte aplikace příjemců pomocí plánu Functions Premium nebo Dedicated pro škálování na základě příchozích událostí. Pro pull doručování s tématy názvových oblastí navrhujte aplikace spotřebitelů, které mají dynamické možnosti škálování. Nakonfigurujte zásady opakování event Gridu a cíle nedoručených dopisů , abyste zajistili spolehlivé doručování během operací škálování příjemců. Pomocí filtrů odběru můžete distribuovat události napříč několika instancemi příjemců. |
Spotřebitelské aplikace zpracovávají špičky provozu prostřednictvím automatického škálování. Zajišťuje efektivitu prostředků prostřednictvím dynamického škálování. Funkce opakování a nedoručeného dopisu ve službě Event Grid zlepšují odolnost při přechodech škálování. |
Nakonfigurujte Azure Monitor tak, aby shromažďuje metriky výkonu, například DestinationProcessingDurationInMsPublishSuccessDurationInMs, a percentily latence doručení. Nastavte vlastní metriky pomocí Application Insights pro dobu zpracování specifickou pro spotřebitele a kompletní latenci. Vytvářejte řídicí panely výkonu pomocí sešitů azure Monitoru , které zobrazují trendy latence, rychlost propustnosti a časové distribuce zpracování. |
Umožňuje optimalizaci výkonu prostřednictvím analýzy latence a propustnosti. Identifikuje trendy výkonu a vzorce snížení výkonu. Podporuje plánování kapacity prostřednictvím monitorování propustnosti. |
| Nakonfigurujte upozornění na zhoršení latence, včetně situací, kdy prahové hodnoty 95. a 99. percentilu překračují vaše výchozí hodnoty výkonu. Nastavte dynamické prahové hodnoty pro detekci snížení propustnosti a zpomalení zpracování. Implementujte upozornění na nárůst doby zpracování spotřebitelů, které indikují výkonové zúžení. Nakonfigurujte upozornění, když se využití kapacity blíží prahové hodnotě škálování. |
Detekuje snížení výkonu před tím, než ovlivní uživatelské prostředí. Proaktivně optimalizuje výkon prostřednictvím včasné detekce. Identifikuje kritické body prostřednictvím monitorování doby zpracování. |
| Pomocí distribuovaných trasovacích dat můžete analyzovat kritické body výkonu v kanálu pro doručování událostí. Monitorujte metriky výkonu na transakční úrovni, abyste identifikovali pomalé závislosti a optimalizovali zpracování spotřebitelů. Analyzujte mapu aplikace , abyste identifikovali závislosti s vysokou latencí a optimalizovali cesty toku událostí. Nakonfigurujte profilaci výkonu, abyste získali podrobnou analýzu času zpracování vydavatele a příjemce. |
Identifikuje konkrétní kritické body výkonu na úrovni transakce. Cílí na optimalizaci na základě podrobné analýzy výkonu. Zlepšuje výkon prostřednictvím optimalizace závislostí. |
| Pomocí zátěžového testování můžete vygenerovat realistické vzory publikování za různých podmínek zatížení. Implementujte vlastní skripty pomocí JMeter nebo K6 k publikování událostí během testování, které mají reálné velikosti a četnosti. Nastavte testovací scénáře, abychom dostali váš systém k jeho kvótám a limitům služeb. Měření míry úspěšnosti doručení, latence, propustnosti a míry chyb |
Ověřuje výkon doručování před výrobou. Identifikuje limity služeb, abyste mohli přesně naplánovat kapacitu. Poskytuje konkrétní data pro vedení rozhodnutí o optimalizaci. |
| Otestujte chování automatického škálování v realistických úlohách pomocí služby Functions, Container Apps nebo AKS. Měření latence zpracování, hloubky fronty a zpoždění při škálování během změn zatížení. Ověřte zásady opakování, zpracování nedoručených zpráv a zpracování chyb při vysokém zatížení. Ověřte efektivitu filtrování předplatného a distribuci zatížení napříč instancemi. |
Zabraňuje kritickým bodům výkonu prostřednictvím ověřeného škálování. Zajišťuje, aby spotřebitelé mohli zvládat dodací modely při vysokém zatížení. Zvyšuje důvěru v výkon kompletního zpracování. |
| Optimalizujte způsob zpracování přechodných selhání systému, abyste zabránili dopadu na výkon. Nakonfigurujte zásady opakování předplatného s exponenciálním backoffem optimalizovaným pro vzory uživatelů. Nastavte hodnoty časového limitu doručení na základě možností uživatelů a charakteristik sítě. Implementujte filtrování předplatného pomocí pokročilé syntaxe pro doručování pouze relevantních událostí. Nakonfigurujte cíle 'dead-letter' pro úložiště a monitorování. |
Zrychluje doručování nastavením opakování a filtrováním nepotřebných událostí. Snižuje režii na provoz a zpracování. Vyrovnává spolehlivost a výkon. |
Zásady Azure
Azure poskytuje rozsáhlou sadu předdefinovaných zásad souvisejících se službou Event Grid a jejími závislostmi. Některé z předchozích doporučení je možné auditovat prostřednictvím služby Azure Policy. Můžete například zkontrolovat, jestli:
- Domény Event Gridu používají privátní propojení
- Témata event Gridu používají privátní propojení
- Protokolování podle skupiny kategorií pro domény Event Gridu je povolené pro Log Analytics.
- Protokolování podle skupiny kategorií pro témata Event Gridu je povolené pro Log Analytics
Komplexní zásady správného řízení najdete v integrovaných definicích služby Azure Policy pro Event Grid a další zásady, které by mohly ovlivnit zabezpečení infrastruktury zasílání zpráv.
Doporučení azure Advisoru
Azure Advisor je individuální cloudový konzultant, který vám pomůže postupovat podle osvědčených postupů pro optimalizaci nasazení Azure.
Další informace najdete v tématu o službě Azure Advisor.