Megbízhatóság az Azure Event Gridben és az Event Grid-névtérben
Ez a cikk részletes információkat tartalmaz az Event Grid és az Event Grid névtér regionális rugalmasságáról rendelkezésre állási zónákkal, valamint régiók közötti vészhelyreállítással és üzletmenet-folytonossággal.
Az Azure megbízhatóságának architekturális áttekintéséért tekintse meg az Azure megbízhatóságát.
Rendelkezésre állási zóna támogatása
Az Azure rendelkezésre állási zónái legalább három fizikailag különálló adatközpont-csoport az egyes Azure-régiókban. Az egyes zónákban lévő adatközpontok független energiaellátási, hűtési és hálózati infrastruktúrával rendelkeznek. Helyi zónahiba esetén a rendelkezésre állási zónák úgy vannak kialakítva, hogy az egy zóna érintettsége esetén a fennmaradó két zóna támogassa a regionális szolgáltatásokat, a kapacitást és a magas rendelkezésre állást.
A hibák a szoftver- és hardverhibáktól az olyan eseményekig terjedhetnek, mint a földrengések, árvizek és tűzesetek. A hibáktól való tolerancia az Azure-szolgáltatások redundanciával és logikai elkülönítésével érhető el. Az Azure-beli rendelkezésre állási zónákkal kapcsolatos részletesebb információkért tekintse meg a Régiók és a rendelkezésre állási zónák című témakört.
Az Azure rendelkezésre állási zónákkal kompatibilis szolgáltatások a megfelelő megbízhatósági és rugalmassági szintet biztosítják. Ezek kétféleképpen konfigurálhatók. Ezek lehetnek zónaredundánsak, a zónák közötti automatikus replikációval vagy a zónák közötti automatikus replikációval, egy adott zónába rögzített példányokkal. Ezeket a megközelítéseket kombinálhatja is. A zónaredundáns és a zónaredundáns architektúráról további információt a rendelkezésre állási zónák és régiók használatára vonatkozó javaslatok című témakörben talál.
A témakörök, rendszertémakörök, tartományok, esemény-előfizetések és eseményadatok Event Grid-erőforrásdefiníciói automatikusan három rendelkezésre állási zónára replikálódnak. Ha az egyik rendelkezésre állási zónában regionális hiba történik, az Event Grid-erőforrások emberi beavatkozás nélkül automatikusan feladatátvételt adnak át egy másik rendelkezésre állási zónába. Jelenleg nem lehet szabályozni (engedélyezni vagy letiltani) ezt a funkciót. Amikor egy meglévő régió elkezdi támogatni a rendelkezésre állási zónákat, a meglévő Event Grid-erőforrások automatikusan feladatátvételt hajtanak létre a funkció előnyeinek kihasználásához. Nincs szükség az ügyfél beavatkozására.
Az Azure Event Grid-névtér a rendelkezésre állási zónák használatával régión belüli magas rendelkezésre állást is biztosít.
Előfeltételek
A rendelkezésre állási zónák támogatásához az Event Grid-erőforrásoknak olyan régióban kell lenniük, amely támogatja a rendelkezésre állási zónákat. A rendelkezésre állási zónákat támogató régiók áttekintéséhez tekintse meg a támogatott régiók listáját.
Díjszabás
Mivel az Event Grid automatikusan támogatja a rendelkezésre állási zónákat támogató régiókban a rendelkezésre állási zónákat, az ár nem változik.
Erőforrás létrehozása engedélyezett rendelkezésre állási zónákkal
Mivel az Event Grid automatikusan támogatja a rendelkezésre állási zónákat támogató régiókban a rendelkezésre állási zónákat, nincs szükség beállítási konfigurációra.
Migrálás a rendelkezésre állási zónák támogatására
Ha az Event Grid-erőforrásokat olyan régióba helyezi át, amely támogatja a rendelkezésre állási zónákat, automatikusan megkapja a rendelkezésre állási zónák támogatását. Ha tudni szeretné, hogyan helyezheti át az erőforrásokat egy másik, a rendelkezésre állási zónákat támogató régióba, tekintse meg a következőket:
- Az Azure Event Grid rendszertémakörök áthelyezése egy másik régióba
- Egyéni Azure Event Grid-témakörök áthelyezése másik régióba
- Azure Event Grid-tartományok áthelyezése másik régióba
Régiók közötti vészhelyreállítás és üzletmenet-folytonosság
A vészhelyreállítás (DR) a nagy hatású események, például a természeti katasztrófák vagy az állásidőt és adatvesztést eredményező sikertelen üzemelő példányok helyreállításáról szól. A katasztrófa okától függetlenül a legjobb megoldás egy jól definiált és tesztelt DR-terv, valamint egy olyan alkalmazásterv, amely aktívan támogatja a DR-t. Mielőtt elkezdene gondolkodni a vészhelyreállítási terv létrehozásáról, tekintse meg a vészhelyreállítási stratégia tervezésére vonatkozó javaslatokat.
A DR-ről a Microsoft a megosztott felelősségi modellt használja. Egy megosztott felelősségi modellben a Microsoft biztosítja, hogy az alapinfrastruktúra és a platformszolgáltatások elérhetők legyenek. Ugyanakkor számos Azure-szolgáltatás nem replikálja automatikusan az adatokat, vagy egy meghibásodott régióból visszaesik egy másik engedélyezett régióba történő keresztreplikáláshoz. Ezekért a szolgáltatásokért Ön felel a számítási feladathoz használható vészhelyreállítási terv beállításáért. Az Azure-platformon szolgáltatásként (PaaS) futó szolgáltatások többsége funkciókkal és útmutatással támogatja a DR-t, és szolgáltatásspecifikus funkciókkal támogatja a gyors helyreállítást a dr. csomag fejlesztéséhez.
A vészhelyreállítás általában egy biztonsági mentési erőforrás létrehozását foglalja magában, amely megakadályozza a régiók egészségtelenné válásának megszakítását. A folyamat során az Azure Event Grid-erőforrások elsődleges és másodlagos régiójára lesz szükség a számítási feladatban.
Az alkalmazásfunkciók súlyos elvesztéséből különböző módokon lehet helyreállítani a helyreállítást. Ebben a szakaszban azokat az ellenőrzőlistát ismertetjük, amelyekre szüksége lesz ahhoz, hogy felkészítse az ügyfelet a nem megfelelő erőforrás vagy régió miatti meghibásodás utáni helyreállításra.
Az Event Grid támogatja a manuális és az automatikus geo-vészhelyreállítást (GeoDR) a kiszolgáló oldalán. Az ügyféloldali vészhelyreállítási logikát akkor is implementálhatja, ha nagyobb ellenőrzést szeretne a feladatátvételi folyamaton. Az automatikus GeoDR-ről további információt az Azure Event Grid kiszolgálóoldali geo-vészhelyreállításában talál. Az ügyféloldali vészhelyreállítás implementálásának részleteiért tekintse meg az ügyféloldali feladatátvételi implementációt az Azure Event Gridben.
Az alábbi táblázat az Event Grid ügyféloldali feladatátvételi és geo-vészhelyreállítási támogatását mutatja be.
Event Grid-erőforrás | Ügyféloldali feladatátvétel támogatása | Geo-vészhelyreállítás (GeoDR) támogatása |
---|---|---|
Egyéni témakörök | Támogatott | Geoközi / regionális |
Rendszertémakörök | Nem támogatott | Automatikusan engedélyezve |
Tartományok | Támogatott | Geoközi / regionális |
Partnernévterek | Támogatott | Nem támogatott |
Névterek | Támogatott | Nem támogatott |
Eseményrács névtere
Az Event Grid-névtér nem támogatja a régiók közötti DR-t. A régiók közötti magas rendelkezésre állást azonban ügyféloldali feladatátvételi implementációval érheti el elsődleges és másodlagos névterek létrehozásával.
Ügyféloldali feladatátvételi implementációval:
Egyéni (manuális vagy automatizált) folyamat implementálása a névtér, az ügyfélidentitások és egyéb konfigurációk** replikálására, beleértve a hitelesítésszolgáltatói tanúsítványokat, ügyfélcsoportokat, témakörtereket, engedélykötéseket, útválasztást az elsődleges és másodlagos régiók között.
Implementáljon egy concierge szolgáltatást , amely elsődleges és másodlagos végpontokat biztosít az ügyfelek számára a végpontok állapotának ellenőrzésével. A concierge szolgáltatás lehet egy webalkalmazás, amely dns-átirányítási technikákkal replikált és elérhető marad, például az Azure Traffic Manager használatával.
Active-Active DR-megoldás elérése a metaadatok replikálásával és a terhelés kiegyensúlyozásával a névterek között. Aktív-passzív dr. megoldás érhető el a metaadatok replikálásával, hogy a másodlagos névtér készen maradjon, így ha az elsődleges névtér nem érhető el, a forgalom átirányítható a másodlagos névtérbe.
Vészhelyreállítás beállítása
A párosított régiók esetében az Event Grid lehetővé teszi a párosított régióba irányuló közzétételi forgalom feladatátvételét egyéni témakörök, rendszertémakörök és tartományok esetében. A színfalak mögött az Event Grid automatikusan szinkronizálja a témakörök, rendszertémakörök, tartományok és esemény-előfizetések erőforrásdefinícióit a párosított régióba. Az eseményadatok azonban nem replikálódnak a párosított régióba. Normál állapotban az események az adott erőforráshoz kiválasztott régióban vannak tárolva. Amikor egy régió leáll, és a Microsoft kezdeményezi a feladatátvételt, az új események a földrajzilag párosított régióba kerülnek, és onnan küldik el, ön beavatkozás nélkül. Az eredeti régióban közzétett és elfogadott események onnan lesznek elküldve a kimaradás enyhítése után.
Két feladatátvételi lehetőség közül választhat, a Microsoft által kezdeményezett feladatátvétel és az ügyfél által kezdeményezett lehetőségek közül. A két beállítás konfigurálásának részletes lépéseit az adattárolás konfigurálása című témakörben találja.
A Microsoft által kezdeményezett feladatátvételt ritkán gyakorolja a Microsoft az Event Grid-erőforrásoknak az érintett régióból a megfelelő földrajzilag párosított régióba történő feladatátvételére. A Microsoft fenntartja a jogot annak meghatározására, hogy mikor gyakorolja ezt a lehetőséget. Ez a mechanizmus nem foglal magában felhasználói hozzájárulást a felhasználó forgalmának feladatátvétele előtt.
Engedélyezze ezt a funkciót a témakör vagy tartomány konfigurációjának frissítésével. A Microsoft által kezdeményezett feladatátvétel engedélyezéséhez válassza a Cross-Geo (alapértelmezett) lehetőséget.
Az ügyfél által kezdeményezett feladatátvételt az Azure Event Grid-témakörök és -tartományok egyéni vészhelyreállítási terve határozza meg, a Microsoft semmilyen adatot nem replikál egy másik régióba. Bár ez a feladatátvételi lehetőség egy kicsit nagyobb erőfeszítést igényel, gyorsabb feladatátvételt tesz lehetővé, és Ön irányíthatja a másodlagos régiók kiválasztását. Ha ügyféloldali vészhelyreállítást szeretne implementálni az Azure Event Grid-témakörökhöz, olvassa el a saját ügyféloldali vészhelyreállítás azure Event Grid-témakörökben való létrehozását.
Néhány oka lehet annak, hogy le szeretné tiltani a Microsoft által kezdeményezett feladatátvételi funkciót:
- A Microsoft által kezdeményezett feladatátvétel a lehető legjobb munkamennyiség alapján történik.
- Egyes geopárok nem felelnek meg a szervezet adattárolási követelményeinek.
Engedélyezze ezt a funkciót a témakör vagy tartomány konfigurációjának frissítésével. Válassza a Területi lehetőséget.
Ha nem párosított régiót használ, akkor a választott adattárolási konfigurációtól függetlenül a metaadatok csak a régión belül lesznek replikálva.
Vészhelyreállítási feladatátvételi élmény
A vészhelyreállítást két metrika , a helyreállítási pont célkitűzése (RPO) és a helyreállítási idő célkitűzése (RTO) méri.
Az Event Grid automatikus feladatátvétele a metaadatokhoz (témakörök, tartományok, esemény-előfizetések) és adatokhoz (eseményekhez) különböző RPO-kat és KPO-kat biztosít. Ha az alábbitól eltérő specifikációra van szüksége, akkor is implementálhatja saját ügyféloldali feladatátvételét a témakör állapot api-jait használva.
Helyreállítási időkorlát (RPO)
Metaadatok RPO: nulla perc. Az alkalmazható erőforrások esetében, amikor létrehoz/frissít/töröl egy erőforrást, az erőforrásdefiníció szinkron módon replikálódik a geopárra. Feladatátvétel esetén a metaadatok nem vesznek el.
AdatRPO: Feladatátvétel esetén a rendszer új adatokat dolgoz fel a párosított régióból. Amint az érintett régióban enyhítik a kimaradást, a feldolgozatlan események onnan lesznek elküldve. Ha a régió helyreállítása hosszabb időt igényelt, mint az eseményeken beállított élettartamérték , az adatok eleshetnek. Az adatvesztés csökkentése érdekében javasoljuk, hogy állítson be egy kézbesíthetetlen levél célhelyet egy esemény-előfizetéshez. Ha az érintett régió elveszett és nem helyreállítható, akkor adatvesztés történik. A legjobb esetben az előfizető lépést tart a közzétételi gyakorisággal, és csak néhány másodpercnyi adat vesz el. A legrosszabb eset az lenne, ha az előfizető nem dolgoz fel aktívan eseményeket, és a maximális élettartam 24 óra, az adatvesztés akár 24 óra is lehet.
Helyreállítási időre vonatkozó célkitűzés (RTO)
Metaadatok RTO: A feladatátvételi döntéshozatal olyan tényezőkön alapul, mint a párosított régióban elérhető kapacitás, és akár 60 perc vagy több ideig is tarthat. A feladatátvételt követően 5 percen belül az Event Grid elkezdi fogadni a témakörökre és előfizetésekre vonatkozó létrehozási/frissítési/törlési hívásokat.
AdatRTO: Ugyanaz, mint a fenti információk.
Fontos
- Kiszolgálóoldali vészhelyreállítás esetén, ha a párosított régiónak nincs további kapacitása a további forgalomra, az Event Grid nem kezdeményezhet feladatátvételt. A helyreállítás a legjobb munkamennyiség alapján történik.
- A szolgáltatás használatáért nem számítunk fel díjat.
- A georeduktúra-helyreállítás nem támogatott a partnernévterek és a partnertémakörök esetében.