Megbízhatóság az Azure Traffic Managerben
Ez a cikk az Azure Traffic Manager régióközi vészhelyreállítását és üzletmenet-folytonossági támogatását tartalmazza.
Régiók közötti vészhelyreállítás és üzletmenet-folytonosság
A vészhelyreállítás (DR) a nagy hatású események, például a természeti katasztrófák vagy az állásidőt és adatvesztést eredményező sikertelen üzemelő példányok helyreállításáról szól. A katasztrófa okától függetlenül a legjobb megoldás egy jól definiált és tesztelt DR-terv, valamint egy olyan alkalmazásterv, amely aktívan támogatja a DR-t. Mielőtt elkezdene gondolkodni a vészhelyreállítási terv létrehozásáról, tekintse meg a vészhelyreállítási stratégia tervezésére vonatkozó javaslatokat.
A DR-ről a Microsoft a megosztott felelősségi modellt használja. Egy megosztott felelősségi modellben a Microsoft biztosítja, hogy az alapinfrastruktúra és a platformszolgáltatások elérhetők legyenek. Ugyanakkor számos Azure-szolgáltatás nem replikálja automatikusan az adatokat, vagy egy meghibásodott régióból visszaesik egy másik engedélyezett régióba történő keresztreplikáláshoz. Ezekért a szolgáltatásokért Ön felel a számítási feladathoz használható vészhelyreállítási terv beállításáért. Az Azure-platformon szolgáltatásként (PaaS) futó szolgáltatások többsége funkciókkal és útmutatással támogatja a DR-t, és szolgáltatásspecifikus funkciókkal támogatja a gyors helyreállítást a dr. csomag fejlesztéséhez.
Az Azure Traffic Manager egy DNS-alapú forgalom terheléselosztó, amely lehetővé teszi a forgalmat a nyilvánosan elérhető alkalmazások között a globális Azure-régiók között. A Traffic Manager emellett magas rendelkezésre állást és gyors válaszkészséget biztosít a nyilvános végpontoknak.
A Traffic Manager DNS használatával irányítja az ügyfélkéréseket a megfelelő szolgáltatásvégpontra egy forgalomirányítási módszer alapján. A Traffic Manager emellett minden végpont állapotfigyelését is biztosítja. A végpont lehet bármely, az Azure-ban vagy azon kívül üzemeltetett internetes szolgáltatás. A Traffic Manager különböző forgalom-útválasztási módszereket és végpont-monitorozási lehetőségeket biztosít, hogy megfeleljen a különböző alkalmazások igényeinek és az automatikus feladatátvételi modelleknek. A Traffic Manager ellenáll a meghibásodásoknak, beleértve akár egy egész Azure-régió meghibásodását is.
Vészhelyreállítás többrégiós földrajzi területen
A DNS az egyik leghatékonyabb mechanizmus a hálózati forgalom átirányítására. A DNS azért hatékony, mert a DNS gyakran globális és az adatközponton kívüli. A DNS minden regionális vagy rendelkezésre állási zóna (AZ) szintű meghibásodástól is el van szigetelve.
A vészhelyreállítási architektúra beállításának két technikai aspektusa van:
Példányok, adatok és konfigurációk replikálása az elsődleges és a készenléti környezetek között üzembe helyezési mechanizmus használatával. Az ilyen típusú vészhelyreállítás natív módon is elvégezhető azAzure Site Recovery használatával, lásd az Azure Site Recovery dokumentációját a Microsoft Azure-partnerberendezéseken/szolgáltatásokon, például a Veritason vagy a NetAppon keresztül.
Olyan megoldás fejlesztése, amely átirányítja a hálózati/webes forgalmat az elsődleges helyről a készenléti helyre. Az ilyen típusú vészhelyreállítás az Azure DNS-en, az Azure Traffic Manageren (DNS) vagy a külső globális terheléselosztókon keresztül érhető el.
Ez a cikk kifejezetten az Azure Traffic Manager vészhelyreállítási tervezésével foglalkozik.
Üzemkimaradás észlelése, értesítés és felügyelet
Katasztrófa esetén az elsődleges végpont mintavétele és az állapot romlik, és a vészhelyreállítási hely online állapotban marad. A Traffic Manager alapértelmezés szerint minden forgalmat az elsődleges (legmagasabb prioritású) végpontra irányít. Ha az elsődleges végpont csökkentett teljesítményűnek tűnik, a Traffic Manager a forgalmat a második végpontra irányítja, amíg az kifogástalan állapotban marad. A Traffic Managerben több végpontot is konfigurálhat, amelyek további feladatátvételi végpontokként szolgálhatnak, vagy terheléselosztókként, amelyek a végpontok között osztják meg a terhelést.
Vészhelyreállítás és üzemkimaradás észlelésének beállítása
Ha összetett architektúrákkal és több erőforráskészlettel rendelkezik, amelyek képesek ugyanazt a funkciót elvégezni, konfigurálhatja az Azure Traffic Managert (DNS-alapú) az erőforrások állapotának ellenőrzésére, és a nem kifogástalan erőforrásból az kifogástalan erőforrás felé irányuló forgalmat irányíthatja.
Az alábbi példában mind az elsődleges régió, mind a másodlagos régió teljes üzembe helyezéssel rendelkezik. Ez az üzembe helyezés magában foglalja a felhőszolgáltatásokat és a szinkronizált adatbázist.
Ábra – Automatikus feladatátvétel az Azure Traffic Managerrel
Azonban csak az elsődleges régió kezeli aktívan a felhasználóktól érkező hálózati kéréseket. A másodlagos régió csak akkor válik aktívvá, ha az elsődleges régió szolgáltatáskimaradást tapasztal. Ebben az esetben az összes új hálózati kérés a másodlagos régióba irányítja az útvonalat. Mivel az adatbázis biztonsági mentése szinte azonnal megtörténik, mindkét terheléselosztó rendelkezik olyan IP-címekkel, amelyek állapot-ellenőrzéssel ellenőrizhetők, és a példányok folyamatosan futnak, ez a topológia lehetővé teszi, hogy manuális beavatkozás nélkül alacsony RTO-t és feladatátvételt végezzenek. A másodlagos feladatátvételi régiónak azonnal készen kell állnia a működésre az elsődleges régió meghibásodása után.
Ez a forgatókönyv ideális az Azure Traffic Manager használatához, amely beépített mintavételekkel rendelkezik a különböző típusú állapot-ellenőrzésekhez, beleértve a HTTP/HTTPS-t és a TCP-t. Az Azure Traffic Manager rendelkezik egy szabálymotorral is, amely konfigurálható a feladatátvételre, ha hiba történik az alábbiak szerint. Vegyük fontolóra az alábbi megoldást a Traffic Manager használatával:
- Az ügyfél az 1. régióvégpontot prod.contoso.com néven ismeri, amelynek statikus IP-címe 100.168.124.44, a régió #2 végpontja pedig dr.contoso.com, statikus IP-címmel pedig 100.168.124.43.
- Ezek a környezetek egy nyilvános elérésű tulajdonságon, például terheléselosztón keresztül jelennek meg. A terheléselosztó úgy konfigurálható, hogy DNS-alapú végpont vagy teljes tartománynév (FQDN) legyen a fent látható módon.
- A 2. régió összes példánya közel valós idejű replikációban van az 1. régióval. Emellett a gép lemezképei naprakészek, és minden szoftver-/konfigurációs adat ki van javítva, és összhangban van az 1. régióval.
- Az automatikus skálázás előre konfigurálva van.
A feladatátvétel konfigurálása az Azure Traffic Managerrel:
Hozzon létre egy új Azure Traffic Manager-profilt, hozzon létre egy új Azure Traffic Manager-profilt contoso123 néven, és válassza az Útválasztási módszert prioritásként. Ha már rendelkezik egy már meglévő erőforráscsoporttal, amelyhez társítani szeretne, választhat egy meglévő erőforráscsoportot, ellenkező esetben létrehozhat egy új erőforráscsoportot.
Ábra – Traffic Manager-profil létrehozása
Végpontok létrehozása a Traffic Manager-profilban
Ebben a lépésben olyan végpontokat hoz létre, amelyek az éles és vészhelyreállítási helyekre mutatnak. Itt válassza ki a Típust külső végpontként, de ha az erőforrás az Azure-ban van üzemeltetve, akkor az Azure-végpontot is választhatja. Ha az Azure-végpontot választja, válassza ki az App Service vagy az Azure által lefoglalt nyilvános IP-címet tartalmazó célerőforrást. A prioritás értéke 1 , mivel ez az 1. régió elsődleges szolgáltatása. Hasonlóképpen hozza létre a Traffic Manager vészhelyreállítási végpontot is.
Ábra – Vészhelyreállítási végpontok létrehozása
Állapot-ellenőrzési és feladatátvételi konfiguráció beállítása
Ebben a lépésben 10 másodpercre állítja a DNS TTL-t, amelyet a legtöbb internetes rekurzív feloldó betart. Ez a konfiguráció azt jelenti, hogy egyetlen DNS-feloldó sem fogja 10 másodpercnél tovább gyorsítótárazza az adatokat.
A végpontfigyelő beállításainál az elérési út jelenleg a /vagy a root értéken van beállítva, de testre szabhatja a végpontbeállításokat egy elérési út kiértékeléséhez, például prod.contoso.com/index.
Az alábbi példában a https mint próbaprotokoll látható. Választhat azonban http- vagy TCP-t is. A protokoll kiválasztása a végső alkalmazástól függ. A próbaidő 10 másodpercre van állítva, ami lehetővé teszi a gyors próbaidőt, az újrapróbálkozás pedig 3-ra van állítva. Ennek eredményeképpen a Traffic Manager feladatátvételt fog végezni a második végponton, ha három egymást követő időköz hibát regisztrál.
Az automatikus feladatátvétel teljes idejét az alábbi képlet határozza meg:
Time for failover = TTL + Retry * Probing interval
Ebben az esetben az érték 10 + 3 * 10 = 40 másodperc (Max).
Ha az Újrapróbálkozás értéke 1, a TTL értéke 10 másodperc, akkor a feladatátvétel ideje 10 + 1 * 10 = 20 másodperc.
Állítsa az újrapróbálkozást 1-nél nagyobb értékre, hogy kiküszöbölje a feladatátvételek esélyét hamis pozitív értékek vagy kisebb hálózati három pont miatt.
Ábra – Állapot-ellenőrzési és feladatátvételi konfiguráció beállítása