Üzletmenet-folytonosság kezelése az Azure-ban
Az Azure az iparág egyik legfejlettebb és legelismertebb üzletmenet-folytonossági felügyeleti programját tartja fenn. Az Üzletmenet-folytonosság célja az Azure-ban a helyreállíthatóság és a rugalmasság növelése minden egymástól függetlenül helyreállítható szolgáltatás számára, függetlenül attól, hogy egy szolgáltatás ügyféloldali (egy Azure-ajánlat része) vagy egy belső támogató platformszolgáltatás.
Az üzletmenet folytonosságának megértéséhez fontos megjegyezni, hogy számos ajánlat több szolgáltatásból áll. Az Azure-ban az egyes szolgáltatások statikusan azonosíthatók az eszközök használatával, és az adatvédelmi, biztonsági, leltározási, kockázat-üzletmenet-folytonossági felügyelet és egyéb funkciók mértékegysége. A szolgáltatás képességeinek megfelelő méréséhez az egyes szolgáltatásokhoz a személyek, a folyamat és a technológia három eleme tartozik, a szolgáltatás típusától függetlenül.
Például:
- Ha van egy olyan üzleti folyamat, amely embereken, például ügyfélszolgálaton vagy csapaton alapul, a szolgáltatás kézbesítése az, amit csinálnak. A felhasználók folyamatokat és technológiát használnak a szolgáltatás végrehajtásához.
- Ha van olyan szolgáltatásként nyújtott technológia, mint például az Azure Virtual Machines, a szolgáltatásnyújtás a technológia, valamint a működést támogató személyek és folyamatok.
Megosztott felelősség modell
Az Azure számos ajánlata megköveteli a vészhelyreállítás beállítását több régióban, és nem a Microsoft feladata. Nem minden Azure-szolgáltatás replikálja automatikusan az adatokat, vagy automatikusan visszaesik egy meghibásodott régióból egy másik engedélyezett régióba történő keresztreplikáláshoz. Ezekben az esetekben Ön a felelős a helyreállítás és a replikáció konfigurálásáért.
A Microsoft biztosítja, hogy az alapinfrastruktúra és a platformszolgáltatások elérhetők legyenek. Bizonyos esetekben azonban a használat megköveteli, hogy többrégiós kapacitásban duplikálja az üzemelő példányokat és a tárterületet. Ezek a példák a megosztott felelősségi modellt szemléltetik. Ez az üzletmenet-folytonossági és vészhelyreállítási stratégia alapvető pillére.
A felelősség megosztása
Bármely helyszíni adatközpontban a teljes verem a tulajdonosa. Az eszközök felhőbe való áthelyezésekor bizonyos felelősségek átkerülnek a Microsoftra. Az alábbi ábra az üzembe helyezés típusának megfelelően mutatja be az Ön és a Microsoft közötti felelősségi területeket és felosztást.
A megosztott felelősségi modell jó példája a virtuális gépek üzembe helyezése. Ha régiók közötti replikációt szeretne beállítani a rugalmasság érdekében, ha régióhiba áll fenn, akkor a virtuális gépek ismétlődő készletét kell üzembe helyeznie egy másik engedélyezett régióban. Hiba esetén az Azure nem replikálja automatikusan ezeket a szolgáltatásokat. Az Ön feladata a szükséges eszközök üzembe helyezése. Rendelkeznie kell egy folyamatmal az elsődleges régiók manuális módosításához, vagy forgalomkezelővel kell észlelnie és automatikusan feladatátvételt végeznie.
Az ügyfél által engedélyezett vészhelyreállítási szolgáltatások mindegyike rendelkezik nyilvánosan elérhető dokumentációval, amely útmutatást nyújt Önnek. Az ügyfél által engedélyezett vészhelyreállítás nyilvánosan elérhető dokumentációját az Azure Data Lake Analyticsben találja.
A megosztott felelősségi modellről további információt a Microsoft Adatvédelmi központban talál.
Üzletmenet-folytonossági megfelelőség: Szolgáltatásszintű felelősség
Minden szolgáltatásra szükség van az Üzletmenet-folytonosság vészhelyreállítási rekordjainak elvégzéséhez az Azure Business Continuity Manager eszközben. A szolgáltatástulajdonosok az eszköz használatával összevont modellen belül dolgozhatnak az alábbiakat tartalmazó követelmények teljesítéséhez és beépítéséhez:
Szolgáltatástulajdonságok: Meghatározza a szolgáltatást, valamint a vészhelyreállítás és a rugalmasság megvalósításának módját, és azonosítja a vészhelyreállításért felelős felet (a technológia esetében). A helyreállítás tulajdonjogával kapcsolatos részletekért tekintse meg a megosztott felelősségi modellről az előző szakaszban és a diagramon található vitafórumot.
Üzleti hatáselemzés: Ez az elemzés segít a szolgáltatástulajdonosnak meghatározni a helyreállítási idő célkitűzését (RTO) és a helyreállítási pont célkitűzését (RPO) a szolgáltatás kritikussága alapján egy hatástáblán. A működési, jogi, szabályozási, márkaképi és pénzügyi hatásokat a helyreállítási célként használják.
Megjegyzés:
A Microsoft nem tesz közzé RTO-kat vagy RRP-eket a szolgáltatásokhoz, mert ezek az adatok csak belső mértékekre vonatkozik. Minden ügyfél ígérete és mértéke SLA-alapú, mivel szélesebb tartományt fed le, szemben az RTO-val vagy az RPO-val, amely csak katasztrofális veszteség esetén alkalmazható.
Függőségek: Minden szolgáltatás leképezi a szükséges függőségeket (más szolgáltatások), függetlenül attól, hogy milyen kritikus fontosságú, és futtatókörnyezetre van leképezve, amely csak a helyreállításhoz szükséges, vagy mindkettő. Ha vannak tárolási függőségek, egy másik adat van leképezve, amely meghatározza a tárolt adatokat, és ha például időponthoz kötött pillanatképekre van szükség.
Munkaerő: A szolgáltatás definíciójában leírtak szerint fontos ismerni a szolgáltatást támogató munkaerő helyét és mennyiségét, biztosítva egyetlen meghibásodási pontot sem, és ha a kritikus fontosságú alkalmazottak el vannak oszlva, hogy elkerülhessék a meghibásodásokat egy helyen való együttéléssel.
Külső beszállítók: A Microsoft a külső szállítók átfogó listáját tárolja, és a kritikusnak ítélt beszállítókat a képességek szempontjából mérik. Ha egy szolgáltatás függőségként azonosítja, a szállítói képességek a szolgáltatás igényeivel vannak összehasonlítva annak biztosítása érdekében, hogy egy külső fél leállása ne zavarja meg az Azure-szolgáltatásokat.
Helyreállítási minősítés: Ez a minősítés egyedi az Azure Üzletmenet-folytonossági felügyeleti program esetében. Ez a minősítés több fő elemet mér a rugalmassági pontszám létrehozásához:
- Feladatátvételi hajlandóság: Bár lehet egy folyamat, lehet, hogy nem ez az első választás a rövid távú leállások esetén.
- A feladatátvétel automatizálása.
- A feladatátvételi döntés automatizálása.
A feladatátvétel legmegbízhatóbb és legrövidebb ideje egy automatizált szolgáltatás, amely nem igényel emberi döntést. Az automatizált szolgáltatások szívverés-figyelést vagy szintetikus tranzakciókat használnak annak megállapítására, hogy a szolgáltatás leállt, és azonnali szervizelést indít el.
Helyreállítási terv és teszt: Az Azure megköveteli, hogy minden szolgáltatás részletes helyreállítási tervvel rendelkezzen, és úgy tesztelje a tervet, mintha a szolgáltatás katasztrofális leállása miatt meghiúsult volna. A helyreállítási terveket meg kell írni, hogy a hasonló képességekkel és hozzáféréssel rendelkező személyek elvégezhessék a feladatokat. Az írásos terv nem támaszkodik a témával foglalkozó szakértőkre.
A tesztelés többféleképpen történik, beleértve az öntesztelést éles vagy közel éles környezetben, valamint az Azure teljes régiós lehatolásainak részeként a kanári-régiókészletekben. Ezek az engedélyezett régiók azonosak az éles régiókhoz, de a szolgáltatások befolyásolása nélkül letilthatók. A tesztelés integráltnak minősül, mert az összes szolgáltatásra egyszerre van hatással.
Ügyfél-engedélyezés: Ha Ön felelős a vészhelyreállítás beállításáért, az Azure-nak nyilvánosan elérhető dokumentációs útmutatóval kell rendelkeznie. Minden ilyen szolgáltatás esetében a dokumentációra és a folyamat részleteire mutató hivatkozások találhatók.
Üzletmenet-folytonossági megfelelőség ellenőrzése
Ha egy szolgáltatás befejezte az üzletmenet-folytonossági felügyeleti rekordját, jóváhagyásra kell küldenie. Egy üzletmenet-folytonossági felügyelettel foglalkozó tapasztalt szakemberhez van rendelve, aki áttekinti a teljes rekordot a teljesség és a minőség érdekében. Ha a rekord megfelel az összes követelménynek, jóváhagyja. Ha nem, az újradolgozásra vonatkozó kéréssel elutasítja. Ez a folyamat biztosítja, hogy mindkét fél egyetértsen abban, hogy az üzletmenet-folytonossági megfelelőség teljesült, és hogy a munkát csak a szolgáltatás tulajdonosa igazolja. Az Azure belső naplózási és megfelelőségi csapatai rendszeres véletlenszerű mintavételezést is végeznek annak érdekében, hogy a legjobb adatok legyenek elküldve.
Szolgáltatások tesztelése
A Microsoft és az Azure átfogó tesztelést végez mind a vészhelyreállítás, mind a rendelkezésre állási zónák felkészültsége érdekében. A szolgáltatások öntesztelhetők éles vagy üzem előtti környezetben, hogy igazolják a független helyreállíthatóságot az olyan szolgáltatások esetében, amelyek nem függenek a fő platform feladatátvételétől.
Annak érdekében, hogy a szolgáltatások hasonló helyreálljanak egy valódi régiós leállás esetén, a "pull-the-plug" típusú tesztelés olyan kanári környezetekben történik, amelyek teljes mértékben üzembe helyezett régiók, amelyek megfelelnek az éles környezetnek. A fürtök, állványok és energiaegységek például szó szerint ki vannak kapcsolva a teljes régióhiba szimulálásához.
A tesztek során az Azure ugyanazt az éles folyamatot használja az észleléshez, az értesítéshez, a válaszhoz és a helyreállításhoz. Egyetlen személy sem vár részletezést, és a helyreállításra támaszkodó mérnökök a normál ügyeleti rotációs erőforrások. Ez az időzítés elkerülhető attól függően, hogy a téma szakértői nem érhetők el egy tényleges esemény során.
Ezek a tesztek olyan szolgáltatások, amelyek a Microsoft nyilvános dokumentációját követve a vészhelyreállítás beállításáért felelősek. A szolgáltatáscsapatok ügyfélhez hasonló példányokat hoznak létre, amelyek azt mutatják, hogy az ügyfél által engedélyezett vészhelyreállítás a várt módon működik, és hogy a megadott utasítások pontosak.
A minősítésekkel kapcsolatos további információkért tekintse meg a Microsoft adatvédelmi központját és a megfelelőségről szóló szakaszt.