Védelem és helyreállítás a felhőfelügyeletben

Mielőtt felkészül egy lehetséges számítási feladat kimaradására, a felhőfelügyeleti csapatoknak először meg kell győződniük arról, hogy megfelelnek a következő követelményeknek:

A tervek szerint a csapatoknak azzal a feltételezéssel kell kezdeniük, hogy katasztrófa esetén valami meghiúsul. A leállások előkészítése lehetővé teszi, hogy a csapatok hamarabb észleljék a hibákat, és gyorsabban helyreálljanak. Ennek a szemléletnek a középpontjában azok a lépések kerülnek, amelyek közvetlenül a rendszer meghibásodása után jönnek. Hogyan védheti meg a számítási feladatokat, hogy azok gyorsan helyreállíthatók legyenek, ha kimaradás történik?

Egyetlen műszaki megoldás sem tud következetesen olyan SLA-t kínálni, amely 100%-os üzemidőt garantál. A legredundánsabb architektúrával rendelkező megoldások azt állítják, hogy "hat 9s" vagy 99,9999 százalékos üzemidőt biztosítanak. De még egy "hat 9s" megoldás is 31,6 másodpercre csökken egy adott évben. Ritkán fordul elő, hogy egy megoldás olyan nagy, folyamatban lévő működési beruházást indokoljon, amely a "hat kilences" üzemidő eléréséhez szükséges.

Védelmi és helyreállítási beszélgetések fordítása

Az üzleti műveletekhez kapcsolódó számítási feladatok a következőkből állnak:

  • alkalmazások
  • adatok
  • virtuális gépek (virtuális gépek)
  • egyéb eszközök

Előfordulhat, hogy minden eszköznek saját megközelítést kell használnia a védelemhez és a helyreállításhoz. Ennek a szemléletnek a fontos célja, hogy egységes elkötelezettséget alakítson ki a felügyeleti alapkonfigurációban, amely kiindulópontot nyújthat az üzleti megbeszélésekhez.

A felhőfelügyeleti csapatoknak legalább alapszintű megközelítést kell létrehozniuk az egyes objektumokhoz, egyértelmű elkötelezettséggel a gyors helyreállítás és a minimális adatvesztés mellett.

Helyreállítási idő célkitűzései (RTO)

A helyreállítási idő célkitűzése az, hogy mennyi időt kell igénybe vennie ahhoz, hogy a rendszer egy katasztrófa előtt helyreállítsa az állapotát. Ez magában foglalja a következőkhöz szükséges időt:

  • minimális funkcionalitás visszaállítása virtuális gépekre és alkalmazásokra
  • az alkalmazások által igényelt adatok visszaállítása.

Üzleti szempontból az RTO azt az időtartamot jelöli, amellyel az üzleti folyamatok elfogyott. A kritikus fontosságú számítási feladatok esetében ennek a változónak viszonylag alacsonynak kell lennie, ami lehetővé teszi az üzleti folyamatok gyors folytatását. Alacsonyabb prioritású számítási feladatok esetén előfordulhat, hogy az RTO standard szintje nem lesz észrevehető hatással a vállalati teljesítményre.

A vállalatoknak olyan felügyeleti alapkonfigurációt kell létrehozniuk, amely szabványos RTO-t hoz létre a nem kritikus fontosságú számítási feladatokhoz. A vállalkozás ezt az alapkonfigurációt felhasználhatja a helyreállítási idő további befektetéseinek igazolására.

Helyreállítási pont célkitűzései (RPO)

A legtöbb felhőfelügyeleti rendszerben az adatvédelem valamilyen formája rendszeres időközönként rögzíti és tárolja az adatokat. A helyreállítási pont az adatok legutóbbi rögzítésének időpontjára hivatkozik. Ha egy rendszer meghibásodik, az csak a legutóbbi helyreállítási pontra állítható vissza.

A helyreállítási pont célkitűzését a rendszer a legutóbbi helyreállítási ponttól a kimaradásig méri. Ha az RPO-t órákban mérik, a rendszerhiba az utolsó helyreállítási pont és a kimaradás közötti órák adatainak elvesztését eredményezi. Ha az RPO-t napokban mérik, a rendszerhiba az utolsó helyreállítási pont és a kimaradás közötti napok adatainak elvesztését eredményezi. Egy egynapos RPO elméletileg a sikertelenséghez vezető nap összes tranzakciójának elvesztését eredményezné.

Kritikus fontosságú rendszerek esetén az RPO percek vagy másodpercek alatt történő mérése segíthet elkerülni a bevétel vagy a nyereség csökkenését. A rövidebb RPO azonban általában magasabb felügyeleti költségeket eredményez. A költségek minimalizálása érdekében a vállalatnak létre kell hoznia egy felügyeleti alapkonfigurációt, amely a leghosszabban elfogadható RPO-ra összpontosít. Az üzlet ezután csökkentheti az adott platformok vagy számítási feladatok RPO-ját, amelyek több befektetést igényelnek.

Számítási feladatok védelme és helyreállítása

Az informatikai környezeti támogatás számítási feladatok többsége egy adott üzleti vagy műszaki folyamathoz. Azok a rendszerek, amelyek nem gyakorolnak rendszerszintű hatást az üzleti műveletekre, általában nem indokolják a rendszerek gyors helyreállításához vagy az adatvesztés minimalizálásához szükséges megnövekedett befektetést. Az alapkonfiguráció kialakításával a vállalatok megállapíthatják, hogy milyen szintű helyreállítási támogatásra van szükségük egy olyan árszinten, amelyet következetesen kezelhetnek. Ennek megértése segít az üzleti szereplőknek felmérni a nagyobb megtérülési befektetés értékét.

A legtöbb felhőfelügyeleti csapat számára a továbbfejlesztett alapkonfiguráció, amely a különböző eszközökre vonatkozó RPO-/RTO-kötelezettségvállalásokkal rendelkezik, a legkedvezőbb utat biztosítja a kölcsönös üzleti kötelezettségvállalásokhoz. Az alábbi szakaszok néhány általános továbbfejlesztett alapkonfigurációt vázolnak fel, amelyek lehetővé teszik a vállalatok számára, hogy egy megismételhető folyamaton keresztül egyszerűen bővíthessenek védelmet és helyreállítási funkciókat.

Adatok védelme és helyreállítása

Az adatok vitathatatlanul a digitális gazdaság legértékesebb eszközei. Az éles számítási feladatokat befolyásoló adatok elvesztése bevétel vagy nyereség elvesztéséhez vezet. A leggyakoribb továbbfejlesztett alapkonfiguráció az adatok hatékony védelmének és helyreállításának képessége. Javasoljuk a felhőfelügyeleti csapatokat, hogy olyan fejlett felügyeleti alapkonfigurációt kínáljanak, amely támogatja a közös adatplatformokat.

Mielőtt a felhőfelügyeleti csapatok platformműveleteket implementálnak, gyakori, hogy támogatják a szolgáltatásként nyújtott platform (PaaS) adatplatform továbbfejlesztett műveleteit. Egy felhőfelügyeleti csapat például egyszerűen kényszerítheti a biztonsági mentés vagy a többrégiós replikáció magasabb gyakoriságát Azure SQL Database- vagy Azure Cosmos DB-megoldásokhoz. Ezzel lehetővé teszi, hogy a fejlesztői csapat az adatplatformok modernizálásával egyszerűen javítsa az RPO-t.

További információ erről a gondolati folyamatról: Platformműveletek szemlélete.

Virtuális gépek védelme és helyreállítása

A legtöbb számítási feladat némileg függ a virtuális gépektől, amelyek a megoldás különböző aspektusait üzemeltetik. A vállalatoknak gyorsan helyre kell állítaniuk néhány virtuális gépet, hogy a számítási feladat támogassa a folyamatokat egy rendszerhiba után.

Ezen virtuális gépek állásidejének minden perce bevételkiesést vagy csökkent nyereséget okozhat. Ha a virtuális gépek leállása közvetlen hatással van az üzlet pénzügyi teljesítményére, az RTO nagyon fontos. A felhőfelügyeleti csapatok gyorsan helyreállíthatják a virtuális gépeket úgy, hogy replikálják őket egy másodlagos helyre, és automatizált helyreállítást használnak, amelyet meleg meleg helyreállítási modellnek neveznek. A csapatok a virtuális gépeket egy funkcionális, másodlagos helyre is replikálhatják egy gyakori elérésű vagy magas rendelkezésre állású modellként ismert megközelítésben. A gyakori elérésű megközelítés drágább, de a legmagasabb helyreállítási állapotot kínálja.

Ezek a modellek csökkentik az RTO-t, ami segít a vállalkozásoknak az üzleti képességeik gyorsabb visszaállításában. Az egyes modellek azonban jelentősen megnövelik a felhőkezelési költségeket is.

Vegye figyelembe azt is, hogy a magas rendelkezésre állású replikáción kívül a biztonsági mentést engedélyezni kell az olyan helyzetekben, mint például:

  • véletlen törlés
  • adatsérülés
  • zsarolóprogram-támadások

Erről a gondolkodási folyamatról további információt a Számítási feladatok működési szemlélete című témakörben talál.

Következő lépések

A felügyeleti alapkonfiguráció-összetevő teljesülése után a csapat előre tekinthet, hogy elkerülje a platformműveletek és a számítási feladatok műveleteinek kimaradását.