Megbízhatóság

Befejeződött

Tegyük fel, hogy egy egészségügyi szervezet klinikai rendszerét futtatja. A klinikusok és az ápolók nem igazán tolerálják a leállásokat. Éjjel-nappal hozzá kell férniük a klinikai informatikai rendszerekhez, hogy mindig a legmagasabb színvonalú ellátást nyújthassák.

A klinikusok folyamatos hozzáférési igénye miatt az alkalmazásoknak úgy kell kezelniük a meghibásodásokat, hogy az a lehető legkisebb mértékben érintse a felhasználókat. Hogyan tartható fenn az alkalmazások működőképessége helyi incidensek és nagy léptékű összeomlások esetén is?

Ebben a leckében megtanulhatja, hogyan építhet be elemeket a megbízhatósági pillérből az architektúra kialakításába.

Mi az a megbízhatóság?

Egy összetett alkalmazásban számos dolog elromolhat, bármilyen léptékben. Meghibásodhatnak az egyes kiszolgálók és a merevlemezek. Egy üzembehelyezési probléma véletlenül törölheti egy adatbázis összes tábláját. Akár teljes adatközpontok elérhetetlenné válhatnak. Egy zsarolóprogram ártó szándékkal titkosíthatja minden adatunkat. Rendkívül fontos, hogy az alkalmazás megbízható maradjon, és helyi és szélesebb körű incidenseket is kezelni tudjon.

A megbízhatóságra tervezés célja, hogy a rendszerünk üzemképes maradjon kis léptékű incidensek és átmeneti körülmények, például részleges hálózati kimaradások esetén. Az egyes összetevők magas rendelkezésre állásának integrálásával gondoskodhat arról, hogy az alkalmazás kezelje a honosított hibákat. Ez az alkalmazásterv egyetlen meghibásodási pontot szüntet meg. Ez a fajta kialakítás minimalizálja az infrastruktúra-karbantartás hatásait is. A magas rendelkezésre állású kialakítások általában arra irányulnak, hogy gyorsan és automatikusan kiküszöböljék az incidensek hatását, és biztosítsák, hogy a rendszer továbbra is alig vagy egyáltalán nem tudja feldolgozni a kéréseket.

A megbízhatóságra tervezés célja, hogy az adatok helyreállíthatók legyenek adatvesztés vagy nagy léptékű katasztrófák esetén. Az ilyen típusú incidensek utáni helyreállítás általában aktív közbelépést igényel, de az automatizált helyreállítási lépések lerövidíthetik a folyamatot. Az ilyen típusú incidensek némi leállással vagy bizonyos adatok végleges elvesztésével járhatnak. A vészhelyreállítás szempontjából legalább olyan fontos a gondos tervezés, mint a végrehajtás.

A magas rendelkezésre állás és a helyreállíthatóság az architektúra kialakításában megvédheti vállalkozását az állásidőből és az adatvesztésből eredő pénzügyi veszteségektől. Emellett megvédik vállalkozását az ügyfelek bizalmának elvesztéséből eredő hírnévvesztéstől.

A megbízhatóságra tervezéssel biztosítja, hogy az alkalmazás megfeleljen az ügyfelek felé vállalt kötelezettségeknek. Biztosítani szeretné, hogy a rendszerek elérhetők legyenek a végfelhasználók számára, és helyreállíthatók legyenek a hibákból.

Magas rendelkezésre állású architektúra létrehozása

A rendelkezésre állás érdekében azonosítsa azt a szolgáltatásiszint-szerződést (SLA), amelyhez véglegesíteni kívánja. Vizsgálja meg az alkalmazás lehetséges magas rendelkezésre állási képességeit az SLA-hoz képest, és azonosítsa, hol rendelkezik a megfelelő lefedettséggel, és hol kell fejlesztéseket végeznie. A cél az architektúra összetevőinek redundánssá tétele, hogy kisebb legyen a leállások esélye.

Az összetevők magas rendelkezésre állásra való kialakítása történhet például fürtözéssel vagy terheléselosztással.

  • A fürtözés egy adott virtuális gépet több összehangolt virtuális géppel helyettesít. Ha egy virtuális gép meghibásodik vagy elérhetetlenné válik, a feladatait átveszi egy másik, amely ki tudja kiszolgálni a beérkező kéréseket.

  • A terheléselosztás elosztja a kéréseket egy szolgáltatás több példánya között, észleli a hibás példányokat, és megakadályozza, hogy azokhoz kérések érkezzenek.

Helyreállítható architektúra tervezése

A helyreállíthatóság érdekben végezzen el egy elemzést, amely az adatvesztéssel vagy jelentős állásidővel járó forgatókönyveket vizsgálja. Az elemzésnek tartalmaznia kell a helyreállítási stratégiák áttekintését, valamint az egyes stratégiák költségének és előnyeinek mérlegelését. Ez a gyakorlat fontos betekintést nyújt a szervezet prioritásaiba, és segít tisztázni az alkalmazás szerepét. Az elemzés eredményeinek tartalmazniuk kell az alkalmazás időtartamértékeit:

  • Helyreállítási pont célkitűzése (RPO): Az elfogadható adatvesztés maximális időtartama. Az RPO időegységekben, nem pedig mennyiség alapján van mérve. Például „30 percnyi adat”, „négy órányi adat” stb. Az RPO az adatvesztés, és nem az adatlopás korlátozására és helyreállítására vonatkozik.

  • Helyreállítási idő célkitűzése (RTO):Az elfogadható állásidő maximális időtartama, ahol a specifikáció az "állásidőt" határozza meg. Ha például az elfogadható állásidő nyolc óra, ha katasztrófa történik, akkor az RTO nyolc óra.

Az RPO és az RTO meghatározása után olyan biztonsági mentési, visszaállítási, replikációs és helyreállítási lehetőségeket építhet be az architektúrába, amelyek segítik e célok elérését.

Minden felhőszolgáltató kínál olyan szolgáltatásokat és funkciókat, amelyekkel javítható az alkalmazások rendelkezésre állása és helyreállíthatósága. Amikor lehetséges, használja a meglévő szolgáltatásokat és az ajánlott eljárásokat ahelyett, hogy sajátokat hozna létre.

A merevlemezek meghibásodhatnak, az adatközpontok elérhetetlenné válhatnak, és hackertámadások is előfordulhatnak. Fontos, hogy fenntartsa a jó megítélését az ügyfelek körében. A rendelkezésre állás és a helyreállíthatóság ebben segít. A rendelkezésre állás lényege az üzemképesség biztosítása például hálózati kimaradások esetén, a helyreállíthatóság pedig az adatok visszaállítását szolgálja egy vészhelyzetet követően.

Tesztelje tudását

1.

Tegyük fel, hogy javítani szeretné rendszere rendelkezésre állását, hogy jobb szolgáltatásiszint-szerződést (SLA-t) kínálhasson ügyfeleinek. Melyik alábbi irányelvet hasznosíthatja?

2.

Az alábbiak közül melyiket érinti a meghatározott helyreállítási pont célkitűzése (RPO)?