Megosztás a következőn keresztül:


Ajánlások vészhelyzeti válasz stratégia kidolgozásához

Erre a jól felépített működési kiválósági ellenőrzőlistára vonatkozó javaslatra Power Platform vonatkozik:

OE:07 Hatékony vészhelyzeti műveleti gyakorlat kidolgozása. Győződjön meg arról, hogy a számítási feladat értelmes állapotjeleket bocsát ki. Gyűjtse össze az eredményül kapott adatokat, és használja fel őket olyan végrehajtható riasztások létrehozásához, amelyek irányítópultokon és lekérdezéseken keresztül vészhelyzeti válaszokat léptetnek életbe. Egyértelműen határozza meg az emberi felelősségeket, például az ügyeleti rotációkat, az incidenskezelést, a vészhelyzeti erőforrásokhoz való hozzáférést és a halál utáni műveleteket.

Ez az útmutató a vészhelyzeti válasz stratégia kidolgozására vonatkozó ajánlásokat ismerteti. Előfordulhat, hogy egyes számítási feladatok kritikus fontosságúak, és a számítási feladatok életciklusa során felmerülő problémák elég súlyosak lehetnek ahhoz, hogy vészhelyzetnek nyilvánítsák őket. Szigorúan ellenőrzött és koncentrált folyamatokat és eljárásokat vezethet be, amelyeket csapata követhet annak biztosítása érdekében, hogy a problémákat nyugodt, rendezett módon kezeljék. A vészhelyzetek természetesen növelik mindenki stressz-szintjét, és kaotikus környezethez vezethetnek, ha a csapat nincs megfelelően felkészülve. A stressz és a zavartság minimalizálása érdekében tervezzen válasz stratégiát, ossza meg a válasz stratégiát a szervezettel, és végezzen rendszeres vészhelyzeti válasz képzést.

Fő tervezési stratégiák

A vészhelyzeti válasz stratégiának jól meghatározott folyamatok és eljárások készletének kell lennie. Minden folyamatnak és eljárásnak rendelkeznie kell szkriptekkel, amelyek biztosítják, hogy minden lépés a csapat gyors és biztonságos megoldása felé haladjon. A vészhelyzeti válasz stratégia kidolgozásához vegye figyelembe a következő áttekintést:

  • Előfeltételek
    • Monitoring rendszer kialakítása
    • Incidensterv létrehozása válasz
  • Incidens fázisok
    • Észlelés és elszigetelés
    • Osztályozás
  • Incidens utáni fázisok
    • A kiváltó ok elemzése (RCA)
    • Halál utáni állapot
  • Folyamatban lévő tevékenység
    • Vészhelyzeti válasz gyakorlatok

A következő szakaszok javaslatokat tartalmaznak az egyes fázisokhoz.

Felügyeleti rendszer

Ahhoz, hogy robusztus vészhelyzeti válasz stratégiával rendelkezzen, robusztus felügyeleti rendszerrel vagy megfigyelhetőségi platformmal kell rendelkeznie. A megfigyelhetőségi platformnak a következő jellemzőkkel kell rendelkeznie:

  • Holisztikus monitorozás: Győződjön meg arról, hogy alaposan figyeli a számítási feladatokat konfigurációs és alkalmazásszempontból, és infrastruktúra-figyelést is magában foglal, ha a számítási feladat összetevői a felhőben vagy helyszíni üzemelnek. Győződjön meg arról, hogy a számítási feladat minden összetevőjét lefedi a monitorozási stratégia. Ha például a számítási feladat Azure-erőforrásokkal vagy helyszíni rendszerrel kommunikál, foglalja bele ezeket az összetevőket a monitorozásba.

  • Részletes naplózás: Részletes naplózás engedélyezése az összetevőkhöz, hogy segítse a vizsgálatokat a problémák osztályozásakor. Strukturálja a naplókat, hogy könnyen kezelhetők legyenek. Naplók automatikus küldése az adatfogadóknak az elemzésre való felkészüléshez.

  • Hasznos irányítópultok: Az egészségügyi modellen alapuló irányítópultokat hozhat létre, amelyek a szervezet minden csapatára vannak szabva. A különböző csapatok felelősek a számítási feladatok állapotának különböző aspektusaiért.

  • Végrehajtható riasztások: Olyan riasztásokat hozhat létre, amelyek hasznosak a számítási feladatok csapatai számára. Kerülje az olyan riasztásokat, amelyek nem igényelnek beavatkozást a csapatoktól. A túl sok ilyen riasztás ahhoz vezethet, hogy az emberek figyelmen kívül hagyják vagy blokkolják a riasztási értesítéseket.

  • Automatikus értesítések: Győződjön meg arról, hogy a megfelelő csapatok automatikusan megkapják a tőlük beavatkozást igénylő riasztásokat. Például az 1. rétegbeli támogatási csapatnak értesítéseket kell kapnia az összes riasztásról, míg a biztonsági mérnököknek csak biztonsági eseményekről kell riasztásokat kapniuk.

További információ: Javaslatok figyelési keretrendszer tervezéséhez és létrehozásához.

Incidens válasz terv

A vészhelyzeti válasz stratégia alapja egy incidens válasz terv. A katasztrófa utáni helyreállítási tervhez hasonlóan egyértelműen és alaposan határozza meg az incidensekre való reagálás szerepét, felelősségét és eljárásait. A tervnek verzióvezérelt dokumentumnak kell lennie, amelyet rendszeresen felülvizsgálunk, hogy naprakész legyen.

Egyértelműen határozza meg a következő összetevőket a tervben.

Szerepkörök

Incidens azonosítása válasz felettese. Ez a személy az incidens tulajdonosa a kezdeményezéstől a szervizelésen át a kiváltó ok elemzéséig. Az incidenskezelő válasz biztosítja a folyamatok követését és a megfelelő felek tájékoztatását, miközben a válasz csapat elvégzi munkáját.

Azonosítson egy halál utáni vezetőt. Ez az egyén biztosítja, hogy a postmortemeket hamarosan az esemény megoldása után végezzék el. Jelentést készítenek, amely segít alkalmazni az incidensből származó megállapításokat.

Folyamatok és eljárások

A számítási feladatok csapatának meg kell határoznia és meg kell értenie a vészhelyzeti feltételeket. Ha a csapat megállapítja, hogy egy eset súlyos, bejelentheti a katasztrófát, és kezdeményezheti a vészhelyreállítási tervet. Kevésbé súlyos esetekben előfordulhat, hogy a probléma nem felel meg a katasztrófa kritériumainak, de továbbra is vészhelyzetnek kell tekintenie a problémát, amelyhez szükség van a vészhelyzeti válasz terv kezdeményezésére. A vészhelyzetek lehetnek a számítási feladatok belső részei, például az alkalmazás kódjában lévő hibák, vagy a számítási feladat függőségével kapcsolatos probléma, például egy API vagy egy adatbázis elérhetetlensége. Vészhelyzetet okozhat a szolgáltató kimaradása is (például az azonosítóval vagy Microsoft Entra az azonosítóval kapcsolatos Power Platformprobléma). A támogatási csapatnak képesnek kell lennie annak megállapítására, hogy egy probléma megfelel-e a vészhelyzeti feltételeknek, még akkor is, ha a csapatnak nincs rálátása a mögöttes problémára.

Pontosan határozza meg a kommunikációs és eszkalációs terveket. A kapott riasztási értesítés típusától függően győződjön meg arról, hogy az 1. rétegbeli támogatási csapat tagjai könnyen kapcsolatba léphetnek a megfelelő csapatokkal a problémák eszkalálása esetén.

Egyéb felveendő elemek

Dokumentálja az incidensek során a belső kommunikációhoz használt összes szabványos eszközt, például Microsoft Teams az incidens során végzett tevékenységek nyomon követését, például a jegykezelő eszközöket vagy a hátraléktervezési eszközöket.

Dokumentálja a vészhelyzeti hitelesítő adatokat, más néven vészhelyzeti fiókokat. Mellékeljen egy részletes útmutatót, amely leírja, hogyan kell használni őket.

Hozzon létre vészhelyzeti válasz fúrási utasításokat, és jegyezze fel, hogy mikor történik a fúrás.

Dokumentálja a szükséges jogi vagy szabályozási intézkedéseket, például az adatvédelmi incidensek közlését.

Incidensek észlelése és elszigetelése

Ha van egy jól megtervezett figyelési rendszere, amely figyeli az anomáliákat, és automatikusan riasztást küld rájuk, gyorsan észlelheti a problémákat, és meghatározhatja azok súlyosságát. Ha a probléma vészhelyzetnek minősül, a terv kezdeményezhető. Bizonyos esetekben a támogatási csapat nem kap értesítést a figyelési rendszeren keresztül. A felhasználók jelenthetik a problémákat a támogatási csapat kommunikációs csatornáinak használatával. Vagy kapcsolatba léphetnek olyan személyekkel, akikkel rendszeresen együtt dolgoznak, vagy akikről tudják, hogy együtt Power Platform dolgoznak, például a Power Platform szolgáltatás-rendszergazdákkal vagy a Kiválósági központ csapatával. Nem számít, hogyan értesítik a támogatási csapatot, mindig ugyanazokat a lépéseket kell követniük a probléma ellenőrzéséhez és súlyosságának meghatározásához. A válasz tervtől való eltérés stresszt és zavart okozhat.

Osztályozás

A probléma megoldásának első lépés a problémát okozó számítási feladat összetevőjének azonosítása. Az osztályozás során követendő lépések a probléma típusától függenek. A számítási feladatok támogatásának egy bizonyos területéhez tartozó csapatnak eljárásokat kell létrehoznia a munkájához kapcsolódó incidensekhez. A biztonsági csapatoknak például osztályozniuk kell a biztonsági problémákat, és követniük kell az általuk fejlesztett szkripteket. Fontos, hogy a csapatok jól meghatározott szkripteket kövessenek a triázs erőfeszítéseik során. Ezeknek a parancsfájloknak lépésenkénti utasításoknak kell lenniük, amelyek visszaállítási folyamatokat tartalmaznak a nem hatékony vagy más problémákat okozó módosítások visszavonásához. A probléma megoldása után kövesse a jól definiált folyamatokat, hogy az érintett összetevő biztonságosan visszakerüljön a számítási feladatok folyamatának útvonalaira.

A kiváltó ok elemzésének jelentése

Az incidens tulajdonosának vagy valakinek, aki szorosan együttműködött vele, létre kell hoznia a kiváltó okok elemzésére (RCA) vonatkozó jelentéseket. Ez a stratégia biztosítja az incidens pontos elszámolását. A szervezetek általában rendelkeznek egy meghatározott RCA-sablonnal, amely irányelveket tartalmaz az információk megjelenítésére és arra vonatkozóan, hogy milyen típusú információkat lehet vagy nem lehet megosztani. Ha saját sablont és irányelveket kell létrehoznia, győződjön meg arról, hogy az érdekelt felek áttekintik és jóváhagyják őket.

Incidens utáni halálesetek

A pártatlan egyénnek hibátlan halált kell vezetnie. A kórbonctani üléseken mindenki megosztja az incidens eredményeit. Minden csapatot, amely részt vett az incidensben válasz olyan személyeknek kell képviselniük, akik az eseményen dolgoztak. Ezeknek az egyéneknek felkészülten kell érkezniük az ülésre a sikeres cselekvések és a javítható területek példáival. A munkamenet nem fórum az incidens vagy a válasz során esetlegesen felmerülő problémák hibáztatására. A halál utáni vezetőnek el kell hagynia az ülést a fejlesztésre összpontosító cselekvési pontok egyértelmű listájával, például:

  • A válasz terv fejlesztései. Előfordulhat, hogy a folyamatokat vagy eljárásokat újra kell értékelni és újra kell írni a megfelelő műveletek jobb rögzítése érdekében.
  • A felügyeleti rendszer fejlesztése. Előfordulhat, hogy a küszöbértékeket újra kell értékelni az adott típusú incidens korábbi elkapásához, vagy új monitorozást kell megvalósítani a nem figyelembe vett viselkedés elkapásához.
  • A számítási feladat fejlesztései. Az incidens biztonsági rést okozhat a számítási feladatban, amelyet állandó szervizelésként kell kezelni.

Szempontok

A vészhelyzeti válasz stratégiáját szorosan össze kell hangolni az általános Power Platform támogatási stratégiával. A rendszergazdákkal és a Kiválósági központ csapatával együttműködve Power Platform beszéljük meg a támogatási és vészhelyzeti válasz lehetőségeket és folyamatokat, amelyek esetleg már definiálva vannak.

A támogatási folyamat és az eszkalációs útvonal meghatározásakor fontos kategorizálni a kritikusság alapján épülő megoldásokat . Ez a gyakorlat lehetővé teszi olyan folyamatok létrehozását, amelyek biztosítják, hogy a kritikus alkalmazások rendelkezzenek a támogatásukhoz szükséges védőkorlátokkal, miközben nem fojtják el a termelékenységi forgatókönyvek innovációját, és nem terhelik túl az incidensek válasz a csapatokat. A támogatási modellek meghatározásakor gondoljon egy érettségi útvonalra is. Előfordulhat, hogy egy megoldás kezdetben csak termelékenységi szintű támogatást igényel, de a funkcionalitás vagy a felhasználói bázis növekszik, hogy magasabb szintű támogatást igényeljen. Definiálja, hogyan kérhetnek formális támogatást a készítók, és hogyan tudják átvinni a megoldást a támogatott környezetekbe.

Power Platform Megkönnyítése

Power Platform integrálható a Application InsightsAzure Monitor ökoszisztéma részeként. Ezzel az integrációval a következőre használható:

  • Telemetriai adatokat kaphat a Dataverse platform által rögzített diagnosztikáról és teljesítményről Application Insights. Előfizethet telemetria fogadására azokról a műveletekről, amelyeket az alkalmazások a Dataverse adatbázisában és a modellvezérelt alkalmazásokban végeznek. Ez a telemetria olyan információkat szolgáltat, amelyek segítségével diagnosztizálhatja és elháríthatja a hibákkal és a teljesítménnyel kapcsolatos problémákat.

  • Csatlakoztassa vászonalapú alkalmazásait Application Insights. Ezekkel az elemzésekkel diagnosztizálhatja a problémákat, és megértheti, hogy a felhasználók mit csinálnak az alkalmazásokkal. Információkat gyűjthet a jobb üzleti döntések meghozatalához és az alkalmazások minőségének javításához.

  • Konfigurálja Power Automate a telemetriát a beáramláshoz Application Insights; például a felhőfolyamat végrehajtások figyeléséhez és riasztások létrehozásához felhőfolyamat futtatási hibákhoz.

  • Telemetriai adatok rögzítése a másodpilótától Microsoft Copilot Studio az Azure-ban Application Insights való használatra. Ezzel a telemetriával figyelheti a másodpilótának küldött naplózott üzeneteket és eseményeket, a felhasználói beszélgetések során aktiválandó témaköröket, valamint a témakörökből küldhető egyéni telemetriai eseményeket.

Application Insights átfogó megoldás a felhőbeli és helyszíni környezetekből származó monitorozási adatok gyűjtésére, elemzésére és megválaszolására. Tartalmaz egy robusztus riasztási platformot, amely konfigurálható az automatikus értesítésekhez és egyéb műveletekhez.

Az Power Platform Automation Kit olyan eszközkészlet, amely felgyorsítja az asztali számítógépek használatát és támogatását Power Automate automatizálási projektekhez. A csomag olyan eszközöket tartalmaz, amelyek segítségével kezelheti az automatizálási projekteket, és figyelheti őket a mentett és megtérülési arányú pénzek becsléséhez. Az Automation Kit része a vezérlőközpont, amely kiegészíti a meglévő Monitor asztali folyamat futtatás funkciót. A vezérlőközpont fő hangsúlya egy vezénylési nézet, amely lehetővé teszi a támogatási elemzők és szervezetek számára, hogy figyeljék, műveleteket hajtsanak végre és riasztást küldjenek, ha szükséges.

További lépések