Műveletek fejlesztése megfigyelhetőséggel

Befejeződött
Betekintést nyerhet a rendszerbe, betekintést nyerhet, és adatvezérelt döntéseket hozhat.

Olyan kultúrát építhet ki, amely folyamatosan javítja a minőséget a számítási feladatok monitorozásával és az Azure Well-Architected Framework minden pillérének figyelembevételével. A szükséges adatok, statisztikák és trendek biztosításával a csapat és az érdekelt felek rövid és hosszú távú döntéseket is hozhatnak számos területen. Tanuljon az adatokból és a meghajtók fejlesztéseiből.

A megfigyelhetőség érdekében létrehozott műveletek kulcsfontosságúak az alkalmazás proaktív karbantartásában, a minőség- és biztonságbiztosításban, a kapacitástervezésben és a termékkezelésben.

Az alkalmazásfigyelés egyik fontos eleme az állapotmodellezés használata, amely segít előrejelezni a problémákat, mielőtt incidensekká válnak, és hatással lennének az ügyfélélményre. A hatékony monitorozás csökkenti az incidenskezelésre fordított reaktív ciklusokat.

Példaforgatókönyv

A Contoso kifejlesztett egy alkalmazást a Contoso Real Estate nevű belső használatra. Ez a webalkalmazás lehetővé teszi az áttelepült új alkalmazottak vagy alkalmazottak számára, hogy rövid távú lakásokat keressenek és lefoglaljanak az áthelyezésükhöz. A Contoso HR-részlege az alkalmazást is használja az áthelyezések elősegítésére.

Az alkalmazás éles környezetben van, és teljes egészében az Azure-ban van üzembe helyezve. Az Azure Container Apps használatával mikroszolgáltatásokra épül, és az Azure Functionst, az Azure Database for PostrgreSQL-et, az Azure Blob Storage-t és az Azure Monitort is használja.

A számítási feladat megfigyelése telemetriával

Telemetriát bocsát ki az alkalmazáskódból, amely korrelálja a végrehajtási folyamat főbb pontjait, és különböző részletességi szinteken nyújt végpontok közötti nézetet.

A műveletek rangsorolása a súlyossági szint alapján, és a kontextus megértése a részletessége miatt. Ezek az információk hibaelhárítási célokból kulcsfontosságúak.

A Contoso kihívása

  • A felhasználók arról számolnak be, hogy a Contoso Ingatlanalkalmazás legutóbbi frissítése után időnként üres lap vagy általános hibaüzenet jelenik meg a webalkalmazás keresőoldalán. A hibák véletlenszerűnek tűnnek, és a keresési funkció általában akkor működik, ha a felhasználók csak frissítik az oldalt, vagy újra elbocsátják a keresést.
  • A keresési mikroszolgáltatás naplóinak áttekintésével a csapat az Azure Database for PostgreSQL-hez csatlakozó időtúllépések miatt egyre több hibát észlel, de jelenleg nem tudják megállapítani, hogy a keresési mikroszolgáltatás-naplókban megjelenő hibák megfelelnek-e a felhasználók által látott hibalapoknak.

A megközelítés és az eredmények alkalmazása

  • A fejlesztői csapat úgy döntött, hogy kibővíti a webalkalmazásból és az alapvető mikroszolgáltatásokból naplózandó információkat, hogy mélyebbre ássa a problémát. A keresési forgatókönyv esetében mindenképpen rögzítik a keresési kifejezéseket, valamint az egyéb elérhető tranzakciós attribútumokat, például az időt, az ügyfél IP-címét és a kereséshez társított felhasználónevet. A további adatoknak elegendő információt kell adniuk ahhoz, hogy korrelálni tudják a különböző szintek tranzakcióit.
  • Ez a módosítás lehetővé tette a csapat számára annak megerősítését, hogy az adatbázis-lekérdezések időtúllépései, amelyeket nem megfelelően kezeltek az alkalmazás legújabb frissítésében, a felhasználók által tapasztalt hibák kiváltó okai voltak. A kiváltó ok megkeresése után a csapat számára egyértelmű volt a javítás implementálása.
  • A csapat most egy új megközelítést tervez az OpenTelemetry használatával egy átfogóbb elosztott nyomkövetési megoldás implementálásához, amely az összes megoldásszintet lefedi.

Monitorozási adatok megjelenítése irányítópultokon

Az irányítópultok adatainak összesítése és vizualizációja a célközönség számára kiszolgált figyelési adatok megjelenítéséhez és az üzleti környezet szem előtt tartásához. A helyzetelemzési irányítópultok segítségével adatfelfedezéssel ösztönözhet tudatosságot az érdekelt felek körében. Működési irányítópultok és munkafüzetek használata részletezési képességekkel az operátori tevékenységekhez, például incidenskezeléshez. Gyakran frissítse az irányítópultokat, és adjon részletes adatokat.

Vizualizációkkal elemezheti a trendeket, nyomon követheti az üzleti célokat, és kezelheti az incidenseket.

Az ügyfél érdeklődésére szabott irányítópultok releváns értelmezést tesznek lehetővé, és felgyorsítják az észlelés és a cselekvés idejét.

A Contoso kihívása

  • A számítási feladatokkal foglalkozó csapat az összes megoldásszint telemetriai adatait egyetlen Log Analytics-munkaterületre összesíti, amelyet a műveleti és fejlesztési csapatok és a projekt többi résztvevője érhet el. Az adatokkal való interakció azonban nehéz és összetett, ami bosszantó azoknak a csapattagoknak, akiknek háttérzajt kell érzékelni a végrehajtható adatokból.

A megközelítés és az eredmények alkalmazása

  • A csapat megkezdi az adatok irányítópultokkal való összesítését és vizualizációját. Minden irányítópult egy adott célközönséghez lesz igazítva:
    • A megoldás érintettjeinek irányítópultjai üzletiesebbek lesznek, és magasabb szintű áttekintést ad a megoldás általános állapotáról, valamint olyan üzleti mutatókkal, mint a kiszolgált felhasználók száma, a keresések és a végrehajtott foglalások.
    • Az operatív irányítópultok és munkafüzetek részletesebb és részletesebb adatokkal rendelkeznek az operatív csapat számára. Ezek az irányítópultok részletezési képességekkel rendelkeznek, amelyekkel a felhasználók különböző részletességi szinteken vizsgálhatják meg az adatokat. A felhasználók ezeket az irányítópultokat és munkafüzeteket használhatják hibaelhárítási és egyéb incidenskezelési feladatok elvégzéséhez.
  • Az irányítópultok lehetővé teszik a felhasználók számára a trendek elemzését, az üzleti célok nyomon követését és az incidensek hatékonyabb kezelését. Az egyes irányítópultokon bemutatott adatok relevánsabbak lesznek a célközönség számára, és érdeklődési körük és igényeik vezérlik őket.

Robusztus riasztási stratégia tervezése

A riasztások végrehajthatóvá tétele a felelős szerepkörök szabványosított leírásokkal és súlyossági szintekkel történő értesítésével. Adja meg a különböző forrásokból csoportosított információkat, és kövesse nyomon az üzleti céloktól való eltéréseket.

Riasztásokat csak olyan incidensek esetén aktiválhat, amelyek beavatkozást igényelnek, és proaktív és elgondolkodtató riasztásokra törekszenek, amelyek a csökkentett állapotú állapot meghibásodása előtt kezdeményeznek műveleteket. A jó riasztási rendszer azonosítja a műveleteket és a súlyosságot, és elegendő adatot biztosít a világosság és a cél eléréséhez. Az operátorok késedelem nélkül megkezdhetik a szervizelést.

A Contoso kihívása

  • Az Azure Monitor riasztásokat küld az operatív csapatnak, ha valami hiba történik. A csapat azonban jelenleg túl sok, irreleváns, nem egyértelmű vagy redundáns riasztást kap. Ez a riasztások kifáradását okozza, és hatással van a csapat termelékenységére, és néhány fontos riasztást észrevétlenül okoz.
  • Voltak olyan kimaradások is, amelyek megelőzhetők vagy minimalizálhatók lettek volna, ha egy riasztást küldtek a hiba előrejelzésére. Ha a csapat jobban figyelmeztetett a leállás előtti teljesítménycsökkenésre, előfordulhat, hogy elkerülte volna ezeket a helyzeteket. Előfordultak például olyan esetek, amikor az adatbázis-lekérdezések feldolgozási idejének lelassulása kimaradásokat eredményezett. A kimaradások hibaelhárítása során a csapat megfigyeli, hogy a lekérdezésfeldolgozási teljesítmény idővel lassan csökken, és egyre rosszabb lesz, amíg az teljes kimaradáshoz nem vezet.

A megközelítés és az eredmények alkalmazása

  • A műveleti csapat kezdeményezést indít a riasztások kifáradását okozó alacsony prioritású riasztások eltávolítására. Csak a kritikus és végrehajtható riasztások maradhatnak aktívak. Emellett a csapat áttekinti (és szükség szerint javítja) azokat a riasztásokat, amelyek aktívak maradnak ahhoz, hogy elegendő környezetet tartalmazzanak ahhoz, hogy elvégezhessék a szükséges korrekciós műveletet.
  • Arra is lehetőséget kapnak, hogy új proaktív és végrehajtható riasztásokat határozzanak meg, amelyek lehetővé teszik számukra, hogy a hiba bekövetkezése előtt megtehessék a szükséges lépéseket. Például létrehoznak egy új riasztást, amely értesíti a dbA-kat, amint megjelenik az adatbázis-lekérdezések teljesítményének konzisztens lassulása.
  • Következő lépésként a csapat a gyakori riasztásokra adott válaszok automatizálását vizsgálja, például az adatbázis-lekérdezések teljesítményével kapcsolatos helyzetet.

Tesztelje tudását

1.

Hogyan tudta azonosítani a Contoso az üres oldalakkal és a felhasználók által tapasztalt általános hibákkal kapcsolatos probléma kiváltó okát?

2.

Az alábbiak közül melyik a megfelelő módszer a monitorozási irányítópultok tervezésére?

3.

Igaz vagy hamis: a riasztások többnyire tájékoztató jellegűek.