Utforska observerbarhet genom prestandaövervakning

Slutförd

Som vi nämnde tidigare i den här modulen är observerbarhet en av de grundläggande aspekterna av driftskvalitet. Syftet är att ge insikter om driftstatusen för system och program. Det omfattar kontinuerlig övervakning och utvärdering av den driftstatusen. Ett av de främsta målen för observerbarhet är prestanda. Prestandaövervakningsbaserad observerbarhet kan ge betydande fördelar för alla organisationer som är beroende av teknik för sina intäkter, inklusive den som beskrivs i exempelscenariot. I den här lektionen får du lära dig mer om hur dessa fördelar kan realiseras.

Vilken roll har prestandaövervakning i observerbarheten?

När det gäller observerbarhet är prestandaövervakning beroende av insamling av telemetri i realtid, till exempel mått, loggar och spårningar för att utvärdera arbetsbelastningarnas övergripande hälsa. Mått innehåller kvantitativa data, loggar ger detaljerad information om händelser och spårningar möjliggör datakorrelation mellan distribuerade system. För att utföra utvärderingen måste du också utveckla en hälsomodell som representerar driftstatusen för arbetsbelastningarna under normala arbetsförhållanden. Prestandaövervakning använder hälsomodellen för att identifiera avvikelser, flaskhalsar i prestanda och prestandarelaterade problem så snart de inträffar.

Data som samlas in via prestandaövervakning är också viktiga för incidenthantering. Den ger en detaljerad status för de berörda arbetsbelastningarna före, under och efter incidenten, vilket förenklar felsökningen och hjälper till att minimera tid till lösning (MTTR). Andra mått som hjälper dig att utvärdera effektiviteten i prestandaövervakningen är:

  • Time to detect (TTD): mäter den tid det tar för diagnostikdata om en incident att nå utvecklings- och driftteam.
  • Time to mitigate (TTM): mäter den tid det tar för utvecklings- och driftteam att agera på övervakningsinformationen och minimera effekten av incidenten.
  • Time to remediate (TTR): mäter den tid det tar för utvecklings- och driftteamet att lösa rotorsaken till incidenten.

Dessutom driver kontinuerlig övervakning fortlöpande förbättring genom att tillhandahålla data för granskningar efter incidenter och rotorsaksanalys. Det hjälper också till att övergå från den reaktiva till proaktiva reparationsmetoden.

Slutligen används övervakning ofta för skift-höger-testning. Genom att kombinera det med ett arbetsflöde för kontinuerlig leverans kan du identifiera eventuella avvikelser som introduceras av nya programvaruversioner och underlätta deras snabba åtgärder. Detta inkluderar möjligheten att identifiera problem som förbises i förproduktionsmiljöer.