Dela via


Samla in rätt övervakningsdata

Genom att observera hälsotillståndet och tillgängligheten för din molnlösning kan du skapa en förståelse för de signaler du förväntar dig i dina system så att du kan avgöra vilka data du ska samla in.

Den här artikeln är en del av en serie i molnövervakningsguiden.

Överväganden för datainsamling

Ställ dig själv följande frågor för att fastställa kriterier för en övervakningskonfiguration:

  • Tjänstsammansättning: Vad är sammansättningen av tjänsterna? Övervakas dessa beroenden i dag? Om så är fallet, är flera verktyg inblandade, och finns det en möjlighet att konsolidera utan att införa ytterligare risk?

  • Definiera förutsägbara feltillstånd: Dessa signaler är symtomen på felet, inte orsaken. Övervakningsverktygen använder mått och loggar för avancerad diagnostik och rotorsaksanalys.

  • Service serviceavtal: Vad är serviceavtal (SLA) för tjänsten och hur mäter och rapporterar du det?

  • Design av tjänstinstrumentpanel: Hur bör tjänstinstrumentpanelen se ut när du granskar incidenter? Hur bör instrumentpanelen se ut för tjänstägaren och teamet som stöder tjänsten?

  • Resursmått: Vilka resursmått skapas av den lösning som du behöver övervaka?

  • Loggsökning: Hur söker tjänstens ägare, supportteam och annan personal i loggarna?

  • Intressenternas engagemang: Inkludera övervakningstjänstens ägare, chef för IT-åtgärder och andra intressenter under planeringsfasen. Fortsätt att engagera dem under dina övervakningslösningars utvecklings- och lanseringscykler.

  • Känsliga data: Vilka känsliga data bör jag undvika att samla in för program som jag inte vill exponera för mina operatörer?

Hur du besvarar dessa frågor och kriterierna för aviseringar avgör hur du ska använda övervakningsplattformen.

Utvärdera nödvändiga övervakningssignaler

Oavsett om du distribuerar nya arbetsbelastningar med en ny övervakningslösning eller migrerar från en befintlig övervakningsplattform eller en uppsättning övervakningsverktyg är det viktigt att utvärdera de övervakningssignaler som krävs. Att noggrant utforma de nödvändiga signalerna hjälper till att driva de förväntade resultaten och minskar bruset.

Tänk på följande:

  • Åtgärdsbar: Kom ihåg att övervakningsdata måste vara användbara för att minska brus och falska positiva identifieringar.
  • Optimerad: Optimera de data som samlas in för att ge dig en helhetsbild av tjänstens övergripande hälsa.
  • Incidentinstrumentation: Instrumentationen som definieras för att identifiera faktiska incidenter ska vara så enkel, förutsägbar och tillförlitlig som möjligt.

Utveckla en övervakningskonfiguration

Vanligtvis följer ägaren till en övervakningstjänst och deras team en standarduppsättning med aktiviteter för att skapa en övervakningskonfiguration. Dessa aktiviteter omfattar planeringssteg, testning och validering i en icke-produktionsmiljö och distribution till produktion.

För att utveckla övervakningskonfigurationer använder teamet kända fellägen, testresultat från simulerade fel och erfarenheter från olika personer i organisationen, till exempel servicedesk, driftpersonal, tekniker och utvecklare.

Dessa konfigurationer är utformade under antagandet att tjänsten redan finns, genomgår migrering till molnet och inte har omstrukturerats. För att säkerställa att kvalitetsresultat på servicenivå uppnås är det viktigt att övervaka tjänsternas hälsa och tillgänglighet tidigt i utvecklingsprocessen. Om övervakning av tjänstens eller programmets design endast betraktas som en eftertanke, kommer resultatet sannolikt att bli mindre lyckat.

Tänk på följande rekommendationer för att få snabbare lösning på incidenten:

  • Instrumentpaneler för enskilda komponenter: Definiera en instrumentpanel för varje tjänstkomponent för att snabbt identifiera kända problem i ett visst område i dina program och infrastruktur.

  • Använd mått: Använd de måttsignaler som är inbyggda i de olika komponenterna för att diagnostisera och identifiera lösningar eller lösningar om du inte kan identifiera en rotorsak.

  • Aktivera instrumentpanelsanpassningar: Utforma dina instrumentpaneler så att du enkelt kan öka detaljnivån i data från instrumentpanelerna för övervakning. Se till att du har stöd för att anpassa vyerna dynamiskt, vilket möjliggör enkel filtrering och felsökning.

Om du använder den här vägledande uppsättningen principer kan du få insikter i nästan realtid och bättre hantering av din tjänst.

Nästa steg