Share via


Observerbarhet i molnövervakning

Den här artikeln är en del av en serie i molnövervakningsguiden.

Avsnitten nedan syftar till att öka driftens mognad genom att vara observant och ständigt itererande för att förbättra hur du övervakar dina tjänster. Lär dig hur organisationer implementerar en konsekvent övervakningsstrategi snabbare genom att etablera observerbarhet för varje övervakningslösning.

Definiera observerbarhet

Även om observerbarhet och övervakning kompletterar varandra finns det en anmärkningsvärd skillnad:

  • Övervakning: Samlar in information och informerar dig om att det har identifierat ett problem baserat på att du konfigurerar den för att övervaka för dessa villkor. Du övervakar kända eller förutsägbara fel.
  • Observerbarhet: Möjligheten att förstå vad som händer i ett system genom att titta på utdata. En observerbarhetslösning hjälper dig att analysera dessa data för att utvärdera systemets hälsa och hitta sätt att åtgärda problem i DIN IT-infrastruktur.

Observerbarheten driver först övervakningskonsumenten att förstå vad som anses vara en tjänsts normala drift. Med andra ord söker du total synlighet så snart som möjligt.

När du har påbörjat observerbarheten bygger du vidare på den inledande synlighetsnivån för att utveckla användbara aviseringar, skapa användbara instrumentpaneler och utvärdera AIOps-lösningar. Med de här insikterna kan du bekanta dig med det underliggande måttet och loggövervakningsdata.

Kommentar

Det här är motsatsen till den metod som användes tidigare när teamen arbetade med att definiera alla övervakningskrav först på papper innan de byggde, testade och distribuerade.

Oavsett om din övervakningsplan riktar sig mot ett program, molninfrastrukturen eller Azure-plattformen är det första steget att upprätta observerbarhet.

Den här metoden förenklar även dina planer. I samtliga fall innebär total synlighet att uppnå och upprätthålla tillräcklig synlighet över tre dimensioner eller aspekter:

  1. Övervaka på djupet: Samla in meningsfulla och relevanta signaler.
  2. Övervaka från slutpunkt till slutpunkt eller bredd: Från det lägsta lagret i stacken upp till programmet.
  3. Övervaka i hela hälsomodellen: Fokusera på hälsoaspekter, till exempel tillgänglighet, prestanda, säkerhet och kontinuitet.

Three-sided cube example

Observerbarhet är mer än bara ett fokus för dina IT-team. Ett viktigt mål är att se till att slutanvändarna kan använda systemen och att dina servicenivåmål uppfylls.

Övervakningslösningar och observerbarhet

Infrastruktur- och programövervakning kan vara komplicerat. Affärsomvandling tillämpar teknik för att uppnå och hjälpa till att forma dess strategier. Molnet har ytterligare påverkat övervakningens komplicerade karaktär.

Detta visas på följande sätt:

  • Digital omvandlingsförskjutning: Företagens arbete med digital omvandling övergår till hyperexploatering av molnteknik.
  • Inbyggd övervakning: Övervakningen bäddas in i Azure-resurser och resursgrupper jämfört med separata verktyg som du hanterar lokalt.
  • Omfattande övervakning Av molnbaserade arkitekturer som Azure Monitor liknar siem-verktyg (security incident and event management). Azure Monitor är expansivt, loggdrivet och storleksordningar mer flexibla än traditionella lokala verktyg.

Arkitekter måste, till exempel operatorer, förstå vilken diagnostikinformation en infrastrukturkomponent eller ett program genererar.

Att kombinera multivariat-, dynamisk-, tidsserie-, händelserika, tillståndskänsliga och telemetriska loggströmmar till värdefull intelligens beror på följande:

  • Teamkunskap: Kunskapen och erfarenheten hos den utvecklare eller systemtekniker som förstår övervakningsmålet på djupet.
  • Felsökningsupplevelse: Support och felsökning av användning av data för att hitta eller hitta orsakerna till problem.
  • Inlärning från historik: Granska tidigare incidenter för att hitta icke-tekniska orsaker som kan åtgärdas automatiskt senare.
  • Dokumentation: Vägledning i dokumentation, programvara, utbildning eller konsultation från programvaru- eller maskinvaruleverantören.

Microsoft och dess partner tillhandahåller hanteringspaket för System Center Operations Manager. Hanteringspaket är teknikspecifika. Om du till exempel importerar ett SQL-hanteringspaket identifierar och riktar Operations Manager automatiskt in sig på servrar som är värdar för SQL Server och börjar övervaka dem. Här är observerbarheten mer eller mindre fördefinierad. Operations Manager är främst utformat för lokal infrastruktur, som tenderar att vara fast i komponenter och arkitekturdesignmönster i förhållande till molntjänster.

I molnet har du enorm flexibilitet i vilka typer av tjänster du kan välja mellan. Övervakning omfattar hur tjänster ändras över tid och kan vara dynamiska, globala och motståndskraftiga. Med Azure Monitor kan du dra nytta av befintliga arbetsböcker som ingår i Azure Monitor Insights och tillhandahålla funktioner som liknar ett hanteringspaket i Operations Manager.

Konsten att vara observant

Observerbarhet är beroende av vad och hur något övervakas.

I Azure finns det flera övervakningsdatakällor som var och en ger ett annat perspektiv på hur något beter sig. Azure innehåller flera verktyg som hjälper dig att analysera de olika aspekterna av dessa data.

Observera plattformen

I Azure tillhandahåller Microsoft tjänstleverantörens perspektiv via olika plattformsloggar.

Tjänster i Azure kan ändras på olika, oförutsägbara sätt över tid. Vi kallar det här beteendet dynamiskt. Chefer för molntjänster som observerar tjänsten över tid måste också ta hänsyn till följande:

  • Resursflytt: Resurser kan migrera eller flytta mellan platser eller geografiska områden.
  • Resursändringar: Resurser läggs till, tas bort eller ändras.
  • Förbrukning: Förbrukningen varierar för olika tjänster och implementeringar. Tänk på att övervaka kostnaden, förbrukningen och de beräknade utgifterna.

Här är några exempel på verktyg som möjliggör plattformsobservabilitet:

Loggkälla beskrivning
Tjänststatus Tjänstincidenter och planerat underhåll som rapporterats av Microsoft.
Azure Resource Health Rapporter om dina resursers aktuella och tidigare hälsotillstånd.
Azure Monitor-aktivitetslogg Rapporterar händelser på prenumerationsnivå för alla resurser som distribueras i prenumerationen.
Ändringsanalys för Azure Monitor Rapporterar om ändringar i dina Azure-program och minskar tiden för reparation (MTTR).
Azure-resursloggar Tidigare kallades diagnostikloggar, resursloggar rapporterar om åtgärder som utförs i en Azure-resurs, på dataplanet.
Loggar för Microsoft Entra-rapporter (AzureAD) Rapporter om inloggningsaktivitetens historik och spårningsloggen för ändringar i Microsoft Entra-ID för en viss klientorganisation.
Azure Advisor Använd Azure Advisor för att ta emot rekommenderade lösningar baserat på metodtips för att optimera dina Azure-distributioner.
Transparensloggar för Microsoft Cloud for Sovereignty Rapporter om när resurser används och vilken Microsoft-tekniker som kommer åt resursen. Transparensloggar ger information om åtkomst till kundresurser. Loggarna meddelar dig också när det inte har funnits någon åtkomst, vilket är vanligt.

Observerbarheten utvecklas gradvis, till att börja med en minimalt livskraftig övervakningsplan, och arbetet med att integrera verktyg och processer pågår. När du känner dig bekväm med data (mått, loggar och transaktioner) kan du förstå beteendet och tecknen på symtom eller problem från dessa resurser eller program. Genom att bekanta dig med data skapar du förtroende för att arbeta med Azure Monitor och data.

Få förtroende från observerbarhet

Med rätt observerbarhet får du förtroende, och du kan inse orsaken och hitta svar som kan hjälpa. Ju mer du lär dig om dina data, desto mer utvecklade blir dina processer och dina team får insikter.

För att ställa in scenen, här är några sätt att få förtroende från observerbarhet:

  • Öka förutsägbarheten: Förbättrad övervakning av resurser och tjänster hjälper till att identifiera problem proaktivt, vilket gör dem förutsägbara och hanterbara i framtiden.

  • Tidig identifiering av avvikelser: Observerbarhet möjliggör snabb identifiering av avvikelser eller avvikelser från förväntat beteende, vilket minskar effekten av potentiella problem.

  • Rotorsaksidentifiering: Detaljerade observerbarhetsdata hjälper till att identifiera de bakomliggande orsakerna till problem, vilket möjliggör snabbare lösning och förhindrar upprepning.

  • Förbättra felsökningseffektiviteten: Med observerbarhet kan team snabbt diagnostisera och felsöka komplexa problem genom att analysera relevanta data och korrelera händelser.

  • Förbättra systemets tillförlitlighet: Genom att identifiera flaskhalsar, prestandaproblem och potentiella felpunkter hjälper observerbarheten till att optimera systemets prestanda och förbättra den övergripande tillförlitligheten.

  • Förbättra kundupplevelsen: Observerbarhet ger bättre förståelse för hur systemprestanda påverkar slutanvändare, vilket möjliggör proaktiva åtgärder för att förbättra kundnöjdheten.

  • Underlätta samarbete: Observerbarhetsplattformar ger delad synlighet och dataåtkomst, vilket främjar samarbete mellan olika team, till exempel utvecklare, drift och support.

  • Regelefterlevnad: Observerbarhet underlättar uppfyllande av regelkrav genom att tillhandahålla spårbarhet, granskningsloggar och säkerställa efterlevnad av säkerhets- och sekretessstandarder.

  • Snabbare lösningstid: Genom att tillhandahålla omfattande data och insikter påskyndar observerbarheten tiden för att diagnostisera och lösa problem, vilket minimerar driftstopp och avbrott i tjänsten.

  • Proaktiv kapacitetshantering: Observerbarhetsdata hjälper till att förutsäga resursbehov, identifiera kapacitetsluckor och proaktivt justera resurser för att upprätthålla optimala prestanda.

  • Riskreducering: Med observerbarhet kan du identifiera potentiella risker tidigt, aktivera proaktiva åtgärdsåtgärder och minska sannolikheten för allvarliga effekter.

  • Kontinuerlig övervakning och utbildning: Observerbarhet möjliggör kontinuerlig övervakning och inlärning, vilket hjälper team att anpassa sig till föränderliga miljöer, krav och användarbeteende.

  • Prestandaoptimering: Genom att analysera observerbarhetsdata kan team identifiera och optimera flaskhalsar i prestanda, vilket förbättrar systemets effektivitet.

  • Prioritering av insatser: Observerbarhetsinsikter gör det möjligt för team att prioritera uppgifter och allokera resurser baserat på allvarlighetsgrad och påverkan av identifierade problem.

  • Förtroende för ändringshantering: Observerbarhet ger insyn i effekten av ändringar, vilket säkerställer att nya distributioner eller uppdateringar inte medför oförutsedda problem.

  • Förbättrad incidenthantering: Med observerbarhet kan incidenthanteringsteam snabbt samla in relevant information, förstå kontexten och initiera lämpliga åtgärder.

Övervakningsplan

Du skapar en övervakningsplan för att beskriva mål, krav och annan viktig information. Arbeta sedan för att begära ett avtal mellan alla relevanta intressenter i organisationen.

En övervakningsplan bör förklara hur du utvecklar och driver en eller flera övervakningslösningar. Börja skapa dina övervakningsplaner tidigt under projektets strategi- och planeringsfaser.

När du skapar planen är det viktigt att komma ihåg de fem områdena för modern övervakning, enligt beskrivningen i dokumentationen om molnövervakningsstrategin: övervaka, mäta, svara, lära och förbättra.

Följande ger en första rekommenderad disposition för en övervakningsplan och anses vara de främsta övervägandena för en enskild plan för tjänster eller när du standardiserar molntjänstfunktioner som Azure-resurstyper eller Microsoft 365-tjänster.

Kärnan i planen är att definiera synlighetslinjen mellan tjänsteleverantörer (som kommer att sätta in lösningar) och konsumenter (som kommer att driva eller härleda värde).

Affärsperspektiv

En omfattande övervakningsplan måste ta hänsyn till vad verksamheten behöver med och från övervakning, inklusive ett användarcentrerat fokus. När du definierar planen är det viktigt att dokumentera och dela affärskraven, och följande föreslår omfånget för den här delen av planen.

  • Intressenter och konsumenter
  • Affärsvärdeströmmar och -processer
  • Slutanvändarperspektiv och verktyg
  • Krav för mätning och rapportering
  • Identifierade risker och ramverk för efterlevnadskontroll
  • Åtkomst- och kontrollkrav
  • Risk för verksamheten

Tjänstperspektiv

En omfattande övervakningsplan måste ta hänsyn till vad tjänstägarna behöver med och från övervakningen. När du definierar planen är det viktigt att dokumentera och dela deras krav, och följande föreslår omfånget för den här delen av planen.

  • Intressenter och konsumenter
  • Roller och ansvar
  • Definition av tjänsten
  • Åtkomst- och kontrollkrav
  • Arkitekturöverväganden?
  • Leverantör och partner som ligger till grund för kontrakt
  • Serviceavtal (serviceavtal, OLA)
  • Identifiera servicegarantitäckning
  • Krav för mätning och rapportering
  • Risker

Teknikperspektiv

Det här avsnittet av planen representerar övervakningslösningen med hjälp av information från affärs- och tjänstperspektivet. Följande föreslår omfånget för den här delen av planen.

  • Användarberättelser och scenarier
  • Tekniska mål (till exempel nätverk)
  • Mappning av komponentberoende
  • Typer (till exempel molnbaserat, hybrid, lokalt)
  • Observationella
  • Responsiv
  • Mått
  • Justering och optimering

Att tänka på

Sammanfatta planen för att säkerställa att den kommunicerar och informerar alla relevanta konsumenter, intressenter och hanteringsnivåer. Tänk på följande för en lyckad övervakningsplan:

Viktiga överväganden

  • Produktionsfaser: Övervakningslösningen bör vara klar när tjänsten går live. Planering kan omfatta test- eller förproduktionskonfiguration i en annan prenumeration som är dedikerad för att experimentera och testa dina antaganden.

  • Strategi: Planer kan också mappas tillbaka till övervakning och IT-strategi för att spåra övervakningsmålen till uppdraget eller verksamheten.

  • Mål: I planen beskriver och analyserar du de måltillgångar eller tjänster som övervägs. Om det behövs mappar du alla komponenter som ska övervakas, inklusive tjänstberoenden. Identifiera täckningsluckor och fastställa vem som äger varje del av tjänsten.

  • Lösning: Identifiera konsumenter, intressenter, leverantörer, partner, åtkomst och instrumentering för övervakningslösningen. Övervakningsaspekter, omfång, svar, rapporter och instrumentpaneler (tillgänglighet, säkerhet, användarupplevelse med mera).

Allmänna överväganden

Utöver de viktigaste övervägandena kan du försöka bättre förstå hur dessa punkter kan påverka din övervakningsplan för din organisation.

  • Minsta livskraftiga produkt (MVP): Låt planen definiera hur framgång ser ut för den minsta livskraftiga produkten. Med andra ord, vad behövs först för att gå live, och kan vi mäta framgång i detta? När du är live fortsätter du att utveckla övervakningslösningen för att maximera värdet.

  • Skydda dina övervakningsdata: Säkerhet är en viktig aspekt för alla organisationer och team i dag. Se till att du är utbildad och känner till skyddsräckena, eller låt experter vägleda dig så att du inte lägger till risker i dina övervakningslösningar, till exempel genom att exponera känsliga övervakningsdata i loggar.

  • Överväg Microsoft 365: Alla bra planer betraktar din Azure-klientorganisation med Microsoft 365 som en viktig komponent. Microsoft 365 är beroende av Microsoft Entra-ID och Azure Monitor tillhandahåller Microsoft 365-integrering med slutpunktshantering.

  • Observerbarhet vinner: Fokusera på total synlighet innan du fokuserar på aviseringar, eftersom aviseringar både är en kostnad och snabbt kan leda till aviseringströtthet.

  • Aktivitetsövervakning: Gransknings-, inloggnings- och aktivitetsloggar är nu enkla för tjänstägare och säkerhet att dela upp och tärna. Se till att din övervakningsplan tar hänsyn till aktivitetsövervakningen, inklusive de insikter och instrumentpaneler som du behöver skapa för alla relevanta intressenter.

Nästa steg