Händelseanalys och visualisering med Azure Monitor-loggar

Azure Monitor-loggar samlar in och analyserar telemetri från program och tjänster i molnet och tillhandahåller analysverktyg som hjälper dig att maximera deras tillgänglighet och prestanda. Den här artikeln beskriver hur du kör frågor i Azure Monitor-loggar för att få insikter och felsöka vad som händer i klustret. Följande vanliga frågor tas upp:

  • Hur gör jag för att felsöka hälsohändelser?
  • Hur gör jag för att vet när en nod slutar fungera?
  • Hur gör jag för att vet om programmets tjänster har startats eller stoppats?

Anteckning

Den här artikeln uppdaterades nyligen för att använda termen Azure Monitor-loggar i stället för Log Analytics. Loggdata lagras fortfarande på en Log Analytics-arbetsyta och samlas fortfarande in och analyseras av samma Log Analytics-tjänst. Vi uppdaterar terminologin för att bättre återspegla loggarnas roll i Azure Monitor. Mer information finns i Terminologiändringar i Azure Monitor .

Översikt över Log Analytics-arbetsytan

Anteckning

Diagnostiklagring är aktiverat som standard när klustret skapas, men du måste fortfarande konfigurera Log Analytics-arbetsytan för att läsa från diagnostiklagringen.

Azure Monitor-loggar samlar in data från hanterade resurser, inklusive en Azure-lagringstabell eller en agent, och underhåller dem på en central lagringsplats. Data kan sedan användas för analys, aviseringar och visualisering eller för vidare export. Azure Monitor-loggar stöder händelser, prestandadata eller andra anpassade data. Gå igenom stegen för att konfigurera diagnostiktillägget för att aggregera händelser och steg för att skapa en Log Analytics-arbetsyta som ska läsas från händelserna i lagringen för att kontrollera att data flödar in i Azure Monitor-loggar.

När data har tagits emot av Azure Monitor-loggar har Azure flera övervakningslösningar som är förpaketerade lösningar eller operativa instrumentpaneler för att övervaka inkommande data, anpassade till flera scenarier. Dessa inkluderar en Service Fabric Analytics-lösning och en containerlösning , som är de två mest relevanta för diagnostik och övervakning när du använder Service Fabric-kluster. Den här artikeln beskriver hur du använder Service Fabric Analytics-lösningen, som skapas med arbetsytan.

Få åtkomst till Service Fabric Analytics-lösningen

I Azure-portalen går du till resursgruppen där du skapade Service Fabric Analytics-lösningen.

Välj resursen ServiceFabric<nameOfOMSWorkspace>.

I Summaryvisas paneler i form av ett diagram för var och en av de aktiverade lösningarna, inklusive en för Service Fabric. Klicka på Service Fabric-grafen för att fortsätta till Service Fabric Analytics-lösningen.

Service Fabric-lösning

Följande bild visar startsidan för Service Fabric Analytics-lösningen. Den här startsidan ger en ögonblicksbild av vad som händer i klustret.

Skärmbild som visar startsidan för Service Fabric Analytics-lösningen.

Om du har aktiverat diagnostik när klustret skapas kan du se händelser för

Anteckning

Förutom Service Fabric-händelserna kan mer detaljerade systemhändelser samlas in genom att uppdatera konfigurationen av diagnostiktillägget.

Visa Service Fabric-händelser, inklusive åtgärder på noder

På sidan Service Fabric Analytics klickar du på diagrammet för Service Fabric-händelser.

Service Fabric Solution Operational Channel

Klicka på Lista för att visa händelserna i en lista. Här visas alla systemhändelser som har samlats in. Som referens kommer dessa från WADServiceFabricSystemEventsTable i Azure Storage-kontot, och på samma sätt kommer de tillförlitliga tjänste- och aktörshändelser som du ser härnäst från respektive tabeller.

Fråga operational channel

Du kan också klicka på förstoringsglaset till vänster och använda Kusto-frågespråket för att hitta det du letar efter. Om du till exempel vill hitta alla åtgärder som vidtas på noder i klustret kan du använda följande fråga. Händelse-ID:t som används nedan finns i händelsereferensen för den operativa kanalen.

ServiceFabricOperationalEvent
| where EventId < 25627 and EventId > 25619 

Du kan fråga i många fler fält, till exempel de specifika noderna (Dator) systemtjänsten (TaskName).

Visa händelser för Service Fabric Reliable Service och Actor

På sidan Service Fabric Analytics klickar du på diagrammet för Reliable Services.

Service Fabric Solution Reliable Services

Klicka på Lista för att visa händelserna i en lista. Här kan du se händelser från tillförlitliga tjänster. Du kan se olika händelser för när tjänsten runasync startas och slutförs, vilket vanligtvis sker vid distributioner och uppgraderingar.

Fråga Reliable Services

Tillförlitliga aktörshändelser kan ses på ett liknande sätt. Om du vill konfigurera mer detaljerade händelser för tillförlitliga aktörer måste du ändra scheduledTransferKeywordFilter i konfigurationen för diagnostiktillägget (visas nedan). Information om värdena för dessa finns i referensen för tillförlitliga aktörers händelser.

"EtwEventSourceProviderConfiguration": [
                {
                    "provider": "Microsoft-ServiceFabric-Actors",
                    "scheduledTransferKeywordFilter": "1",
                    "scheduledTransferPeriod": "PT5M",
                    "DefaultEvents": {
                    "eventDestination": "ServiceFabricReliableActorEventTable"
                    }
                },

Kusto-frågespråket är kraftfullt. En annan värdefull fråga som du kan köra är att ta reda på vilka noder som genererar flest händelser. Frågan i skärmbilden nedan visar service fabric-drifthändelser aggregerade med den specifika tjänsten och noden.

Frågehändelser per nod

Nästa steg