Standarddiagnostik för lastbalanserare med mått, aviseringar och resurshälsa

Azure Load Balancer visar följande diagnostikfunktioner:

  • Flerdimensionella mått och aviseringar: Tillhandahåller flerdimensionella diagnostikfunktioner via Azure Monitor för standardkonfigurationer av lastbalanserare. Du kan övervaka, hantera och felsöka dina standardresurser för lastbalanserare.

  • Resurshälsa: Resource Health-statusen för lastbalanseraren är tillgänglig på sidan Resurshälsa under Övervaka. Den här automatiska kontrollen informerar dig om den aktuella tillgängligheten för lastbalanserarens resurs.

Den här artikeln innehåller en snabb genomgång av dessa funktioner och erbjuder olika sätt att använda dem för en standardlastbalanserare.

Flerdimensionella mått

Azure Load Balancer tillhandahåller flerdimensionella mått via Azure Metrics i Azure-portalen och hjälper dig att få diagnostiska insikter i realtid om dina lastbalanserares resurser.

De olika konfigurationerna för lastbalanserare innehåller följande mått:

Metric Resurstyp beskrivning Rekommenderad aggregering
Tillgänglighet för databana Offentlig och intern lastbalanserare En standardlastbalanserare använder kontinuerligt datasökvägen från en region till lastbalanserarens klientdel till nätverket som stöder den virtuella datorn. Så länge felfria instanser finns kvar följer mätningen samma sökväg som programmets belastningsutjämningstrafik. Den datasökväg som används verifieras. Mätningen är osynlig för ditt program och stör inte andra åtgärder. Genomsnitt
Status för hälsoavsökning Offentlig och intern lastbalanserare En standardlastbalanserare använder en distribuerad hälsoprovningstjänst som övervakar programändpunktens hälsa enligt dina konfigurationsinställningar. Med det här måttet får du en sammanställd vy eller filtrerad vy per slutpunkt för varje instansslutpunkt i lastbalanserarens pool. Du kan se hur lastbalanseraren ser hälsotillståndet för ditt program, enligt konfigurationen av hälsoavsökningen. Genomsnitt
SYN-antal (synkronisera) Offentlig och intern lastbalanserare En standardlastbalanserare avslutar inte TCP-anslutningar (Transmission Control Protocol) eller interagerar med TCP- eller UDP-flöden (User Data-gram Packet). Flöden och deras handskakningar sker alltid mellan källan och den virtuella datorinstansen. Du kan felsöka dina scenarier med TCP-protokoll på ett bättre sätt genom att använda räknare för SYN-paket för att förstå hur många TCP-anslutningsförsök som görs. Måttet rapporterar antalet TCP SYN-paket som tagits emot. Sum
Antal SNAT-anslutningar (Source Network Address Translation) Offentlig lastbalanserare En standardlastbalanserare rapporterar antalet utgående flöden som maskeras till klientdelen för den offentliga IP-adressen. SNAT-portar är en outtömlig resurs. Det här måttet kan ge en indikation på hur mycket ditt program förlitar sig på SNAT för utgående flöden. Räknare för lyckade och misslyckade utgående SNAT-flöden rapporteras. Räknarna kan användas för att felsöka och förstå hälsotillståndet för dina utgående flöden. Sum
Allokerade SNAT-portar Offentlig lastbalanserare En standardlastbalanserare rapporterar antalet SNAT-portar som allokerats per serverdelsinstans Genomsnittliga.
Använda SNAT-portar Offentlig lastbalanserare En standardlastbalanserare rapporterar antalet SNAT-portar som används per serverdelsinstans. Genomsnitt
Antal byte Offentlig och intern lastbalanserare En standardlastbalanserare rapporterar de data som bearbetas per klientdel. Du kanske märker att byteen inte distribueras lika mellan serverdelsinstanserna. Detta förväntas eftersom Azure Load Balancer-algoritmen baseras på flöden Sum
Antal paket Offentlig och intern lastbalanserare En standardlastbalanserare rapporterar de paket som bearbetas per klientdel. Sum

Kommentar

Bandbreddsrelaterade mått som SYN-paket, antal byte och antal paket samlar inte in någon trafik till en intern lastbalanserare via en UDR (t.ex. från en NVA eller brandvägg).

Max- och minaggregeringar är inte tillgängliga för måtten SYN count, packet count, SNAT connection count och byte count. Antalsaggregering rekommenderas inte för datasökvägstillgänglighet och hälsoavsökningsstatus. Använd genomsnitt i stället för bäst representerade hälsodata.

Visa måtten för lastbalanseraren i Azure-portalen

Azure-portalen exponerar lastbalanserarens mått via sidan Mått. Den här sidan är tillgänglig både på lastbalanserarens resurssida för en viss resurs och på sidan Azure Monitor.

Kommentar

Azure Load Balancer skickar inte hälsoavsökningar till frigjorda virtuella datorer. När virtuella datorer frigörs slutar lastbalanseraren att rapportera mått för den instansen. Mått som inte är tillgängliga visas som en streckad rad i portalen eller visar ett felmeddelande som anger att mått inte kan hämtas.

Så här visar du måtten för dina standardresurser för lastbalanserare:

  1. Gå till måttsidan och utför någon av följande uppgifter:

    • På lastbalanserarens resurssida väljer du måtttypen i listrutan.

    • På sidan Azure Monitor väljer du lastbalanserarens resurs.

  2. Ange lämplig måttaggregeringstyp.

  3. Du kan också konfigurera nödvändig filtrering och gruppering.

  4. Du kan också konfigurera tidsintervallet och aggregeringen. Som standard visas tiden i UTC.

Kommentar

Tidsaggregering är viktigt när du tolkar vissa mått eftersom data samplas en gång per minut. Om tidsaggregering är inställt på fem minuter och måttaggregeringstypen Summa används för mått som SNAT-allokering, visar diagrammet fem gånger den totala allokerade SNAT-portarna.

Rekommendation: När du analyserar måttaggregeringstypen Summa och Antal rekommenderar vi att du använder ett tidsaggregeringsvärde som är större än en minut.

Metric for data path availability for a standard load balancer.

Bild: Mått för datasökvägstillgänglighet för en standardlastbalanserare

Hämta flerdimensionella mått programmatiskt via API:er

Api-vägledning för att hämta flerdimensionella måttdefinitioner och värden finns i Genomgång av REST API för Azure Monitoring. Dessa mått kan skrivas till ett lagringskonto genom att lägga till en diagnostikinställning för kategorin Alla mått.

Är datasökvägen upp och tillgänglig för min lastbalanserares klientdel?

Expandera

Måttet för datasökvägstillgänglighet beskriver hälsotillståndet i regionen för datasökvägen till beräkningsvärden där dina virtuella datorer finns. Måttet är en återspegling av hälsotillståndet för Azure-infrastrukturen. Du kan använda måttet för att:

  • Övervaka tjänstens externa tillgänglighet.

  • Undersök plattformen där din tjänst distribueras och ta reda på om den är felfri. Kontrollera om gästoperativsystemet eller programinstansen är felfri.

  • Isolera om en händelse är relaterad till din tjänst eller det underliggande dataplanet. Blanda inte ihop det här måttet med hälsoavsökningsstatusen ("Tillgänglighet för serverdelsinstans").

Så här hämtar du tillgängligheten för datasökvägen för dina standardresurser för lastbalanserare:

  1. Kontrollera att rätt lastbalanseringsresurs är markerad.

  2. I listrutan Mått väljer du Tillgänglighet för datasökväg.

  3. I listrutan Sammansättning väljer du Genomsnittlig.

  4. Lägg dessutom till ett filter på klientdelens IP-adress eller klientdelsport som dimension med den nödvändiga IP-adressen för klientdelen eller klientdelsporten. Gruppera dem sedan efter den valda dimensionen.

Load balancer frontend probing details.

Bild: Information om avsökning av lastbalanserares klientdel

Måttet genereras av en aktiv in-band-mätning. En avsökningstjänst i regionen kommer från trafik för mätningen. Tjänsten aktiveras så snart du skapar en distribution med en offentlig klientdel och den fortsätter tills du tar bort klientdelen.

Ett paket som matchar distributionens klientdel och regel genereras regelbundet. Den passerar regionen från källan till värden där en virtuell dator i serverdelspoolen finns. Lastbalanserarens infrastruktur utför samma belastningsutjämning och översättningsåtgärder som för all annan trafik. Den här avsökningen är in-band på din belastningsutjämningsslutpunkt. När avsökningen har anlänt till beräkningsvärden, där en felfri virtuell dator i serverdelspoolen finns, genererar beräkningsvärden ett svar på avsökningstjänsten. Den virtuella datorn ser inte den här trafiken.

Tillgängligheten för datasökvägen misslyckas av följande orsaker:

  • Distributionen har inga felfria virtuella datorer kvar i serverdelspoolen.

  • Ett infrastrukturfel har inträffat.

I diagnostiksyfte kan du använda måttet för tillgänglighet för datasökvägar tillsammans med hälsoavsökningens status.

Använd Genomsnitt som aggregering för de flesta scenarier.

Svarar serverdelsinstanserna för min lastbalanserare på avsökningar?

Expandera

Statusmåttet för hälsoavsökningen beskriver hälsotillståndet för programdistributionen enligt konfigurationen av hälsoavsökningen för lastbalanseraren. Lastbalanseraren använder statusen för hälsoavsökningen för att avgöra var nya flöden ska skickas. Hälsoavsökningar kommer från en Azure-infrastrukturadress och visas i gästoperativsystemet på den virtuella datorn.

Så här hämtar du status för hälsoavsökningen för dina standardresurser för lastbalanserare:

  1. Välj måttet Status för hälsoavsökning med typen för genomsnittlig aggregering.

  2. Använd ett filter på den nödvändiga IP-adressen eller porten för klientdelen (eller båda).

Hälsoavsökningar misslyckas av följande orsaker:

  • Du konfigurerar en hälsoavsökning till en port som inte lyssnar eller inte svarar eller använder fel protokoll. Om tjänsten använder direkt serverretur eller flytande IP-regler kontrollerar du att tjänsten lyssnar på IP-adressen för nätverkskortets IP-konfiguration och den loopback som har konfigurerats med klientdelens IP-adress.

  • Nätverkssäkerhetsgruppen, den virtuella datorns brandvägg för gästoperativsystem eller filter på programnivå tillåter inte hälsoavsökningstrafiken.

Använd Genomsnitt som aggregering för de flesta scenarier.

Hur gör jag för att kolla in min statistik över utgående anslutningar?

Expandera

Måttet för SNAT-anslutningar beskriver volymen av lyckade och misslyckade anslutningar för utgående flöden.

En misslyckad anslutningsvolym på större än noll indikerar SNAT-portöverbelastning. Du måste undersöka ytterligare för att avgöra vad som kan orsaka dessa fel. SNAT-portöverbelastningsmanifest som ett fel vid upprättande av ett utgående flöde. Läs artikeln om utgående anslutningar för att förstå scenarier och mekanismer i arbetet och lära dig hur du minimerar och utformar för att undvika SNAT-portöverbelastning.

Så här hämtar du SNAT-anslutningsstatistik:

  1. Välj måtttypen SNAT Anslut ions och Summa som aggregering.

  2. Gruppera efter Anslut ionstillstånd för lyckade och misslyckade SNAT-anslutningsantal som ska representeras av olika rader.

Load balancer SNAT connection count.

Bild: Antal SNAT-anslutningar för lastbalanserare

Hur gör jag för att kontrollera min SNAT-portanvändning och allokering?

Expandera

Måttet för använda SNAT-portar spårar hur många SNAT-portar som används för att underhålla utgående flöden. Det här måttet anger hur många unika flöden som upprättas mellan en internetkälla och en virtuell dator på serverdelen eller en vm-skalningsuppsättning som ligger bakom en lastbalanserare och som inte har någon offentlig IP-adress. Genom att jämföra antalet SNAT-portar som du använder med måttet Allokerade SNAT-portar kan du avgöra om tjänsten upplever eller riskerar SNAT-överbelastning och resulterande utgående flödesfel.

Om dina mått indikerar risk för fel i utgående flöde refererar du till artikeln och vidtar åtgärder för att minimera detta för att säkerställa tjänstens hälsa.

Så här visar du användning och allokering av SNAT-portar:

  1. Ange tidssammansättningen för diagrammet till 1 minut för att säkerställa att önskade data visas.

  2. Välj Använda SNAT-portar och/eller allokerade SNAT-portar som måtttyp och Medelvärde som aggregering.

    • Som standard är dessa mått det genomsnittliga antalet SNAT-portar som allokeras till eller används av varje virtuell serverdelsdator eller vm-skalningsuppsättning. De motsvarar alla offentliga IP-adresser för klientdelen som mappas till lastbalanseraren, aggregerade över TCP och UDP.

    • Om du vill visa totalt antal SNAT-portar som används av eller allokerats för lastbalanseraren använder du måttaggregeringssumma.

  3. Filtrera efter en specifik protokolltyp, en uppsättning ip-adresser för serverdelen och/eller klientdels-IP-adresser.

  4. Om du vill övervaka hälsotillståndet per serverdel eller klientdelsinstans använder du delning.

    • Med delning av anteckningar kan endast ett enda mått visas i taget.
  5. Om du till exempel vill övervaka SNAT-användning för TCP-flöden per dator, aggregera efter genomsnitt, dela efter IP-adresser för serverdelen och filtrera efter protokolltyp.

Average TCP SNAT port allocation and usage for a set of backend VMs.

Bild: Genomsnittlig TCP SNAT-portallokering och användning för en uppsättning virtuella serverdelsdatorer

TCP SNAT port usage per backend instance.

Bild: TCP SNAT-portanvändning per serverdelsinstans

Hur gör jag för att kontrollera inkommande/utgående anslutningsförsök för min tjänst?

Expandera Ett SYN-paketmått beskriver volymen av TCP SYN-paket, som har anlänt eller skickats för utgående flöden som är associerade med en specifik klientdel. Du kan använda det här måttet för att förstå TCP-anslutningsförsök till din tjänst.

Mer information om utgående anslutningar finns i SNAT (Source Network Address Translation) för utgående anslutningar

Använd Sum som sammansättning för de flesta scenarier.

Load balancer SYN count.

Bild: SYN-antal lastbalanserare

Hur gör jag för att kontrollera förbrukningen av nätverksbandbredd?

Expandera

Måttet byte och paketräknare beskriver mängden byte och paket som skickas eller tas emot av tjänsten per klientdel.

Använd Sum som sammansättning för de flesta scenarier.

Så här hämtar du byte- eller paketräkningsstatistik:

  1. Välj måtttypen Bytes Count och/eller Packet Count med Sum som sammansättning.

  2. Gör något av följande:

    • Använd ett filter på en specifik klientdels-IP-adress, klientdelsport, serverdels-IP eller serverdelsport.

    • Hämta övergripande statistik för lastbalanserarens resurs utan filtrering.

Load balancer byte count.

Bild: Antal byte för lastbalanserare

Hur gör jag för att diagnostisera distributionen av lastbalanseraren?

Expandera

Genom att använda en kombination av måtten för datasökvägstillgänglighet och status för hälsoavsökningar i ett enda diagram kan du identifiera var du ska leta efter problemet och lösa problemet. Du kan se till att Azure fungerar korrekt och använda den här kunskapen för att slutgiltigt fastställa att konfigurationen eller programmet är rotorsaken.

Du kan använda mått för hälsoavsökning för att förstå hur Azure ser på hälsotillståndet för distributionen enligt den konfiguration som du har angett. Att titta på hälsoavsökningar är alltid ett bra första steg när det gäller att övervaka eller fastställa en orsak.

Du kan ta det ett steg längre och använda datasökvägstillgänglighetsmått för att få insikt i hur Azure visar hälsotillståndet för det underliggande dataplanet som ansvarar för din specifika distribution. När du kombinerar båda måtten kan du isolera var felet kan vara, vilket visas i det här exemplet:

Combining data path availability and health probe status metrics.

Bild: Kombinera datasökvägstillgänglighet och statusmått för hälsoavsökning

Diagrammet visar följande information:

  • Infrastrukturen som var värd för dina virtuella datorer var inte tillgänglig och låg på 0 procent i början av diagrammet. Senare var infrastrukturen felfri och de virtuella datorerna kunde nås och mer än en virtuell dator placerades i serverdelen. Den här informationen anges av den blå spårningen för datasökvägstillgänglighet, som senare var 100 procent.

  • Hälsoavsökningsstatusen, som anges av den lila spårningen, är 0 procent i början av diagrammet. Det inringade området i grönt markerar var hälsoavsökningens status blev felfri och då kunde kundens distribution acceptera nya flöden.

Diagrammet gör det möjligt för kunder att felsöka distributionen på egen hand utan att behöva gissa eller fråga support om andra problem uppstår. Tjänsten var inte tillgänglig eftersom hälsoavsökningarna misslyckades på grund av antingen en felkonfiguration eller ett misslyckat program.

Konfigurera aviseringar för flerdimensionella mått

Azure Load Balancer stöder enkelt konfigurerbara aviseringar för flerdimensionella mått. Konfigurera anpassade tröskelvärden för specifika mått för att utlösa aviseringar med varierande allvarlighetsgrad för att ge en upplevelse för resursövervakning utan beröring.

Så här konfigurerar du varningar:

  1. Gå till aviseringssidan för lastbalanseraren

  2. Skapa en ny aviseringsregel

    1. Konfigurera aviseringsvillkor (Obs! För att undvika bullriga aviseringar rekommenderar vi att du konfigurerar aviseringar med aggregeringstypen inställd på Genomsnitt, ser tillbaka på ett femminutersfönster med data och med ett tröskelvärde på 95 %)

    2. (Valfritt) Lägg till åtgärdsgrupp för automatisk reparation

    3. Tilldela allvarlighetsgrad, namn och beskrivning för aviseringar som möjliggör intuitiv reaktion

Aviseringar om inkommande tillgänglighet

Kommentar

Om lastbalanserarens serverdelspooler är tomma har lastbalanseraren inga giltiga datasökvägar att testa. Därför kommer datasökvägstillgänglighetsmåttet inte att vara tillgängligt och eventuella konfigurerade Azure-aviseringar på datasökvägens tillgänglighetsmått utlöses inte.

Om du vill avisera om inkommande tillgänglighet kan du skapa två separata aviseringar med hjälp av måtten för tillgänglighet för datasökväg och statusmått för hälsoavsökning. Kunder kan ha olika scenarier som kräver specifik aviseringslogik, men exemplen nedan är användbara för de flesta konfigurationer.

Med hjälp av tillgänglighet för datasökvägar kan du utlösa aviseringar när en specifik belastningsutjämningsregel blir otillgänglig. Du kan konfigurera den här aviseringen genom att ange ett aviseringsvillkor för datasökvägens tillgänglighet och dela upp med alla aktuella värden och framtida värden för både klientdelsporten och klientdelens IP-adress. Om aviseringslogik anges till mindre än eller lika med 0 utlöses aviseringen när någon belastningsutjämningsregel slutar svara. Ange sammansättningskornighet och utvärderingsfrekvens enligt önskad utvärdering.

Med status för hälsoavsökning kan du avisera när en viss serverdelsinstans inte svarar på hälsoavsökningen under en betydande tid. Konfigurera aviseringsvillkoret för att använda måttet för hälsoavsökningsstatus och dela upp efter serverdels-IP-adress och serverdelsport. Detta säkerställer att du kan avisera separat för varje enskild serverdelsinstanss möjlighet att hantera trafik på en specifik port. Använd den genomsnittliga aggregeringstypen och ange tröskelvärdet enligt hur ofta serverdelsinstansen avsöks och det tröskelvärde som anses vara felfritt.

Du kan också avisera på en serverdelspoolnivå genom att inte dela upp efter några dimensioner och använda den genomsnittliga aggregeringstypen. På så sätt kan du konfigurera aviseringsregler, till exempel aviseringar när 50 % av mina medlemmar i serverdelspoolen inte är felfria.

Aviseringar om utgående tillgänglighet

För utgående tillgänglighet kan du konfigurera två separata aviseringar med SNAT-anslutningsantalet och använda SNAT-portmått.

Om du vill identifiera utgående anslutningsfel konfigurerar du en avisering med SNAT-anslutningsantal och filtrering till Anslut ionstillstånd = Misslyckades. Använd den totala aggregeringen. Sedan kan du dela upp detta efter serverdels-IP-adress inställd på alla aktuella och framtida värden för att avisera separat för varje serverdelsinstans som har misslyckade anslutningar. Ange tröskelvärdet till större än noll eller ett högre tal om du förväntar dig att se några utgående anslutningsfel.

Med använda SNAT-portar kan du avisera om en högre risk för SNAT-överbelastning och utgående anslutningsfel. Se till att du delar upp med ip-adress och protokoll för serverdelen när du använder den här aviseringen. Använd den genomsnittliga aggregeringen. Ange tröskelvärdet till större än en procentandel av det antal portar som du har allokerat per instans som du anser är osäker. Konfigurera till exempel en avisering med låg allvarlighetsgrad när en serverdelsinstans använder 75 % av sina allokerade portar. Konfigurera en varning med hög allvarlighetsgrad när den använder 90 % eller 100 % av sina allokerade portar.

Status för resurshälsa

Hälsostatus för standardresurserna för lastbalanseraren exponeras via den befintliga resurshälsan under Övervaka > Tjänststatus. Den utvärderas varannan minut genom att mäta tillgängligheten för datavägar som avgör om klientdelens belastningsutjämningsslutpunkter är tillgängliga.

Status för resurshälsa Beskrivning
Tillgängligt Din standardresurs för lastbalanserare är felfri och tillgänglig.
Degraderad Din standardlastbalanserare har plattforms- eller användarinitierade händelser som påverkar prestanda. Måttet för datasökvägstillgänglighet har rapporterat mindre än 90 % men större än 25 % hälsa i minst två minuter. Med den här statusen får du måttlig till svår prestandaeffekt. Följ felsökningsguiden för RHC för att avgöra om det finns användarinitierade händelser som påverkar din tillgänglighet.
Inte tillgänglig Standardresursen för lastbalanseraren är inte felfri. Måttet för datasökvägstillgänglighet har rapporterat mindre 25 % hälsa i minst två minuter. Med den här statusen får du betydande prestandaeffekt eller brist på tillgänglighet för inkommande anslutningar. Det kan finnas användar- eller plattformshändelser som orsakar otillgänglighet. Följ felsökningsguiden för RHC för att avgöra om det finns användarinitierade händelser som påverkar din tillgänglighet.
Okänt Hälsostatusen för lastbalanserarens resurs har inte uppdaterats eller har inte tagit emot information om tillgängligheten för datasökvägen under de senaste 10 minuterna. Det här tillståndet bör vara tillfälligt och återspegla rätt status så snart data tas emot.

Så här visar du hälsotillståndet för dina offentliga standardresurser för lastbalanserare:

  1. Välj Övervaka> Tjänststatus.

    The service health link on Azure Monitor.

    Bild: Länken för tjänstens hälsotillstånd i Azure Monitor

  2. Välj Resurshälsa och kontrollera sedan att Prenumerations-IDoch Resurstyp = lastbalanserare är markerade.

    Select resource for health view.

    Bild: Välj resurs för hälsovyn

  3. I listan väljer du lastbalanserarens resurs för att visa dess historiska hälsostatus.

    Resource health status.

    Bild: Status för resurshälsa

En allmän beskrivning av en resurshälsostatus finns i dokumentationen om resurshälsa.

Resource Health-aviseringar

Azure Resource Health-aviseringar kan meddela dig nästan i realtid när hälsotillståndet för lastbalanserarens resurs ändras. Vi rekommenderar att du anger hälsoaviseringar för resursen så att du meddelas när lastbalanserarens resurs är i ett degraderat eller otillgängligt tillstånd.

När du skapar Azure-resurshälsoaviseringar för lastbalanserare skickar Azure hälsomeddelanden för resurser till din Azure-prenumeration. Du kan skapa och anpassa aviseringar baserat på:

  • Den prenumeration som påverkas
  • Den resursgrupp som påverkas
  • Den resurstyp som påverkas (lastbalanserare)
  • Den specifika resursen (valfri lastbalanserare som du väljer att konfigurera en avisering för)
  • Händelsestatus för lastbalanserarens resurs som påverkas
  • Den aktuella statusen för den lastbalanserare som påverkas
  • Den tidigare statusen för lastbalanserarens resurs som påverkas
  • Orsakstypen för lastbalanserarens resurs som påverkas

Du kan också konfigurera vem aviseringen ska skickas till:

  • En ny åtgärdsgrupp (som kan användas för framtida aviseringar)
  • En befintlig åtgärdsgrupp

Mer information om hur du konfigurerar dessa resurshälsoaviseringar finns i:

Nästa steg