Förstå en systemomstart för en virtuell Azure-dator

Virtuella Azure-datorer (VM) kan ibland startas om utan uppenbar anledning, utan bevis på att du har initierat omstarten. Den här artikeln innehåller en lista över åtgärder och händelser som kan få virtuella datorer att starta om och ger insikter om hur du undviker oväntade omstartsproblem eller minskar effekten av sådana problem.

Konfigurera de virtuella datorerna för hög tillgänglighet

Det bästa sättet att skydda ett program som körs på Azure mot omstarter av virtuella datorer och driftstopp är att konfigurera de virtuella datorerna för hög tillgänglighet.

För att tillhandahålla den här redundansnivån till ditt program rekommenderar vi att du grupperar två eller flera virtuella datorer i en tillgänglighetsuppsättning. Den här konfigurationen säkerställer att minst en virtuell dator är tillgänglig under en planerad eller oplanerad underhållshändelse och uppfyller serviceavtalet för Azure på 99,95 procent.

Mer information om tillgänglighetsuppsättningar finns i Hantera tillgängligheten för virtuella datorer

Resource Health information

Azure Resource Health är en tjänst som exponerar hälsotillståndet för enskilda Azure-resurser och ger användbar vägledning för felsökning av problem. I en molnmiljö där det inte går att direkt komma åt servrar eller infrastrukturelement är målet med Resource Health att minska den tid som du lägger på felsökning. I synnerhet är målet att minska den tid som du ägnar åt att avgöra om roten till problemet ligger i programmet eller i en händelse på Azure-plattformen. Mer information finns i Förstå och använda Resource Health.

Om Azure har ytterligare information om rotorsaken till en plattforminitierad otillgänglighet för en virtuell dator kan den informationen publiceras i resurshälsan upp till 72 timmar efter den första otillgängligheten.

Saknade driftstopp för virtuella datorer i aktivitetsloggen

Resource Health aviseringar skickas baserat på aktivitetslogginformationen. I vissa fall kan det hända att driftstopp för virtuella datorer inte visas i aktivitetsloggen. Om stilleståndstiden inte visas i aktivitetsloggen skickas inte Resource Health aviseringar för stilleståndstiden. Stilleståndstiden visas fortfarande i Resource Health.

Här är de fall där driftstopp för virtuella datorer inte visas i aktivitetsloggen:

  • När en virtuell dator skapas eller migreras till en ny värd visas inte tillståndet för den virtuella datorn korrekt på Azure-plattformen och tillståndet ändras till Okänd. Först när alla nätverksanslutningar och nodprocesser har upprättats ändras den virtuella datorns tillstånd till Tillgänglig. Den förlängda perioden för okänt tillstånd filtreras bort från aktivitetsloggen.
  • När tillgänglighetstillståndet för den virtuella datorn ändras från Tillgänglig till otillgänglig och sedan återgår till Tillgänglig inom 35 sekunder visas inte stilleståndstiden i aktivitetsloggen. Det här fallet inträffar inte om ett korrelerat stilleståndstid skickas inom 15 minuter innan den första övergången inträffar.
  • Om den virtuella datorns hälsotillstånd ändras från ett tillstånd till Okänt och sedan återgår till det ursprungliga tillståndet filtreras det tillfälliga okända tillståndet och relaterade övergångar bort från aktivitetsloggen.

De driftstopp för virtuella datorer som inte visas i aktivitetsloggen filtreras på Azure-plattformssidan för att förhindra att tillfälliga fel visar felaktiga driftstopp för kunder. Med pågående investeringar i hälsokvalitet för virtuella datorer kanske filtren inte längre är nödvändiga och kan göra att snabba ändringar i VM-hälsan förblir orapporterade. Microsoft arbetar med en utfasningsplan för att leverera den bästa kundupplevelsen.

Åtgärder och händelser som kan göra att den virtuella datorn startas om

Planerat underhåll

Microsoft Azure utför regelbundet uppdateringar över hela världen för att förbättra tillförlitligheten, prestandan och säkerheten för värdinfrastrukturen som ligger till grund för virtuella datorer. Många av dessa uppdateringar, inklusive minnesbevarande uppdateringar, utförs utan att dina virtuella datorer eller molntjänster påverkas.

Vissa uppdateringar kräver dock en omstart. I sådana fall stängs de virtuella datorerna av medan vi korrigerar infrastrukturen och sedan startas de virtuella datorerna om.

Information om vad planerat Underhåll i Azure är och hur det kan påverka tillgängligheten för dina virtuella Linux-datorer finns i artiklarna här. Artiklarna innehåller bakgrundsinformation om den planerade underhållsprocessen i Azure och hur du schemalägger planerat underhåll för att ytterligare minska påverkan.

Minnesbevarande uppdateringar

För den här uppdateringsklassen i Microsoft Azure påverkas inte användarna av de virtuella datorer som körs. Många av dessa uppdateringar gäller komponenter eller tjänster som kan uppdateras utan att störa den instans som körs. Vissa är uppdateringar av plattformsinfrastrukturen på värdoperativsystemet som kan tillämpas utan omstart av de virtuella datorerna.

Dessa minnesbevarande uppdateringar utförs med teknik som möjliggör direktmigrering på plats. När den uppdateras placeras den virtuella datorn i ett pausat tillstånd. Det här tillståndet bevarar minnet i RAM-minnet medan det underliggande värdoperativsystemet tar emot nödvändiga uppdateringar och korrigeringar. Den virtuella datorn återupptas vanligtvis inom 30 sekunder efter att den har pausats. När den virtuella datorn har återupptagits synkroniseras klockan automatiskt.

På grund av den korta pausperioden minskar distributionen av uppdateringar via den här mekanismen avsevärt påverkan på de virtuella datorerna. Alla uppdateringar kan dock inte distribueras på det här sättet.

Uppdateringar med flera instanser (för virtuella datorer i en tillgänglighetsuppsättning) tillämpas en uppdateringsdomän i taget.

Obs!

Linux-datorer som har gamla kernelversioner påverkas av kernel-panik under den här uppdateringsmetoden. Undvik det här problemet genom att uppdatera till kernelversion 3.10.0-327.10.1 eller senare. Mer information finns i En virtuell Azure Linux-dator på en 3.10-baserad kernel får panik efter en uppgradering av värdnoden.

Användarinitierade åtgärder för omstart eller avstängning

Om du utför en omstart från Azure Portal, Azure PowerShell, kommandoradsgränssnitt eller REST API kan du hitta händelsen i Azure-aktivitetsloggen.

Om du utför åtgärden från den virtuella datorns operativsystem kan du hitta händelsen i systemloggarna.

Andra scenarier som vanligtvis gör att den virtuella datorn startas om inkluderar flera åtgärder för konfigurationsändring. Normalt visas ett varningsmeddelande som anger att körningen av en viss åtgärd resulterar i en omstart av den virtuella datorn. Exempel är eventuella åtgärder för storleksändring av virtuella datorer, ändring av lösenordet för det administrativa kontot och inställning av en statisk IP-adress.

Microsoft Defender för molnet och Windows Update

Microsoft Defender för molnet övervakar dagliga virtuella Windows- och Linux-datorer för saknade uppdateringar av operativsystemet. Defender för molnet hämtar en lista över tillgängliga säkerhetsuppdateringar och kritiska uppdateringar från Windows Update eller Windows Server Update Services (WSUS), beroende på vilken tjänst som är konfigurerad på en virtuell Windows-dator. Defender för molnet söker också efter de senaste uppdateringarna för Linux-system. Om den virtuella datorn saknar en systemuppdatering rekommenderar Defender för molnet att du tillämpar systemuppdateringar. Tillämpningen av dessa systemuppdateringar styrs via Defender för molnet i Azure Portal. När du har tillämpat vissa uppdateringar kan omstarter av virtuella datorer krävas. Mer information finns i Tillämpa systemuppdateringar i Microsoft Defender för molnet.

Precis som lokala servrar push-överför Azure inte uppdateringar från Windows Update till virtuella Windows-datorer, eftersom dessa datorer är avsedda att hanteras av användarna. Du uppmanas dock att lämna inställningen för automatisk Windows Update aktiverad. Automatisk installation av uppdateringar från Windows Update kan också orsaka omstarter när uppdateringarna har tillämpats. Mer information finns i vanliga frågor och svar om Windows Update.

Andra situationer som påverkar tillgängligheten för din virtuella dator

Det finns andra fall där Azure aktivt kan pausa användningen av en virtuell dator. Du får e-postaviseringar innan den här åtgärden vidtas, så du kan lösa de underliggande problemen. Exempel på problem som påverkar tillgängligheten för virtuella datorer är säkerhetsöverträdelser och upphörande av betalningsmetoder.

Värdserverfel

Den virtuella datorn finns på en fysisk server som körs i ett Azure-datacenter. Den fysiska servern kör en agent som kallas värdagenten utöver några andra Azure-komponenter. När dessa Azure-programvarukomponenter på den fysiska servern slutar svara utlöser övervakningssystemet en omstart av värdservern för att försöka återställa. I många fall är den virtuella datorn tillgänglig igen inom 10–15 minuter och fortsätter att finnas på samma värd som tidigare.

Serverfel orsakas vanligtvis av maskinvarufel, till exempel fel på en hårddisk eller solid state-enhet. Azure övervakar kontinuerligt dessa förekomster, identifierar de underliggande buggarna och distribuerar uppdateringar när åtgärden har implementerats och testats.

Eftersom vissa värdserverfel kan vara specifika för den servern kan en upprepad omstart av virtuella datorer förbättras genom att den virtuella datorn distribueras om manuellt till en annan värdserver. Den här åtgärden kan utlösas med hjälp av omdistributionsalternativet på informationssidan för den virtuella datorn eller genom att stoppa och starta om den virtuella datorn i Azure Portal.

Automatisk återställning

Om värdservern inte kan startas om av någon anledning initierar Azure-plattformen en automatisk återställningsåtgärd för att ta bort den felaktiga värdservern från rotationen för ytterligare undersökning.

Alla virtuella datorer på den värden flyttas automatiskt till en annan, felfri värdserver. Även om den här processen vanligtvis slutförs inom 15 minuter kan den tid som krävs för återställning variera beroende på flera faktorer, inklusive storleken på värdminnet och de återställningsmetoder som används. Mer information om processen för automatisk återställning finns i Automatisk återställning av virtuella datorer.

Oplanerat underhåll

I sällsynta fall kan Azure-driftteamet behöva utföra underhållsaktiviteter för att säkerställa azure-plattformens övergripande hälsa. Det här beteendet kan påverka tillgängligheten för virtuella datorer och resulterar vanligtvis i samma automatiska återställningsåtgärd som beskrevs tidigare.

Oplanerat underhåll omfattar följande:

  • Brådskande noddefragmentering
  • Brådskande uppdateringar av nätverksväxel

Vm-krascher

Virtuella datorer kan startas om på grund av problem i själva den virtuella datorn. Arbetsbelastningen eller rollen som körs på den virtuella datorn kan utlösa en felkontroll i gästoperativsystemet. Om du vill ha hjälp med att fastställa orsaken till kraschen kan du visa system- och programloggarna för virtuella Windows-datorer och serieloggarna för virtuella Linux-datorer.

Virtuella datorer i Azure förlitar sig på virtuella diskar för operativsystem och datalagring som finns i Azure Storage-infrastrukturen. När tillgängligheten eller anslutningen mellan den virtuella datorn och de associerade virtuella diskarna påverkas i mer än 120 sekunder, utför Azure-plattformen en tvingad avstängning av de virtuella datorerna för att undvika skadade data. De virtuella datorerna aktiveras automatiskt igen när lagringsanslutningen har återställts. Avstängningens varaktighet kan vara så kort som fem minuter men kan vara betydligt längre.

Andra incidenter

I sällsynta fall kan ett utbrett problem påverka flera servrar i ett Azure-datacenter. Om det här problemet uppstår skickar Azure-teamet e-postaviseringar till de berörda prenumerationerna. Du kan kontrollera Azure Service Health-instrumentpanelen och Azure Portal för status för pågående avbrott och tidigare incidenter.

Diagnostisera omstarter av virtuella datorer

Du kan använda bladet Diagnostisera och lösa på vm-bladet för att köra ytterligare diagnostik. Detta kan avslöja mer specifika orsaker till den senaste omstarten av den virtuella datorn. Om det finns problem med gästoperativsystemet samlar du in minnesdump och kontaktar supporten.

Kontakta oss för att få hjälp

Om du har frågor eller behöver hjälp skapar du en supportförfrågan eller frågar Azure community support. Du kan också skicka produktfeedback till Azure-feedbackcommunityn.