Informationen zum Systemneustart für virtuelle Azure-Computer

Artikel
07/30/2024

Gilt für: ✔️ Linux-VMs ✔️ Windows-VMs

Virtuelle Azure-Computer (VMs) werden unter Umständen manchmal ohne erkennbaren Grund neu gestartet, ohne dass ein Nachweis dafür vorliegt, dass der Neustartvorgang von Ihnen initiiert wurde. In diesem Artikel sind die Aktionen und Ereignisse aufgeführt, die dazu führen können, dass virtuelle Computer neu gestartet werden. Außerdem erfahren Sie, wie Sie unerwartete Neustartprobleme vermeiden oder die Auswirkungen dieser Probleme reduzieren können.

Konfigurieren von virtuellen Computern für Hochverfügbarkeit

Die beste Möglichkeit zum Schützen einer in Azure ausgeführten Anwendung vor Neustarts von virtuellen Computern und damit Ausfallzeiten besteht in der Konfiguration der virtuellen Computer für Hochverfügbarkeit.

Um eine solche Redundanzebene für Ihre Anwendung zu gewährleisten, empfehlen wir die Gruppierung von zwei oder mehr virtuellen Computern in einer Verfügbarkeitsgruppe. Durch diese Konfiguration wird sichergestellt, dass während eines geplanten oder ungeplanten Wartungsereignisses mindestens ein virtueller Computer verfügbar ist und die von der Azure-SLA zugesicherte Verfügbarkeit von 99,95 Prozent eingehalten wird.

Weitere Informationen zu Verfügbarkeitsgruppen finden Sie unter Verwalten der Verfügbarkeit von VMs.

Informationen zu Resource Health

Azure Resource Health ist ein Dienst, der die Integrität von einzelnen Azure-Ressourcen offenlegt und wertvolle Hinweise zur Behandlung von Problemen bietet. In einer Cloudumgebung, in der es nicht möglich ist, direkt auf Server oder Infrastrukturelemente zuzugreifen, besteht das Ziel der Ressourcenintegrität darin, den Zeitaufwand für die Problembehandlung zu verringern. Das vorrangigste Ziel ist die Reduzierung der Zeit, die Sie mit der Bestimmung verbringen, ob die Hauptursache des Problems die Anwendung oder ein Ereignis auf der Azure-Plattform ist. Weitere Informationen finden Sie unter Grundlegendes zu Resource Health.

Wenn Azure weitere Informationen über die Ursache einer plattforminitiierte Nichtverfügbarkeit für einen virtuellen Computer hat, können diese Informationen bis zu 72 Stunden nach der anfänglichen Nichtverfügbarkeit bereitgestellt werden.

Fehlende VM-Ausfallzeiten im Aktivitätsprotokoll

Ressourcenintegritätswarnungen werden basierend auf den Aktivitätsprotokollinformationen gesendet. In einigen Fällen werden VM-Ausfallzeiten möglicherweise nicht im Aktivitätsprotokoll angezeigt. Wenn die Ausfallzeit im Aktivitätsprotokoll nicht angezeigt wird, werden Warnungen über den Ressourcenstatus für die Ausfallzeiten nicht gesendet. Die Ausfallzeiten sind weiterhin in der Ressourcenintegrität sichtbar.

Dies sind die Fälle, in denen VM-Ausfallzeiten nicht im Aktivitätsprotokoll angezeigt werden:

Wenn ein virtueller Computer erstellt oder zu einem neuen Host migriert wird, zeigt die Azure-Plattform den VM-Zustand nicht ordnungsgemäß an, und der Zustand ändert sich in "Unbekannt". Erst nachdem alle Netzwerkkonnektivitäts- und Knotenprozesse eingerichtet wurden, ändert sich der VM-Zustand in "Verfügbar". Der längere Zeitraum des Unbekannten Zustands wird aus dem Aktivitätsprotokoll herausgefiltert.
Wenn sich der Status der VM-Verfügbarkeit von "Verfügbar" in "Nicht verfügbar" ändert und dann innerhalb von 35 Sekunden zurück zu "Verfügbar" wechselt, wird die Ausfallzeit im Aktivitätsprotokoll nicht angezeigt. Dieser Fall tritt nicht auf, wenn innerhalb von 15 Minuten vor dem Auftreten des ersten Übergangs eine korrelierte Ausfallzeit gesendet wird.
Wenn sich die VM-Integrität von einem Zustand in "Unbekannt" ändert und dann wieder zum ursprünglichen Zustand zurückkehrt, werden der zeitweise unbekannte Zustand und verwandte Übergänge aus dem Aktivitätsprotokoll herausgefiltert.

Die VM-Ausfallzeiten, die nicht im Aktivitätsprotokoll angezeigt werden, werden auf der Azure-Plattformseite gefiltert, um vorübergehende Fehler daran zu hindern, fehlerhafte Ausfallzeiten für Kunden anzuzeigen. Bei laufenden Investitionen in die Integrität der VM sind die Filter möglicherweise nicht mehr erforderlich und können zu schnellen Änderungen der VM-Integrität führen, um nicht gemeldet zu bleiben. Microsoft arbeitet an einem Phase-Out-Plan, um die beste Kundenerfahrung zu erzielen.

Aktionen und Ereignisse, die zu einem Neustart virtueller Computer führen können

Geplante Wartung

Microsoft Azure führt regelmäßig weltweit Updates aus, um die Zuverlässigkeit, Leistung und Sicherheit der Hostinfrastruktur zu verbessern, die virtuellen Computern zugrunde liegt. Viele dieser Updates, einschließlich speichererhaltender Updates, werden ohne Beeinträchtigung Ihrer virtuellen Computer oder Clouddienste ausgeführt.

Allerdings erfordern einige Updates einen Neustart. In diesen Fällen werden die VMs heruntergefahren, während wir die Infrastruktur aktualisieren, und anschließend neu gestartet.

Grundlagen zur geplanten Wartung in Azure – was sie ist und wie sie sich auf die Verfügbarkeit Ihrer virtuellen Linux-Computer auswirken kann – finden Sie in den hier aufgeführten Artikeln. Die Artikel bieten Hintergrundinformationen zu den Prozessen bei der geplanten Wartung in Azure und zum Erstellen eines Zeitplans für die geplante Wartung, um die Auswirkungen weiter zu verringern.

Speichererhaltende Updates

Für diese Klasse von Updates in Microsoft Azure kommt es für Benutzer nicht zu Auswirkungen auf ihre ausgeführten VMs. Viele dieser Updates betreffen Komponenten oder Dienste, die ohne Beeinträchtigung der ausgeführten Instanz aktualisiert werden können. Bei einigen handelt es sich um Plattforminfrastrukturupdates für das Hostbetriebssystem, die ohne Neustart der virtuellen Computer angewendet werden können.

Diese speichererhaltenden Updates werden mit Techniken durchgeführt, die eine direkte Livemigration ermöglichen. Bei der Aktualisierung wird die VM in den Zustand Angehalten versetzt. In diesem Zustand wird der Speicherinhalt im RAM beibehalten, während das zugrunde liegende Hostbetriebssystem die erforderlichen Updates und Patches erhält. Der virtuelle Computer wird in der Regel innerhalb von 30 Sekunden fortgesetzt, bis er angehalten wird. Nachdem der Betrieb des virtuellen Computers fortgesetzt wird, wird seine Uhr automatisch synchronisiert.

Aufgrund des kurzen Pausenzeitraums werden die Auswirkungen auf die virtuellen Computer durch die Bereitstellung von Updates über diesen Mechanismus stark reduziert. Aber nicht alle Updates können auf diese Weise bereitgestellt werden.

Updates für mehrere Instanzen (VMs in einer Verfügbarkeitsgruppe) werden nacheinander auf die einzelnen Updatedomänen angewendet.

Notiz

Linux-Computer mit alten Kernelversionen werden während dieser Updatemethode durch eine Kernel Panic beeinträchtigt. Um dieses Problem zu vermeiden, aktualisieren Sie den Kernel auf die Version 3.10.0 - 327.10.1 oder höher. Weitere Informationen finden Sie unter An Azure Linux VM on a 3.10-based kernel panics after a host node upgrade (Kernel Panic auf einer Azure-VM unter Linux mit Kernelversion 3.10 nach einem Upgrade des Hostknotens).

Vom Benutzer eingeleitete Aktionen zum Neustarten oder Herunterfahren

Wenn Sie einen Neustart über das Azure-Portal, Azure PowerShell, die Befehlszeilenschnittstelle oder die REST-API durchführen, finden Sie das zugehörige Ereignis im Azure-Aktivitätsprotokoll.

Falls Sie die Aktion über das Betriebssystem des virtuellen Computers durchführen, finden Sie das Ereignis in den Systemprotokollen.

Zu weiteren Szenarien, in denen in der Regel der virtuelle Computer neu gestartet wird, gehören verschiedene Änderungen an der Konfiguration. Meist werden Sie in einer Warnmeldung darüber informiert, dass die Ausführung einer bestimmten Aktion zu einem Neustart des virtuellen Computers führt. Beispiele sind Änderungen an der Größe virtueller Computer, das Ändern des Kennworts für das Administratorkonto und das Festlegen einer statischen IP-Adresse.

Microsoft Defender für Cloud und Windows Update

Microsoft Defender für Cloud überwacht tägliche Windows- und Linux-VMs auf fehlende Betriebssystemupdates. Defender für Cloud ruft eine Liste der verfügbaren Sicherheits- und kritischen Updates von Windows Update oder Windows Server Update Services (WSUS) ab, je nachdem, welcher Dienst auf einer Windows-VM konfiguriert ist. Defender für Cloud sucht auch nach den neuesten Updates für Linux-Systeme. Wenn Auf Ihrem virtuellen Computer ein Systemupdate fehlt, empfiehlt Defender für Cloud, Systemupdates anzuwenden. Die Anwendung dieser Systemupdates wird über Defender for Cloud im Azure-Portal gesteuert. Nachdem Sie einige Updates angewendet haben, sind unter Umständen Neustarts der virtuellen Computer erforderlich. Weitere Informationen finden Sie unter Anwenden von Systemupdates in Microsoft Defender für Cloud.

Wie bei lokalen Servern überträgt Azure Updates von Windows Update nicht per Push auf virtuelle Windows-Computer, da diese Computer durch ihre Benutzer verwaltet werden sollen. Es empfiehlt sich jedoch, die Einstellung für automatische Windows-Updates aktiviert zu lassen. Die automatische Installation von Updates über Windows Update kann auch dazu führen, dass Neustarts durchgeführt werden, nachdem die Updates angewendet wurden. Weitere Informationen finden Sie unter Windows Update: FAQ.

Andere Situationen mit Einfluss auf die Verfügbarkeit von virtuellen Computern

Es gibt andere Fälle, in denen Azure die Verwendung eines virtuellen Computers aktiv anhalten kann. Sie erhalten E-Mail-Benachrichtigungen, bevor eine solche Aktion durchgeführt wird, damit Sie die zugrunde liegenden Probleme lösen können. Beispiele für Probleme, die sich auf die Verfügbarkeit von virtuellen Computern auswirken, sind Sicherheitsverstöße und der Ablauf von Zahlungsmethoden.

Hostserverfehler

Der virtuelle Computer wird auf einem physischen Server gehostet, der in einem Azure-Rechenzentrum ausgeführt wird. Der physische Server wird als Agent ausgeführt, der als Host-Agent bezeichnet und zusätzlich zu einigen anderen Azure-Komponenten ausgeführt wird. Wenn diese Azure-Softwarekomponenten auf dem physischen Server nicht mehr reagieren, löst das Überwachungssystem einen Neustart des Hostservers aus, um eine Wiederherstellung zu versuchen. In vielen Fällen wird der virtuelle Computer innerhalb von 10 bis 15 Minuten wieder verfügbar sein und weiterhin auf demselben Host wie zuvor leben.

Serverfehler werden normalerweise durch einen Hardwarefehler, z.B. den Ausfall einer Festplatte oder eines Solid State Drives, verursacht. Azure überwacht fortlaufend diese Vorkommen, identifiziert die zugrunde liegenden Fehler und führt Updates durch, nachdem die Fehlerbehebung implementiert und getestet wurde.

Da einige Hostserverfehler spezifisch für den jeweiligen Server sein können, kann bei wiederholten Neustarts des virtuellen Computers eine manuelle neue Bereitstellung des virtuellen Computers auf einem anderen Hostserver die Situation verbessern. Dieser Vorgang kann mithilfe der Option Erneut bereitstellen auf der Detailseite des virtuellen Computers oder durch Anhalten und Neustarten des virtuellen Computers im Azure-Portal ausgelöst werden.

Automatische Wiederherstellung

Für den Fall, dass der Hostserver aus bestimmten Gründen nicht neu gestartet werden kann, initiiert die Azure-Plattform eine automatische Wiederherstellungsaktion, um den fehlerhaften Hostserver aus der Rotation zu entfernen und genauer zu untersuchen.

Alle virtuellen Computer auf diesem Host werden automatisch auf einen anderen, fehlerfreien Hostserver verschoben. Obwohl dieser Prozess in der Regel innerhalb von 15 Minuten abgeschlossen ist, kann die für die Wiederherstellung benötigte Zeit von mehreren Faktoren abhängen, darunter die Größe des Hostspeichers und die verwendeten Wiederherstellungsmethoden. Weitere Informationen zum Prozess der automatischen Wiederherstellung finden Sie unter Auto-recovery of Virtual Machines (Automatische Wiederherstellung von virtuellen Computern).

Ungeplante Wartung

In seltenen Fällen muss das Azure-Betriebsteam Wartungsaktivitäten durchführen, um die allgemeine Integrität der Azure-Plattform sicherzustellen. Dieses Verhalten wirkt sich unter Umständen auf die VM-Verfügbarkeit aus. Das Ergebnis ist in der Regel die oben beschriebene automatische Wiederherstellungsaktion.

Zur nicht geplanten Wartung gehört Folgendes:

Dringende Knotendefragmentierungen
Dringende Updates für Netzwerkswitches

VM-Abstürze

Virtuelle Computer werden unter Umständen neu gestartet, falls Probleme in den virtuellen Computern selbst vorliegen. Die Workload oder Rolle, die auf dem virtuellen Computer ausgeführt wird, kann ggf. eine Fehlerüberprüfung innerhalb des Gastbetriebssystems auslösen. Hilfe beim Ermitteln der Ursache für den Absturz finden Sie bei virtuellen Windows-Computern in den System- und Anwendungsprotokollen und bei virtuellen Linux-Computern in den seriellen Protokollen.

Virtuelle Computer in Azure basieren auf virtuellen Datenträgern für das Betriebssystem und die Speicherung von Daten, die in der Azure Storage-Infrastruktur gehostet werden. Wenn Probleme mit der Verfügbarkeit oder Konnektivität zwischen dem virtuellen Computer und den zugehörigen virtuellen Datenträgern auftreten, die länger als 120 Sekunden anhalten, erzwingt die Azure-Plattform das Herunterfahren des virtuellen Computers, um Datenbeschädigungen zu vermeiden. Die virtuellen Computer werden automatisch wieder eingeschaltet, nachdem die Speicherkonnektivität wiederhergestellt wurde. Das Herunterfahren kann lediglich fünf Minuten dauern, aber auch deutlich länger.

Sonstige Vorfälle

In seltenen Fällen kann sich ein großflächig auftretendes Problem auf mehrere Server in einem Azure-Datencenter auswirken. In diesem Fall sendet das Azure-Team E-Mail-Benachrichtigungen an die betroffenen Abonnements. Im Dashboard zur Azure-Dienstintegrität und im Azure-Portal finden Sie Informationen zum Status aktueller Ausfälle und von Vorfällen in der Vergangenheit.

Diagnose von VM-Neustarts

Sie können das Blatt "Diagnose" und "Solve" auf dem Blatt "VM" verwenden, um zusätzliche Diagnosen auszuführen. Dies kann spezifischere Gründe für den letzten NEUSTART des virtuellen Computers ermitteln. Wenn es ein Problem mit dem Gastbetriebssystem gibt, erstellen Sie bitte einen Speicherauszug und kontaktieren Sie den Support.

Kontaktieren Sie uns für Hilfe

Wenn Sie Fragen haben oder Hilfe mit Ihren Azure-Gutschriften benötigen, dann erstellen Sie beim Azure-Support eine Support-Anforderung oder fragen Sie den Azure Community-Support. Sie können auch Produktfeedback an die Azure Feedback Community senden.

Freigeben über

Informationen zum Systemneustart für virtuelle Azure-Computer

Konfigurieren von virtuellen Computern für Hochverfügbarkeit

Informationen zu Resource Health

Fehlende VM-Ausfallzeiten im Aktivitätsprotokoll

Aktionen und Ereignisse, die zu einem Neustart virtueller Computer führen können

Geplante Wartung

Speichererhaltende Updates

Vom Benutzer eingeleitete Aktionen zum Neustarten oder Herunterfahren

Microsoft Defender für Cloud und Windows Update

Andere Situationen mit Einfluss auf die Verfügbarkeit von virtuellen Computern

Hostserverfehler

Automatische Wiederherstellung

Ungeplante Wartung

VM-Abstürze

Sonstige Vorfälle

Diagnose von VM-Neustarts

Kontaktieren Sie uns für Hilfe

Feedback

Zusätzliche Ressourcen

Freigeben über

Informationen zum Systemneustart für virtuelle Azure-Computer

Konfigurieren von virtuellen Computern für Hochverfügbarkeit

Informationen zu Resource Health

Fehlende VM-Ausfallzeiten im Aktivitätsprotokoll

Aktionen und Ereignisse, die zu einem Neustart virtueller Computer führen können

Geplante Wartung

Speichererhaltende Updates

Vom Benutzer eingeleitete Aktionen zum Neustarten oder Herunterfahren

Microsoft Defender für Cloud und Windows Update

Andere Situationen mit Einfluss auf die Verfügbarkeit von virtuellen Computern

Hostserverfehler

Automatische Wiederherstellung

Ungeplante Wartung

VM-Abstürze

Vom Speicher erzwungenes Herunterfahren

Sonstige Vorfälle

Diagnose von VM-Neustarts

Kontaktieren Sie uns für Hilfe

Feedback

Zusätzliche Ressourcen