Zuverlässigkeit in Virtual Machines
Dieser Artikel enthält ausführliche Informationen zur regionalen Resilienz für VM mit Verfügbarkeitszonen und regionsübergreifender Notfallwiederherstellung und Geschäftskontinuität.
Unterstützung für Verfügbarkeitszonen
Azure-Verfügbarkeitszonen sind mindestens drei physisch getrennte Gruppen von Rechenzentren innerhalb jeder Azure-Region. Die Rechenzentren innerhalb jeder Zone sind mit unabhängiger Stromversorgung, Kühlung und Netzwerkinfrastruktur ausgestattet. Bei einem Fehler in der lokalen Zone sind Verfügbarkeitszonen so konzipiert, dass regionale Dienste, Kapazität und Hochverfügbarkeit von den verbleibenden beiden Zonen unterstützt werden, wenn eine Zone betroffen ist.
Ausfälle können von Software- und Hardwareausfällen bis hin zu Ereignissen wie Erdbeben, Überflutungen und Bränden reichen. Fehlertoleranz wird durch Redundanz und logische Isolierung von Azure-Diensten erreicht. Ausführlichere Informationen zu Verfügbarkeitszonen in Azure finden Sie unter Regionen und Verfügbarkeitszonen.
Azure-Dienste mit Unterstützung von Verfügbarkeitszonen bieten das richtige Maß an Zuverlässigkeit und Flexibilität. Für die Konfiguration gibt es zwei Möglichkeiten. Sie können entweder zonenredundant mit automatischer zonenübergreifender Replikation oder zonenbasiert mit Instanzen sein, die an eine bestimmte Zone angeheftet werden. Sie können diese Ansätze auch kombinieren. Weitere Informationen zur zonalen im Vergleich zur zonenredundanten Architektur finden Sie unter Empfehlungen für die Verwendung von Verfügbarkeitszonen und Regionen.
VMs unterstützen Verfügbarkeitszonen mit drei Verfügbarkeitszonen pro unterstützter Azure-Region und sind außerdem zonenredundant und zonal. Weitere Informationen finden Sie unter Unterstützung für Verfügbarkeitszonen. Die Kund*innen sind für die Konfiguration und Migration ihrer VMs zur Gewährleistung der Verfügbarkeit verantwortlich.
Weitere Informationen zu den Optionen für Verfügbarkeitszonen finden Sie hier:
- Siehe Verfügbarkeitsoptionen für VMs
- Lesen Sie Verfügbarkeitszonendienst und Regionsunterstützung
- Migrieren vorhandener VMs in Verfügbarkeitszonen
Voraussetzungen
Ihre VM-SKUs müssen in allen Zonen Ihrer Region verfügbar sein. Informationen dazu, welche Regionen Verfügbarkeitszonen unterstützen, finden Sie in der Liste der unterstützten Regionen.
Ihre VM-SKUs müssen in allen Zonen Ihrer Region verfügbar sein. Um die Verfügbarkeit von VM-SKU zu überprüfen, verwenden Sie eine der folgenden Methoden:
- Verwenden Sie PowerShell, um die Verfügbarkeit von VM-SKU zu überprüfen.
- Verwenden Sie die Azure CLI, um die Verfügbarkeit von VM-SKU zu überprüfen.
- Gehen Sie zu Grundlegende Dienste.
SLA-Verbesserungen
Da Verfügbarkeitszonen physisch getrennt sind und unterschiedliche Stromquellen, Netzwerke und Kühlung bieten, erhöhen sich SLAs (Service-Level Agreements, Vereinbarungen zum Servicelevel). Weitere Informationen finden Sie unter SLA für Virtual Machines.
Erstellen einer Ressource mit aktivierten Verfügbarkeitszonen
Beginnen Sie mit dem Erstellen eines virtuellen Computers (VM) mit aktivierter Verfügbarkeitszone aus den folgenden Bereitstellungsoptionen:
Unterstützung für zonales Failover
Sie können VMs für ein Failover in eine andere Zone mithilfe des Site Recovery-Diensts einrichten. Weitere Informationen finden Sie unter Site Recovery.
Fehlertoleranz
Für VMs kann ein Failover auf einen anderen Server in einem Cluster ausgeführt werden, wobei das Betriebssystem der VM auf dem neuen Server neu gestartet wird. Sie sollten den Failoverprozess für die Notfallwiederherstellung heranziehen, VMs in der Wiederherstellungsplanung einbeziehen und Notfallwiederherstellungsübungen durchführen, um sicherzustellen, dass ihre Fehlertoleranzlösung erfolgreich ist.
Weitere Informationen finden Sie unter Prozesse für die Sitewiederherstellung.
Zonenausfall
Während eines zonenweiten Ausfalls sollten Sie mit einer kurzen Leistungsverschlechterung rechnen, bis der Dienst zur Selbstreparatur der VM die zugrunde liegende Kapazität wieder ausgleicht, um sich an fehlerfreie Zonen anzupassen. Die Selbstreparatur ist nicht von der Zonenwiederherstellung abhängig. Es wird erwartet, dass der Selbstreparaturstatus des von Microsoft verwalteten Diensts eine ausgefallene Zone mittels Kapazitäten aus anderen Zonen kompensiert.
Sie sollten sich auch darauf vorbereiten, dass es zu einem Ausfall einer ganzen Region kommen kann. Falls es zu einer Dienstunterbrechung einer gesamten Region kommt, wären die lokal redundanten Kopien Ihrer Daten vorübergehend nicht verfügbar. Wenn die Georeplikation aktiviert ist, sind drei weitere Kopien Ihrer Azure Storage-Blobs und -Tabellen in einer anderen Region gespeichert. Sollte eine gesamte Region ausfallen oder die primäre Region aufgrund einer Katastrophe nicht wiederherstellbar sein, ordnet Azure alle DNS-Einträge der georeplizierten Region neu zu.
Vorbereitung auf einen und Wiederherstellung nach einem Zonenausfall
Die folgenden Hinweise gelten für Azure-VMs im Fall einer Dienstunterbrechung in der gesamten Region, in der Ihre Azure-VM-Anwendung bereitgestellt ist:
- Konfigurieren von Azure Site Recovery für Ihre VMs
- Überprüfen des Status des Azure Service Health-Dashboards, wenn Azure Site Recovery nicht konfiguriert wurde
- Überprüfen der Funktionsweise des Azure Backup-Diensts für VMs
- Weitere Informationen finden Sie in der Unterstützungsmatrix für Azure-VM-Sicherungen
- Bestimmen, welche VM-Wiederherstellungsoption und welches Szenario für Ihre Umgebung am besten geeignet ist
Latenzarmer Entwurf
Regionsübergreifend (sekundäre Region), Abonnementübergreifend (Vorschau) und Zonenübergreifend (Vorschau) sind verfügbare Optionen, die beim Entwerfen einer latenzarmen VM-Lösung berücksichtigt werden sollten. Weitere Informationen zu diesen Optionen finden Sie unter den unterstützten Wiederherstellungsmethoden.
Wichtig
Wenn Sie sich gegen eine zonenspezifische Bereitstellung entscheiden, verzichten Sie auf den Schutz vor der Isolierung der zugrunde liegenden Fehler. Die Verwendung von SKUs, die keine Verfügbarkeitszonen unterstützen, oder der Verzicht auf die Konfiguration von Verfügbarkeitszonen, erzwingt die Abhängigkeit von Ressourcen, die nicht der Zonenplatzierung und Zonentrennung folgen (einschließlich der zugrunde liegenden Abhängigkeiten dieser Ressourcen). Von diesen Ressourcen sollte nicht erwartet werden, dass sie Zonenausfallszenarien überstehen. Lösungen, die solche Ressourcen nutzen, sollten eine Notfallwiederherstellungsstrategie definieren und eine Wiederherstellung der Lösung in einer anderen Region konfigurieren.
Sichere Bereitstellungsverfahren
Wenn Sie sich für eine Isolation mit Verfügbarkeitszonen entscheiden, sollten Sie sichere Bereitstellungstechniken für Anwendungscode und Anwendungsupgrades nutzen. Implementieren Sie zusätzlich zum Konfigurieren von Azure Site Recovery eine der folgenden sicheren Bereitstellungstechniken für VMs:
Da Microsoft in regelmäßigen Abständen geplante Wartungsupdates durchführt, kann es in seltenen Fällen vorkommen, dass diese Updates einen Neustart Ihrer VM erfordern, um die erforderlichen Updates auf die zugrunde liegende Infrastruktur anzuwenden. Weitere Informationen finden Sie unter Überlegungen zur Verfügbarkeit während einer geplanten Wartung.
Bevor Sie die nächste Gruppe von Knoten in einer anderen Zone aktualisieren, sollten Sie die folgenden Aufgaben ausführen:
- Überprüfen des Azure Service Health-Dashboards auf den Dienststatus der VM für Ihre erwarteten Regionen
- Sicherstellen, dass die Replikation für Ihre VMs aktiviert ist
Unterstützung für das Migrieren zu Verfügbarkeitszonen
Informationen zum Migrieren einer VM zur Unterstützung von Verfügbarkeitszonen finden Sie unter Migrieren von VMs und VMSS zur Unterstützung von Verfügbarkeitszonen.
- Verschieben eines virtuellen Computers in ein anderes Abonnement oder eine andere Ressourcengruppe
- Azure Resource Mover
- Verschieben von Azure-VMs in Verfügbarkeitszonen
- Verschieben von Ressourcen für die Konfiguration der Regionswartung
Regionsübergreifende Notfallwiederherstellung und Geschäftskontinuität
Bei der Notfallwiederherstellung (DR) geht es um die Wiederherstellung nach Ereignissen mit schwerwiegenden Auswirkungen, z. B. Naturkatastrophen oder fehlerhaften Bereitstellungen, die zu Downtime und Datenverlust führen. Unabhängig von der Ursache ist das beste Mittel gegen einen Notfall ein gut definierter und getesteter Notfallplan und ein Anwendungsdesign, die Notfallwiederherstellung aktiv unterstützt. Bevor Sie mit der Erstellung Ihres Notfallwiederherstellungsplans beginnen, lesen Sie die Empfehlungen zum Entwerfen einer Notfallwiederherstellungsstrategie.
Bei DR verwendet Microsoft das Modell der gemeinsamen Verantwortung. In einem Modell der gemeinsamen Verantwortung stellt Microsoft sicher, dass die grundlegenden Infrastruktur- und Plattformdienste verfügbar sind. Gleichzeitig replizieren viele Azure-Dienste nicht automatisch Daten oder greifen automatisch auf eine ausgefallene Region zurück, um eine regionsübergreifende Replikation in eine andere aktivierte Region durchzuführen. Für diese Dienste sind Sie dafür verantwortlich, einen Notfallwiederherstellungsplan zu erstellen, der für Ihre Workload geeignet ist. Die meisten Dienste, die auf Azure Platform as a Service (PaaS)-Angeboten laufen, bieten Funktionen und Anleitungen zur Unterstützung von Notfallwiederherstellung und Sie können dienstspezifische Funktionen zur Unterstützung einer schnellen Wiederherstellung nutzen, um Ihren Notfallwiederherstellungsplan zu entwickeln.
Sie können die regionsübergreifende Wiederherstellung verwenden, um Azure-VMs über gekoppelte Regionen wiederherzustellen. Wenn die Sicherung in der sekundären Region durchgeführt wird, können Sie mit der regionsübergreifenden Wiederherstellung alle Azure-VMs für den ausgewählten Wiederherstellungspunkt wiederherstellen. Weitere Informationen zur regionsübergreifenden Wiederherstellung finden Sie im Tabellenzeileneintrag „Regionsübergreifend“ in unseren Wiederherstellungsoptionen.
Notfallwiederherstellung für mehrere Regionen
Im Falle einer regionsweiten Dienstunterbrechung arbeitet Microsoft mit Hochdruck an der Wiederherstellung des VM-Diensts. Sie müssen dennoch auf andere anwendungsspezifische Sicherungsstrategien zurückgreifen, um eine möglichst hohe Verfügbarkeit zu erreichen. Weitere Informationen finden Sie im Abschnitt zu Datenstrategien für die Notfallwiederherstellung.
Erkennung, Benachrichtigung und Verwaltung von Ausfällen
Hardware oder physische Infrastruktur für die virtuelle Maschine schlägt möglicherweise unerwartet fehl. Ausfälle des lokalen Netzwerks oder des Datenträgers oder andere Fehler auf Rackebene können zu unerwarteten Ausfällen führen. Bei Erkennung solcher Probleme migriert die Azure-Plattform die VM automatisch zu einem fehlerfreien physischen Computer im selben Rechenzentrum. Dieser Vorgang ist mit einer gewissen Ausfallzeit (Neustart) und in manchen Fällen mit dem Verlust des temporären Laufwerks verbunden. Die angefügten (Betriebssystem-)Datenträger bleiben in jedem Fall erhalten.
Ausführlichere Informationen zu VM-Dienstunterbrechungen finden Sie unter Leitfaden zur Notfallwiederherstellung.
Einrichten der Notfallwiederherstellung und Ausfallerkennung
Wenn Sie die Notfallwiederherstellung für VMs einrichten, sollten Sie wissen, was Azure Site Recovery bietet. Aktivieren Sie die Notfallwiederherstellung für VMs mit den folgenden Methoden:
- Einrichten der Notfallwiederherstellung in einer sekundären Azure-Region für eine Azure-VM
- Erstellen eines Recovery Services-Tresors
- Aktivieren der Notfallwiederherstellung für Linux-VMs
- Aktivieren der Notfallwiederherstellung für Windows-VMs
- Failover von VMs in eine andere Region
- Failover von VMs in die primäre Region
Notfallwiederherstellung für eine Region
Bei eingerichteter Notfallwiederherstellung werden Azure-VMs fortlaufend in eine andere Zielregion repliziert. Bei einem Ausfall können Sie für die VMs ein Failover zur sekundären Region ausführen und dort darauf zugreifen.
Wenn Sie virtuelle Azure-Computer mit Site Recovery replizieren, werden kontinuierlich alle VM-Datenträger asynchron in der Zielregion repliziert. Die Wiederherstellungspunkte werden regelmäßig im Abstand von wenigen Minuten erstellt, wodurch Sie ein Recovery Point Objective (RPO) im Minutenbereich erhalten. Sie können beliebig viele Notfallwiederherstellungsübungen durchführen, ohne die Produktionsanwendung oder die laufende Replikation zu beeinträchtigen. Weitere Informationen finden Sie unter Durchführen eines Notfallwiederherstellungsverfahrens in Azure.
Weitere Informationen finden Sie unter Architekturkomponenten für Azure VMs und Regionskopplung.
Kapazität und proaktive Resilienz der Notfallwiederherstellung
Microsoft und seine Kunden arbeiten im Rahmen des Modells der gemeinsamen Verantwortung. Das bedeutet, dass bei der kundenseitig aktivierten Notfallwiederherstellung (Dienste im Verantwortungsbereich des Kunden) der Kunde für die Notfallwiederherstellung aller Dienste verantwortlich ist, die kundenseitig bereitgestellt und gesteuert werden. Zur Sicherstellung einer proaktiven Wiederherstellung sollten Kunden Sekundärsysteme immer vorab bereitstellen, da es keine Kapazitätsgarantie zum Zeitpunkt der Beeinträchtigung gibt, wenn keine Vorabzuweisung durchgeführt wurde.
Für die VM-Bereitstellung können Sie den Modus flexible Orchestrierung für VMSS verwenden. Alle VM-Größen können mit dem Modus der flexiblen Orchestrierung verwendet werden. Der Modus „Flexible Orchestrierung“ bietet auch Garantien für Hochverfügbarkeit (für bis zu 1.000 VMs), indem VMs auf Fehlerdomänen in einer Region oder innerhalb einer Verfügbarkeitszone verteilt werden.