Zuverlässigkeit in Azure SQL Managed Instance

Azure SQL Managed Instance ist eine vollständig verwaltete Plattform als Dienstdatenbankmodul (PaaS). Es bietet fast 100% Featurekompatibilität mit SQL Server. Azure SQL Managed Instance behandelt die meisten Datenbankverwaltungsfunktionen wie Upgrades, Patching, Sicherungen und Überwachung ohne Benutzereingriff. Sie wird auf der neuesten stabilen Version des SQL Server-Datenbankmoduls und einem gepatchten Betriebssystem mit integrierter Hochverfügbarkeit ausgeführt.

Wenn Sie Azure verwenden, ist zustellbarkeit eine gemeinsame Verantwortung. Microsoft bietet eine Reihe von Funktionen zur Unterstützung von Resilienz und Wiederherstellung. Sie sind dafür verantwortlich, zu verstehen, wie diese Funktionen in allen von Ihnen verwendeten Diensten funktionieren, und die Funktionen auswählen, die Sie benötigen, um Ihre Geschäftsziele und Uptime-Ziele zu erfüllen.

In diesem Artikel wird beschrieben, wie Sie Azure SQL Managed Instance widerstandsfähig für eine Vielzahl potenzieller Ausfälle und Probleme machen, einschließlich vorübergehender Fehler, Ausfall von Verfügbarkeitszonen und Regionsausfällen. Außerdem wird beschrieben, wie Sie Sicherungen verwenden können, um sich von anderen Arten von Problemen zu erholen, wie die Wartung des Diensts behandelt wird, und hebt einige wichtige Informationen zum Azure SQL Managed Instance Service Level Agreement (SLA) hervor.

Empfehlungen für die Produktionsimplementierung für Zuverlässigkeit

Beachten Sie für die meisten Produktionsbereitstellungen von SQL Managed Instance die folgenden Empfehlungen:

Befolgen Sie die Anleitungen in der Checkliste "Hohe Verfügbarkeit" und "Notfallwiederherstellung".
Aktivieren Sie Zonenredundanz.
Konfigurieren Sie automatisierte Sicherungen, und verwenden Sie zonenredundanten Speicher (ZRS) oder georedundanten Speicher (GRS) für Sicherungen.
Planen Sie, Ihre Sicherungen und Wiederherstellungsprozesse regelmäßig zu testen.

Übersicht über die Zuverlässigkeitsarchitektur

Verwaltete SQL-Instanzen mit allgemeinem Zweck werden auf einem einzelnen Knoten ausgeführt, der Azure Service Fabric verwaltet. Wenn das Datenbankmodul oder das Betriebssystem aktualisiert oder ein Fehler erkannt wird, funktioniert SQL Managed Instance mit Service Fabric, um den zustandslosen Datenbankmodulprozess auf einen anderen zustandslosen Computeknoten zu verschieben, der über ausreichende freie Kapazität verfügt. Datenbankdateien werden in Azure Blob Storage gespeichert, die über integrierte Redundanzfeatures verfügt. Daten- und Protokolldateien werden vom ursprünglichen Computeknoten getrennt und an den neu initialisierten Datenbankmodulprozess angefügt.

Verwaltete Business Critical SQL-Instanzen verwenden mehrere Replikate in einem Cluster. Der Cluster enthält zwei Arten von Replikaten:

Ein einzelnes primäres Replikat , auf das für Kundenarbeitslasten mit Lese-/Schreibzugriff zugegriffen werden kann
Bis zu fünf sekundäre Replikate (Compute und Speicher), die Kopien von Daten enthalten

Das primäre Replikat pusht kontinuierlich und sequenziell Änderungen an die sekundären Replikate, wodurch sichergestellt wird, dass die Daten vor dem Ausführen eines Commits für jede Transaktion auf einer ausreichenden Anzahl von sekundären Replikaten gespeichert werden. Dieser Prozess garantiert, dass ein vollständig synchronisiertes Replikat immer für failover verfügbar ist, wenn das primäre Replikat oder ein lesbares sekundäres Replikat nicht verfügbar ist.

SQL Managed Instance und Service Fabric Failover zwischen Replikaten initiieren. Nachdem ein sekundäres Replikat zum neuen primären Replikat wird, wird ein weiteres sekundäres Replikat erstellt, um sicherzustellen, dass der Cluster über eine ausreichende Anzahl von Replikaten verfügt, um das Quorum beizubehalten. Nach Abschluss des Failovers werden Azure SQL Verbindungen automatisch an das neue primäre Replikat oder das lesbare sekundäre Replikat basierend auf dem Verbindungszeichenfolge umgeleitet.

Redundanz

Standardmäßig erreicht SQL Managed Instance Redundanz, indem Computeknoten und Daten in einem einzigen Rechenzentrum in der primären Region verteilt werden. Dieser Ansatz schützt Ihre Daten während der folgenden erwarteten und unerwarteten Ausfallzeiten:

Vom Kunden initiierte Verwaltungsvorgänge , die zu einer kurzen Ausfallzeit führen
Service-Wartungsvorgänge
Kleine Netzwerk- oder Stromausfälle
Probleme und Rechenzentrumsausfälle, die die folgenden Komponenten umfassen:
- Das Rack, auf dem die Maschinen laufen, die Ihren Dienst unterstützen
- Der physical machine der den virtuellen Computer (VM) hostt, auf dem die SQL-Datenbank-Engine ausgeführt wird.
- Die VM, die die SQL-Datenbank-Engine ausführt
Probleme mit der SQL-Datenbank-Engine
Potenzielle ungeplante lokalisierte Ausfälle

Weitere Informationen dazu, wie SQL Managed Instance Redundanz bereitstellt, finden Sie unter Verfügbarkeit durch lokale und Zonenredundanz.

Resilienz für vorübergehende Fehler

Vorübergehende Fehler sind kurze, zeitweilige Fehler in Komponenten. Sie treten häufig in einer verteilten Umgebung wie der Cloud auf und sind ein normaler Bestandteil von Vorgängen. Vorübergehende Fehler korrigieren sich nach kurzer Zeit. Es ist wichtig, dass Ihre Anwendungen vorübergehende Fehler behandeln können, in der Regel durch Wiederholen betroffener Anforderungen.

Alle in der Cloud gehosteten Anwendungen sollten den Azure richtlinien für die vorübergehende Fehlerbehandlung befolgen, wenn sie mit allen in der Cloud gehosteten APIs, Datenbanken und anderen Komponenten kommunizieren. Weitere Informationen finden Sie unter Empfehlungen zur Behandlung vorübergehender Fehler.

SQL Managed Instance übernimmt automatisch wichtige Wartungsaufgaben wie Patching, Sicherungen und Windows- und SQL-Datenbank-Engine-Upgrades. Außerdem werden ungeplante Ereignisse wie zugrunde liegende Hardware-, Software- oder Netzwerkfehler behandelt. SQL Managed Instance können auch unter den kritischsten Umständen schnell wiederhergestellt werden, wodurch sichergestellt wird, dass Ihre Daten immer verfügbar sind. Die meisten Benutzer*innen bemerken nicht, dass kontinuierlich Upgrades durchgeführt werden.

Wenn eine Instanz gepatcht wird oder ausfällt, hat die Ausfallzeit nur minimale Auswirkungen, wenn Sie in Ihrer Anwendung eine Wiederholungslogik verwenden. Sie können die Resilienz Ihrer Anwendung auf vorübergehende Fehler testen.

Ausfallsicherheit bei Ausfällen von Verfügbarkeitszonen

Hinweis

Die Zonenredundanz ist derzeit nicht für die Next General Purpose-Dienstebene verfügbar.

Verfügbarkeitszonen sind physisch getrennte Gruppen von Rechenzentren innerhalb einer Azure Region. Wenn eine Zone ausfällt, erfolgt ein Failover der Dienste zu einer der verbleibenden Zonen.

Wenn Sie eine zonenredundante Konfiguration aktivieren, können Sie sicherstellen, dass Ihre verwaltete SQL-Instanz für eine große Anzahl von Fehlern widerstandsfähig ist, einschließlich katastrophaler Datenverluste, ohne Änderungen an der Anwendungslogik.

SQL Managed Instance erreicht Zonenredundanz, indem zustandslose Computeknoten in verschiedenen Verfügbarkeitszonen platziert werden. Es basiert auf statusbasiertem ZRS, das mit dem Knoten verbunden ist, der derzeit den aktiven SQL-Datenbank-Engine-Prozess enthält. Wenn ein Ausfall auftritt, wird der SQL-Datenbank-Engine Prozess auf einem der zustandslosen Computeknoten aktiv, der dann auf die Daten im zustandsbehafteten Speicher zugreift.

SQL Managed Instance erreicht Zonenredundanz, indem Replikate Ihrer SQL managed instance in mehreren Verfügbarkeitszonen platziert werden. Um einen Single Point of Failure auszuschließen, wird der Steuerring auch in mehreren Zonen dupliziert. Der Steuerebenenverkehr wird an einen Lastenausgleichsmodul geleitet, der auch über Verfügbarkeitszonen hinweg bereitgestellt wird. Azure Traffic Manager steuert das Datenverkehrsrouting von der Steuerebene bis zum Lastenausgleich.

Anforderungen

Region support: Zonenredundanz für SQL Managed Instance wird in ausgewählten Regionen unterstützt. Weitere Informationen finden Sie unter Unterstützte Regionen.
Redundanz des Sicherungsspeichers: Um Zonenredundanz für Ihre verwaltete SQL-Instanz zu aktivieren, legen Sie die Sicherungsspeicherredundanz auf ZRS oder geozonenredundanten Speicher (GZRS) fest.

Kosten

Wenn Sie Zonenredundanz aktivieren, gibt es zusätzliche Kosten für Ihre verwaltete SQL-Instanz und für zonenredundante Sicherungen. Weitere Informationen finden Sie unter Preise.

Sie können Geld sparen, indem Sie sich verpflichten, Computeressourcen für einen bestimmten Zeitraum zu einem ermäßigten Satz zu verwenden, einschließlich zonenredundanter Instanzen auf der Business Critical-Dienstebene. Weitere Informationen finden Sie unter Reservations für SQL Managed Instance.

Konfigurieren der Unterstützung von Verfügbarkeitszonen

In diesem Abschnitt wird erläutert, wie Sie die Verfügbarkeitszonenunterstützung für Ihre verwalteten SQL-Instanzen konfigurieren:

Zonenredundanz aktivieren: Informationen zum Konfigurieren der Zonenredundanz für neue und vorhandene Instanzen finden Sie unter Konfigurieren der Zonenredundanz.

Alle Skalierungsvorgänge für SQL Managed Instance, einschließlich der Aktivierung von Zonenredundanz, sind Onlinevorgänge und erfordern minimale bis keine Ausfallzeiten. Weitere Informationen finden Sie unter "Dauer der Verwaltungsvorgänge".
Zonenredundanz deaktivieren: Sie können Zonenredundanz so deaktivieren wie Sie sie aktivieren. Dieser Prozess ist ein Onlinevorgang und ähnelt dem regulären Upgrade des Dienstebenenziels. Am Ende des Prozesses wird die Instanz von zonenredundanter Infrastruktur zu einer Infrastruktur mit einer Zone migriert.

Verhalten, wenn alle Zonen fehlerfrei sind

In diesem Abschnitt wird beschrieben, was Sie erwarten müssen, wenn Ihre verwaltete SQL-Instanz so konfiguriert ist, dass sie zonenredundant ist und alle Verfügbarkeitszonen betriebsbereit sind:

Traffic-Routing zwischen Zonen: Während des Normalbetriebs werden Anforderungen an den Knoten weitergeleitet, der Ihre SQL Managed Instance-Compute-Ebene ausführt.
Datenreplikation zwischen Zonen: Datenbankdateien werden in Azure Storage unter Verwendung von ZRS gespeichert, das an den Knoten angehängt ist, der aktuell den aktiven SQL-Datenbank-Engine-Prozess enthält.

Schreibvorgänge sind synchron und werden erst dann als abgeschlossen betrachtet, wenn die Daten in allen Verfügbarkeitszonen erfolgreich repliziert wurden. Diese synchrone Replikation stellt eine starke Konsistenz und keinen Datenverlust bei Zonenfehlern sicher. Es kann jedoch zu einer geringfügig höheren Schreiblatenz im Vergleich zu lokal redundanten Speicher führen.

Datenverkehrsrouting zwischen Zonen: Während normaler Vorgänge werden Anforderungen an das primäre Replikat Ihrer verwalteten SQL-Instanz weitergeleitet.
Datenreplikation zwischen Zonen: Das primäre Replikat pusht kontinuierlich und sequenziell Änderungen an die sekundären Replikate in verschiedenen Verfügbarkeitszonen. Durch diesen Vorgang wird sichergestellt, dass Daten auf einer ausreichenden Anzahl von sekundären Replikaten beibehalten werden, bevor die einzelnen Transaktionen ausgeführt werden. Diese Replikate befinden sich in verschiedenen Verfügbarkeitszonen. Dieser Prozess garantiert, dass ein vollständig synchronisiertes Replikat immer für Failover verfügbar ist, wenn das primäre Replikat oder ein lesbares sekundäres Replikat aus irgendeinem Grund nicht verfügbar ist.

Da zonenredundante Instanzen Replikate in verschiedenen Rechenzentren mit einem abstand zwischen ihnen haben, kann die erhöhte Netzwerklatenz die Transaktions-Commit-Zeit erhöhen. Diese Erhöhung kann sich auf die Leistung einiger OLTP-Workloads (Online Transaction Processing) auswirken. Die meisten Anwendungen reagieren nicht empfindlich auf diese zusätzliche Latenz.

Verhalten bei einem Zoneausfall

In diesem Abschnitt wird beschrieben, was Sie erwarten müssen, wenn Ihre verwaltete SQL-Instanz so konfiguriert ist, dass sie zonenredundant ist und mindestens eine Verfügbarkeitszone nicht verfügbar ist:

Erkennung und Reaktion: SQL Managed Instance ist für das Erkennen und Reagieren auf einen Fehler in einer Verfügbarkeitszone verantwortlich. Sie müssen keine Maßnahmen ergreifen, um ein Zonenfailover zu initiieren.

Benachrichtigung: Microsoft benachrichtigt Sie nicht automatisch, wenn eine Zone deaktiviert ist. Sie können jedoch Azure Resource Health verwenden, um den Status einer einzelnen Ressource zu überwachen, und Sie können Resource Health Alerts einrichten, um Sie über Probleme zu informieren. Sie können auch Azure Service Health verwenden, um den Gesamtstatus des Diensts zu verstehen, einschließlich aller Zonenfehler, und Sie können Service Health Alerts einrichten, um Sie über Probleme zu informieren.

Aktive Anforderungen: Wenn eine Verfügbarkeitszone nicht verfügbar ist, werden alle Anforderungen, die in der fehlerhaften Verfügbarkeitszone verarbeitet werden, beendet und müssen erneut überprüft werden. Um Ihre Anwendungen widerstandsfähig gegen diese Arten von Problemen zu gestalten, lesen Sie die Anleitung zu Resilienz für vorübergehende Fehler.

Traffic rerouting: SQL Managed Instance arbeitet mit Service Fabric zusammen, um das Datenbankmodul auf einen geeigneten zustandslosen Computeknoten zu verschieben, der sich in einer anderen Verfügbarkeitszone befindet und über ausreichende freie Kapazität verfügt. Nach Abschluss des Failovers werden neue Verbindungen automatisch an den neuen primären Computeknoten umgeleitet.

Eine hohe Workload kann während des Übergangs von einem Computeknoten zum anderen Computeknoten eine Leistungsbeeinträchtigung erleben, da der neue Datenbankmodulprozess mit einem Cache für kalte Daten beginnt.

Traffic rerouting: SQL Managed Instance arbeitet mit Service Fabric zusammen, um ein geeignetes Replikat in einer anderen Verfügbarkeitszone auszuwählen, um das primäre Replikat zu werden. Nachdem ein sekundäres Replikat zum neuen primären Replikat wird, wird ein weiteres sekundäres Replikat erstellt, um sicherzustellen, dass der Cluster über eine ausreichende Anzahl von Replikaten verfügt, um das Quorum beizubehalten. Nach Abschluss des Failovers werden neue Verbindungen automatisch an das neue primäre Replikat oder das lesbare sekundäre Replikat basierend auf dem Verbindungszeichenfolge umgeleitet.

Erwartete Ausfallzeiten: Während eines Verfügbarkeitszonenfailovers kann es zu einer geringen Ausfallzeit kommen. Die Ausfallzeiten sind in der Regel weniger als 30 Sekunden, die Ihre Anwendung tolerieren sollte, wenn sie die Richtlinien zur Ausfallsicherheit für vorübergehende Fehler befolgt.
Erwarteter Datenverlust: Es wird kein Datenverlust für committete Transaktionen während eines Verfügbarkeitszonenfailovers erwartet. Noch nicht abgeschlossene Transaktionen müssen erneut versucht werden.

Zonenwiederherstellung

Wenn die Verfügbarkeitszone wiederhergestellt wird, funktioniert SQL Managed Instance mit Service Fabric, um Vorgänge in der wiederhergestellten Zone wiederherzustellen. Es ist kein Eingreifen des Kunden erforderlich.

Test auf Zonenfehler

Die SQL Managed Instance-Plattform verwaltet Datenverkehrsrouting, Failover und Failback für zonenredundante Instanzen. Da dieses Feature vollständig verwaltet ist, müssen Sie die Ausfallprozesse für Verfügbarkeitszonen weder einleiten noch überprüfen. Sie können jedoch die Behandlung von Fehlern ihrer Anwendung überprüfen.

Widerstandsfähigkeit bei regionalen Ausfällen

Eine einzelne SQL Managed Instance wird in einer einzelnen Region bereitgestellt. Sie können jedoch eine sekundäre SQL-verwaltete Instanz in einer separaten Azure Region bereitstellen und eine failover-Gruppe konfigurieren.

Failovergruppen

Failovergruppen replizieren Ihre Daten automatisch georeplizieren und können basierend auf der Failover-Richtlinie automatisch oder manuell auf einen anderen Standort umschalten, wenn ein regionaler Ausfall auftritt.

In diesem Abschnitt werden wichtige Informationen zu Failovergruppen zusammengefasst, aber es ist wichtig, die Übersicht über Failovergruppen und bewährte Methoden zu überprüfen, um mehr darüber zu erfahren, wie sie funktionieren und wie sie konfiguriert werden.

Failoverrichtlinien

Wenn Sie eine Failovergruppe erstellen, wählen Sie die Failoverrichtlinien aus, die angeben, wer für das Erkennen eines Ausfalls und ausführen eines Failovers verantwortlich ist. Sie können zwei Arten von Failoverrichtlinien konfigurieren:

Vom Kunden verwaltetes Failover (empfohlen): Wenn Sie eine vom Kunden verwaltete Failoverrichtlinie verwenden, können Sie entscheiden, ob ein Failover ausgeführt werden soll, das keinen Datenverlust verursacht, oder ein erzwungenes Failover, was zu Datenverlust führen kann. Erzwungenes Failover wird während eines Ausfalls als Methode zur Wiederherstellung verwendet, wenn auf die primäre Instanz nicht zugegriffen werden kann.
Von Microsoft verwaltetes Failover: Von Microsoft verwaltetes Failover wird nur in Ausnahmefällen verwendet, um ein erzwungenes Failover auszulösen.

Von Bedeutung

Verwenden Sie vom Kunden verwaltete Failoveroptionen, um Ihre DR-Pläne zu entwickeln, zu testen und zu implementieren. Verlassen Sie sich nicht auf ein von Microsoft verwaltetes Failover, das nur unter extremen Umständen verwendet werden kann. Ein von Microsoft verwaltetes Failover wird wahrscheinlich für eine gesamte Region initiiert. Es kann nicht für einzelne Failovergruppen, SQL-verwaltete Instanzen, Abonnements oder Kunden initiiert werden. Failover kann zu unterschiedlichen Zeiten für unterschiedliche Azure Dienste auftreten. Es wird empfohlen, das kundenseitig verwaltete Failover zu verwenden.

Anforderungen

Region support: Sie können eine beliebige Azure Region für die sql-verwalteten Instanzen innerhalb der Failovergruppe auswählen. Aufgrund der hohen Latenz von breiten Flächennetzwerken verwendet die Georeplikation einen asynchronen Replikationsmechanismus. Um Netzwerkverzögerungen zu reduzieren, wählen Sie Regionen mit geringer Latenz aus. Weitere Informationen zur Latenz zwischen Azure-Regionen finden Sie unter Roundtrip-Latenzstatistiken des Azure-Netzwerks.

Kosten

Wenn Sie mehrere verwaltete SQL-Instanzen in verschiedenen Regionen erstellen, werden Sie für jede verwaltete SQL-Instanz in Rechnung gestellt.

Wenn Ihre sekundäre Instanz jedoch keine Leseworkloads oder Anwendungen mit ihr verbunden hat, können Sie Lizenzkosten sparen, indem Sie das Replikat als Standbyinstanz entwerfen. Weitere Informationen finden Sie unter Konfigurieren Sie eine lizenzfreie Standby-Replik für SQL Managed Instance.

Weitere Informationen zu SQL Managed Instance Preisen finden Sie unter Service-Preisinformationen.

Konfigurieren der Unterstützung für mehrere Regionen

Informationen zum Konfigurieren einer Failovergruppe finden Sie unter Configure a failover group for SQL Managed Instance.

Kapazitätsplanung und -verwaltung

Während eines Failovers wird der Datenverkehr an eine sekundäre verwaltete SQL-Instanz umgeleitet. Es ist wichtig, dass Ihre sekundäre verwaltete SQL-Instanz bereit für den Empfang von Datenverkehr ist. Erstellen Sie eine sekundäre verwaltete SQL-Instanz mit derselben Dienstebene, Hardwaregenerierung und Computegröße wie die primäre Instanz.

Weitere Informationen zum Skalieren verwalteter SQL-Instanzen in einer Failovergruppe finden Sie unter Skalierungsinstanzen.

Verhalten, wenn alle Regionen funktionsfähig sind

In diesem Abschnitt wird beschrieben, was Sie erwarten müssen, wenn von SQL verwaltete Instanzen für die Verwendung von Failovergruppen mit mehreren Regionen konfiguriert sind und alle Regionen betriebsbereit sind:

Datenverkehrsrouting zwischen Regionen: Während normaler Vorgänge wechseln Lese-/Schreibanforderungen zur einzelnen primären Instanz in der primären Region.

Failovergruppen bieten auch einen separaten schreibgeschützten Listenerendpunkt. Bei normalen Vorgängen stellt dieser Endpunkt eine Verbindung mit der sekundären Instanz bereit, um schreibgeschützten Datenverkehr weiterzuleiten, der in der Verbindungszeichenfolge angegeben ist.

Weitere Informationen dazu, wie Failovergruppen Datenverkehr an jede Instanz senden und wie Sie den Datenverkehr zu einem schreibgeschützten Listenerendpunkt leiten können, finden Sie in der Übersicht über Failovergruppen und bewährte Methoden.
Datenreplikation zwischen Regionen: Standardmäßig werden Daten asynchron von der primären Instanz in die sekundäre verwaltete SQL-Instanz repliziert.

Da die Georeplikation asynchron ist, ist es möglich, dass Datenverlust auftreten kann, wenn Sie ein erzwungenes Failover ausführen. Sie können die Replikationsverzögerung überwachen, um den potenziellen Datenverlust während eines erzwungenen Failovers zu verstehen. Weitere Informationen finden Sie in der DR-Checkliste.

Wenn Sie Datenverluste aus asynchroner Replikation während des Failovers beseitigen müssen, konfigurieren Sie Ihre Anwendung so, dass der aufrufende Thread blockiert wird, bis bestätigt wird, dass die letzte zugesicherte Transaktion im Transaktionsprotokoll der sekundären Datenbank übertragen und gehärtet wurde. Dieser Ansatz erfordert eine benutzerdefinierte Entwicklung und beeinträchtigt die Leistung Ihrer Anwendung. Weitere Informationen finden Sie unter Verhindern des Verlusts kritischer Daten.

Verhalten während eines Regionenausfalls

Erkennung und Reaktion: Die Verantwortung für die Erkennung und Reaktion hängt von der Failoverrichtlinie ab, die Ihre Failovergruppe verwendet.
- Kundenseitig verwaltete Failoverrichtlinie: Sie sind dafür verantwortlich, den Fehler in einer Region zu erkennen und ein Failover auszulösen oder ein Failover auf die sekundäre Instanz in der Failovergruppe auszulösen.
  
  Wenn Sie ein Failover ausführen, wartet SQL Managed Instance auf die Synchronisierung mit der sekundären Instanz, bevor die Failoverprozedur ausgeführt wird.
  
  Wenn Sie ein erzwungenes Failover ausführen, wechselt SQL Managed Instance die sekundäre Instanz sofort in die primäre Rolle, ohne darauf zu warten, dass die letzten Änderungen von der primären Datei weitergegeben werden. Dieser Failovertyp kann zu Datenverlusten führen.
- Von Microsoft verwaltete Failoverrichtlinie: Von Microsoft verwaltete Failovers werden unter außergewöhnlichen Umständen ausgeführt. Wenn Microsoft ein Failover auslöst, führt die Failovergruppe automatisch ein erzwungenes Failover für die sekundäre Instanz in der Failovergruppe aus. Es wird jedoch empfohlen, eine vom Kunden verwaltete Failoverrichtlinie für Produktionsworkloads zu verwenden, damit Sie steuern können, wann das Failover auftritt.

Benachrichtigung: Microsoft benachrichtigt Sie nicht automatisch, wenn eine Zone deaktiviert ist. Sie können jedoch Azure Resource Health verwenden, um den Status einer einzelnen Ressource zu überwachen, und Sie können Resource Health Alerts einrichten, um Sie über Probleme zu informieren. Sie können auch Azure Service Health verwenden, um den Gesamtstatus des Diensts zu verstehen, einschließlich aller Zonenfehler, und Sie können Service Health Alerts einrichten, um Sie über Probleme zu informieren.

Aktive Anforderungen: Wenn ein Failover auftritt, werden alle verarbeiteten Anforderungen beendet und müssen wiederholt werden. Um Ihre Anwendungen für diese Arten von Problemen robust zu machen, lesen Sie resilienz gegenüber vorübergehenden Fehlern.
Erwarteter Datenverlust: Die Menge des Datenverlusts hängt davon ab, wie Sie Ihre Anwendung konfigurieren. Weitere Informationen finden Sie unter Übersicht über Failovergruppen und bewährte Methoden.
Erwartete Ausfallzeiten: Während eines Failovers einer Failovergruppe kann es zu einer geringen Ausfallzeit kommen. Die Ausfallzeiten sind in der Regel weniger als 60 Minuten.
Datenverkehrsumleitung: Nachdem die Failovergruppe den Failoverprozess abgeschlossen hat, wird der Lese-/Schreibzugriffsdatenverkehr automatisch an die neue primäre Instanz weitergeleitet. Wenn Ihre Anwendungen die Endpunkte der Failovergruppe in ihren Verbindungszeichenfolgen verwenden, müssen sie ihre Verbindungszeichenfolgen nach dem Failover nicht ändern.

Region-Wiederherstellung

Failovergruppen führen beim Wiederherstellen nicht automatisch ein Failback an die primäre Region durch. Daher liegt es in Ihrer Verantwortung, einen Failback zu initiieren.

Bei vom Kunden verwalteten Failovergruppen können Sie einen Failback zur primären Region initiieren, nachdem sie wiederhergestellt wurde. Bei von Microsoft verwalteten Failovergruppen wird der Failbackprozess automatisch ausgeführt. Weitere Informationen finden Sie unter "Failback" zur primären Region.

Test auf Regionsfehler

Sie können das Failover einer Failovergruppe testen.

Das Testen einer Failovergruppe ist nur ein Teil der Durchführung eines DR-Drills. Weitere Informationen finden Sie unter Ausführen von DR-Drills.

Sichern und Wiederherstellen

Erstellen Sie Sicherungen Ihrer Datenbanken, um vor verschiedenen Risiken, einschließlich Datenverlust, zu schützen. Sicherungen können wiederhergestellt werden, um versehentlichen Datenverlust, Beschädigungen oder andere Probleme zu beheben. Sicherungen sind nicht dasselbe wie die Georeplikation, und sie haben unterschiedliche Zwecke und mindern unterschiedliche Risiken.

SQL Managed Instance übernimmt automatisch vollständige, differenzielle und Transaktionsprotokollsicherungen Ihrer Datenbanken. Weitere Informationen zu den Arten von Sicherungen, deren Häufigkeit, Wiederherstellungsfunktionen, Speicherkosten und Sicherungsverschlüsselung finden Sie unter Automatierte Sicherungen in SQL Managed Instance.

SQL Managed Instance bietet integrierte automatisierte Sicherungen und unterstützt auch vom Benutzer initiierte Kopiersicherungen für Benutzerdatenbanken. Weitere Informationen finden Sie unter Kopiesicherungen.

Sicherungsreplikation

Wenn Sie automatisierte Sicherungen für Ihre verwaltete SQL-Instanz konfigurieren, können Sie angeben, wie Sicherungen repliziert werden sollen. Sicherungen, die für die Speicherung auf ZRS konfiguriert sind, weisen eine höhere Resilienz auf. Es wird empfohlen, Ihre Sicherungen so zu konfigurieren, dass sie einen der folgenden Speichertypen verwenden:

ZRS für Resilienz innerhalb der Region, wenn die Region Über Verfügbarkeitszonen verfügt
GZRS zur Verbesserung der Resilienz Ihrer Sicherungen über Regionen hinweg, wenn die Region über Verfügbarkeitszonen verfügt und mit einer anderen Region gekoppelt ist
GRS, wenn Ihre Region keine Verfügbarkeitszonen unterstützt, aber über eine gekoppelte Region verfügt

Weitere Informationen zu verschiedenen Speichertypen und deren Funktionen finden Sie unter Redundanz des Sicherungsspeichers.

Geowiederherstellung

Die Geowiederherstellungsfunktion ist eine einfache DR-Lösung, mit der Sie Sicherungskopien in einer anderen Azure Region wiederherstellen können. Geo-Backup erfordert in der Regel eine erhebliche Menge an Ausfallzeiten und Datenverlust. Um eine höhere Wiederherstellbarkeit zu erzielen, wenn eine regionale Unterbrechung auftritt, sollten Sie Failovergruppen konfigurieren.

Wenn Sie geowiederherstellung verwenden, müssen Sie überlegen, wie Sie Ihre Sicherungen in Ihrer sekundären Region verfügbar machen:

Wenn Ihre primäre Region gekoppelt ist, verwenden Sie den GZRS- oder GRS-Sicherungsspeicher, um Geowiederherstellung in der gekoppelten Region zu unterstützen.
Wenn Ihre primäre Region nicht gekoppelt ist, können Sie eine benutzerdefinierte Lösung erstellen, um Ihre Sicherungen in eine andere Region zu replizieren. Erwägen Sie die Verwendung von benutzerseitig initiierten Kopiersicherungen und das Speichern in einem Speicherkonto, das Blobobjektreplikation verwendet, um in einem Speicherkonto in einer anderen Region zu replizieren.

Resilienz gegenüber Wartungsarbeiten an Diensten

Wenn SQL Managed Instance Wartungen für Ihre Instanz durchführt, bleibt die SQL managed instance vollständig verfügbar, kann jedoch kurzen Neukonfigurationen unterliegen. Clientanwendungen können kurze Verbindungsunterbrechungen beobachten, wenn ein Wartungsereignis auftritt. Ihre Clientanwendungen sollten die Richtlinien zur Ausfallsicherheit für vorübergehende Fehler befolgen, um die Auswirkungen zu minimieren.

mit SQL Managed Instance können Sie ein Wartungsfenster angeben, das in der Regel für Dienstupgrades und andere Wartungsvorgänge verwendet wird. Durch das Konfigurieren eines Wartungsfensters können Sie alle Nebenwirkungen wie automatische Failovers während der Geschäftszeiten minimieren. Sie können auch vorab Benachrichtigungen über die geplante Wartung erhalten.

Weitere Informationen finden Sie im Fenster Maintenance in SQL Managed Instance.

Service-Level-Vereinbarung

Der ServiceLevel-Vertrag (SLA) für Azure-Dienste beschreibt die erwartete Verfügbarkeit der einzelnen Dienste und die Bedingungen, die Ihre Lösung erfüllen muss, um diese Verfügbarkeitserwartungen zu erreichen. Weitere Informationen finden Sie unter Dienstleistungsvereinbarungen für Onlinedienste.

Für SQL Managed Instance gilt die Verfügbarkeits-SLA nur, wenn Ihr Azure virtuelles Netzwerk ordnungsgemäß konfiguriert ist, sodass der Verwaltungsdatenverkehr nicht beeinträchtigt wird. Diese Konfiguration umfasst Subnetzgröße, Netzwerksicherheitsgruppen (NSGs), benutzerdefinierte Routen (UDRs), DNS-Konfiguration und andere Ressourcen, die sich auf die Verwaltung und Verwendung von Netzwerkressourcen auswirken. Weitere Informationen zur erforderlichen Netzwerkkonfiguration für SQL Managed Instance finden Sie unter Network requirements.

Übersicht über Geschäftskontinuität bei SQL Managed Instance
Prüfliste für Hochverfügbarkeit und Notfallwiederherstellung
Reliability in Azure

Feedback

War diese Seite hilfreich?

Last updated on 2026-03-09

Zuverlässigkeit in Azure SQL Managed Instance

Empfehlungen für die Produktionsimplementierung für Zuverlässigkeit

Übersicht über die Zuverlässigkeitsarchitektur

Redundanz

Resilienz für vorübergehende Fehler

Ausfallsicherheit bei Ausfällen von Verfügbarkeitszonen

Anforderungen

Kosten

Konfigurieren der Unterstützung von Verfügbarkeitszonen

Verhalten, wenn alle Zonen fehlerfrei sind

Verhalten bei einem Zoneausfall

Zonenwiederherstellung

Test auf Zonenfehler

Widerstandsfähigkeit bei regionalen Ausfällen

Failovergruppen

Failoverrichtlinien

Anforderungen

Kosten

Konfigurieren der Unterstützung für mehrere Regionen

Kapazitätsplanung und -verwaltung

Verhalten, wenn alle Regionen funktionsfähig sind

Verhalten während eines Regionenausfalls

Region-Wiederherstellung

Test auf Regionsfehler

Sichern und Wiederherstellen

Sicherungsreplikation

Geowiederherstellung

Resilienz gegenüber Wartungsarbeiten an Diensten

Service-Level-Vereinbarung

Verwandte Inhalte

Feedback

Zusätzliche Ressourcen