Freigeben über


Optimieren der Geschäftskontinuität und Notfallwiederherstellung

Wenn Sie Oracle-Ressourcen zu Azure migrieren, sollten Sie die Zuverlässigkeit Ihrer Datenbank und auch die Zuverlässigkeit der Ebenen auf virtuellen Computern (VMs), virtuellen Netzwerksubnetzen und Speicherkomponenten berücksichtigen.

Oracle in Azure kann Infrastructure-as-a-Service (IaaS) die erforderlichen Resilienzziele der anspruchsvollsten Oracle-Workloads erfüllen. Um die Anleitung in diesem Artikel effektiv zu verwenden, definieren Sie zunächst Ihre Resilienz-Key Performance Indicators (KPIs) basierend auf Ihren Geschäftsanforderungen. Verwenden Sie Ihre RTO- (Recovery Time Objective) und RPO-Anforderungen (Recovery Point Objective) als Basis-KPIs, um die beste Architektur für Ihre Oracle-Workload in Azure zu ermitteln.

Die RTO ist die maximale Zeit, für die eine Anwendung nach einem Notfall, einem Fehler oder einem vergleichbaren Ereignis nicht verfügbar ist.

Der RPO ist die maximale Menge an Datenverlust nach einem Notfall, einem Ausfall oder einem vergleichbaren Ereignis.

Sicherungsmethoden für den Datenschutz

Die drei Oracle-Datenbanksicherungsmethoden für eine Oracle-Workload in Azure IaaS umfassen:

  • Streamingsicherungen. Verwenden Sie Oracle Recovery Manager (RMAN) für diese Methode. RMAN streamt Sicherungen auf sequenzielle Bandmedien.

    Zu den Sicherungszielen in Azure gehören:

    • Nicht von Microsoft stammende virtuelle Bandbibliotheken, die Sie in Azure Marketplace finden.
    • Lokale und Remotedateifreigaben, z. B. Azure Blob Storage mit dem Netzwerkdateisystemprotokoll, Azure Files und Azure NetApp Files.
  • Momentaufnahmen auf Speicherebene. Verwenden Sie für diese Methode Azure Backup. Diese Methode basiert auf dem Speichertyp, den Sie für Datenbankdateien verwenden. Wenn Sie beispielsweise verwaltete Azure-Datenträger wie Azure SSD Premium verwenden, kann Azure Backup in die Oracle-Datenbank integriert werden. Wenn Sie Azure NetApp Files verwenden, können Sie Azure NetApp Files Datenschutzfunktionen wie Azure NetApp Files Sicherung und regionsübergreifende Replikation verwenden.

  • Sicherungen auf VM-Ebene. Verwenden Sie für diese Methode Azure Backup.

Wenn Sie Sicherungen großer Datenbanken streamen, kann die Zeit, die zum Kopieren der Daten benötigt wird, um sie dann wiederherzustellen, die RTO-Anforderungen überschreiten. Momentaufnahmen auf Speicherebene sind die beste Option für dieses Szenario.

Empfehlungen

  • Überlegen Sie sorgfältig, ob Eine Sicherungsstrategie implementiert werden soll, die auf Streaming, Momentaufnahmen auf Speicherebene oder auf beiden Strategien basiert.

  • Bewerten Sie die Auswirkungen Ihrer Sicherungsstrategie auf Ihre RTO- und RPO-Anforderungen.

  • Analysieren Sie die verfügbaren Speicherziele für Ihre RMAN-Sicherungen basierend auf den dokumentierten Durchsatzgrenzwerten für jede Option. Wählen Sie die Option aus, die Ihren Anforderungen entspricht.

  • Erwägen Sie die Verwendung Azure Backup für Ihre Momentaufnahmen auf Speicherebene, und erwägen Sie, die Momentaufnahmen in einer gekoppelten Region oder einer Verfügbarkeitszone zu platzieren, um zusätzlichen Schutz zu gewährleisten.

  • Ziehen Sie verschiedene Speicheroptionen in Betracht, um die Archivprotokollsicherungen zu speichern, die Sie zum Wiederherstellen der Datenbank benötigen. Berücksichtigen Sie die Leistungs-, Replikations- und Kostenüberlegungen der einzelnen Optionen.

  • Entwickeln und testen Sie Regelmäßig Ihre Sicherungs- und Wiederherstellungspläne, um unerwünschte Überraschungen in Ihrer Produktionsumgebung zu vermeiden.

Dienstschutz und Geschäftskontinuität

In diesem Abschnitt wird beschrieben, wie Sie die Allgemeine Hochverfügbarkeit (High Availability, HOCHVERFÜGBARKEIT) und notfallwiederherstellung (DR) Ihrer Oracle-Workload in Azure IaaS verbessern, indem Sie Überlegungen zum Dienstschutz und zur Geschäftskontinuität (Business Continuity, BC) implementieren.

Integrieren Sie die folgenden Empfehlungen, um die Architekturredundanz zu verbessern und letztendlich die Zeit zu maximieren, in der Ihr Dienst verfügbar ist. Ziel ist es, die Ausfallzeiten von Diensten aufgrund geplanter Ausfälle wie Patches, Updates und Upgrades sowie ungeplanter Ausfälle wie z. B. Ausfällen zu minimieren. Verwenden Sie Azure- und Oracle-Funktionen, um Ihre Wiederherstellung nach geografieweiten Fehlern zu verbessern.

Azure bietet viele Optionen für die Hochverfügbarkeit einzelner Komponenten in einer Oracle on IaaS-Architektur. Beispielsweise können Sie folgende Aktionen ausführen:

  • Stellen Sie VMs in Verfügbarkeitsgruppen bereit, um separate Fehler- und Updatedomänen zu gewährleisten.
  • Create Verfügbarkeitszonen zum Schutz vor Rechenzentrumsausfällen.
  • Platzieren Sie Bereitstellungen in verschiedenen Regionen, um vor Fehlern in vollständigen Regionen zu schützen.

Verschiedene Azure-Speicherfunktionen bieten unterschiedliche Speicherredundanzebenen, z. B. lokal redundanter Speicher, zonenredundanter Speicher und georedundanter Speicher. Berücksichtigen Sie jede Option, wenn Sie ihre Oracle-Workloadbereitstellung in Azure IaaS planen.

Sie können auch Oracle Data Guard verwenden, ein Tool für Oracle Database Service Protection-Setups. Data Guard leitet Transaktionsprotokolle weiter und wendet sie auf eine oder mehrere Standbydatenbanken an. Bei diesem Prozess werden genaue Kopien der primären Datenbank verwaltet, auf die Sie ein Failover ausführen können, wenn Sie eine Wartung oder ein Fehlerszenario geplant haben.

Data Guard verfügt über drei Modi der Datenreplikation: maximaler Schutz, maximale Verfügbarkeit und maximale Leistung. Jeder Replikationsmodus bietet eine andere Kombination aus Protokolltransportmodi und unterschiedlichen Transaktionsgarantien für die Anwendung in der sekundären Datenbank.

Abhängig von Ihrer Strategie, z. B. einer Strategie ohne Latenz oder einer Strategie ohne Datenverlust, können Sie eine synchrone oder eine asynchrone Konfiguration auswählen. Sie können auch ein Schnellstartfailover implementieren, je nach Ihren Anforderungen an die maximale Ausfallzeit. Es sind Referenzarchitekturen verfügbar, die eine Wiederherstellung in weniger als einer Minute oder weniger als fünf Minuten und bis zu vier Stunden ermöglichen. Die Enterprise Edition von Oracle Database umfasst Data Guard.

Oracle GoldenGate ist ein weiteres Tool, das Sie verwenden können, um Daten zwischen zwei Datenbanken zu replizieren und Szenarien mit mehreren primären Instanzen zu ermöglichen. Sie müssen GoldenGate separat erwerben.

Empfehlungen

  • Berücksichtigen Sie die Funktionen, die Azure für die Hochverfügbarkeit verschiedener Infrastrukturkomponenten in Ihrer Oracle on Azure-IaaS-Implementierung bereitstellt.

  • Wählen Sie sorgfältig den Datenbankschutzmodus aus, der Ihre Anforderungen erfüllt, wenn Sie Data Guard für Hochverfügbarkeit und Notfallwiederherstellung verwenden. Beispielsweise minimiert der Modus für maximale Leistung die Auswirkungen auf die Quelle, weist jedoch das größte Risiko für Datenverlust auf. Weitere Informationen finden Sie unter BCDR für Oracle in Azure Virtual Machines Zielzonenbeschleuniger und Oracle Data Guard-Schutzmodi.

  • Erwägen Sie die Automatisierung Ihres Failoverprozesses. Sie können beispielsweise ein Schnellstartfailover verwenden.

  • Richten Sie Testverfahren für Ihre Failoverprozesse ein, und führen Sie regelmäßige Tests durch, um Probleme zu vermeiden.

  • Erstellen Sie Ihre Lösung ganzheitlich, indem Sie native Azure-Funktionen wie Verfügbarkeitszonen und oraclenative Tools wie Data Guard verwenden, um Ihre Anforderungen an hochverfügbarkeit und Notfallwiederherstellung zu erfüllen. In den folgenden beiden Beispielen werden native Azure- und Oracle-native Komponenten verwendet.

Create eines Failovers mit passivem Standbymodus

In diesem Abschnitt wird ein Beispiel für ein Failoverszenario für unternehmenskritische Oracle-Anwendungen in einer Bereitstellung mit zwei Verfügbarkeitszonen mit passivem Standby beschrieben.

Unternehmenskritische Oracle-Anwendungen, z. B. Oracle E-Business Suite, erfordern eine Fehlerprävention und damit eine ganzheitliche Architektur.

In diesem Beispiel werden folgende Schritte ausgeführt:

  • Verfügt über eine Bereitstellung mit zwei Verfügbarkeitszonen. Die Anwendungsebene verwendet Azure Site Recovery mit einer passiven sekundären VM.

  • Nutzt die Vorteile des Data Guard-Schnellstartfailoverfeatures. Um die höchste Verfügbarkeit zu erzielen, wird empfohlen, zwei Beobachter zu installieren. Der primäre Beobachter befindet sich in Verfügbarkeitszone 1, und der sekundäre Beobachter befindet sich in Verfügbarkeitszone 2. Die Beobachter überwachen und leiten den Datenverkehr weiter. Wenn die primäre Datenbank nicht verfügbar ist, führt der Beobachter automatisch ein Failover zur sekundären Datenbank aus. Data Guard führt eine Wiederholungssynchronisierung durch. Der Zeitrahmen der Wiederholungssynchronisierung hängt von Ihrer Wiederholungskonfiguration ab.

  • Data Guard ist für einen Datenschutzmodus konfiguriert, z. B. maximale Verfügbarkeit, maximale Leistung oder maximaler Schutz. Weitere Informationen zum Auswählen eines Modus für Ihre Workloadanforderungen finden Sie unter Oracle Data Guard-Schutzmodi.

Die folgende Architektur zielt auf einen Ausfallzeitschwellenwert von weniger als fünf Minuten ab.

Diagramm, das die Architektur für ein Failover mit passivem Standby zeigt.

Create eines Failovers mit aktivem Standbymodus

In diesem Abschnitt wird ein Beispiel für ein Failoverszenario für unternehmenskritische Oracle-Anwendungen in einer Bereitstellung mit zwei Verfügbarkeitszonen mit aktivem Standby beschrieben.

In diesem Beispiel:

  • Die Webserverebene, die Anwendungsebene und die Datenbankebene befinden sich in einem eigenen Subnetz des virtuellen Netzwerks.

  • Die primäre Datenbank befindet sich in der ersten Verfügbarkeitszone.

  • Die Datenbank, die Active Data Guard zum Replizieren der primären Datenbank in einen aktiven Standbymodus verwendet, befindet sich in Verfügbarkeitszone 3.

Hinweis

Für dieses Setup ist eine Active Data Guard-Lizenz erforderlich.

Die folgende Architektur zielt auf einen Ausfallzeitschwellenwert von weniger als einer Minute ab. Dieses Failoverszenario verfügt über eine aktive Standbykonfiguration, verfügt aber über schreibgeschützte Funktionen.

Diagramm, das die Architektur für ein Failover mit aktivem Standby zeigt.

Nächster Schritt