Business Continuity & Disaster Recovery

Organisations- und Unternehmensanwendungsworkloads stellen Anforderungen an Recovery Time Objective (RTO) und Recovery Point Objective (RPO). Ein effektiver BCDR-Entwurf (Business Continuity & Disaster Recovery) bietet Funktionen auf Plattformebene, die diese Anforderungen erfüllen. Zum Entwerfen von BCDR-Funktionen erfassen Sie Anforderungen für die Notfallwiederherstellung (DR) der Plattform.

Überlegungen zum Entwurf

Berücksichtigen Sie beim Entwerfen von BCDR für Anwendungsworkloads die folgenden Faktoren:

  • Anforderungen an die Anwendungs- und Datenverfügbarkeit:

    • RTO- und RPO-Anforderungen für jede Workload
    • Unterstützung für Aktiv/Aktiv- und Aktiv/Passiv-Verfügbarkeitsmuster
  • BCDR as a Service für PaaS-Dienste (Platform as a Service):

    • Unterstützung nativer DR- und HA-Features (Hochverfügbarkeit)
    • Georeplikation und DR-Funktionen für PaaS-Dienste
  • Unterstützung von Bereitstellungen in mehreren Regionen für Failover, wobei Komponenten für die Leistung nah beieinander platziert werden

  • Anwendungsvorgänge mit verringerter Funktionalität oder Leistungseinbußen während eines Ausfalls

  • Eignung von Workloads für Verfügbarkeitszonen oder Verfügbarkeitsgruppen:

    • Datenfreigabe und Abhängigkeiten zwischen Zonen
    • Auswirkungen von Verfügbarkeitszonen auf Updatedomänen im Vergleich zu Verfügbarkeitsgruppen
    • Prozentsatz der Workloads, die gleichzeitig gewartet werden können
    • Verfügbarkeitszonenunterstützung für bestimmte SKUs für virtuelle Computer (VM). Azure Disk Storage Ultra erfordert beispielsweise die Verwendung von Verfügbarkeitszonen.
  • Konsistente Sicherungen für Anwendungen und Daten:

    • VM-Momentaufnahmen
    • Recovery Services-Tresore in Azure Backup
    • Abonnementlimits schränken die Anzahl von Recovery Services-Tresoren und die Größe jedes Tresors ein
  • Netzwerkkonnektivität bei einem Failover:

    • Bandbreitenkapazitätsplanung für Azure ExpressRoute
    • Routing von Datenverkehr bei regionalen Ausfällen, Zonen- oder Netzwerkausfällen
  • Geplantes und ungeplantes Failover:

    • Anforderung konsistenter IP-Adressen und potenzielle Notwendigkeit der Verwaltung von IP-Adressen nach Failover und Failback
    • Verwalten von DevOps-Entwicklerfunktionen
    • Azure Key Vault-Notfallwiederherstellung für Anwendungsschlüssel, Zertifikate und Geheimnisse

Entwurfsempfehlungen

Die folgenden Entwurfsmethoden unterstützen BCDR für Anwendungsworkloads:

  • Stellen Sie Azure Site Recovery für Szenarios zur Notfallwiederherstellung von VMs von Azure zu Azure bereit.

    Site Recovery verwendet Echtzeitreplikation und Wiederherstellungsautomatisierung, um Workloads regionsübergreifend zu replizieren. Integrierte Plattformfunktionen für VM-Workloads erfüllen Anforderungen im Hinblick auf niedrige RPO- und RTO-Werte. Sie können mit Site Recovery Wiederherstellungstestläufe ohne Auswirkung auf die Workloads in der Produktion ausführen. Sie können auch Azure Policy verwenden, um Replikation zu aktivieren und den Schutz Ihrer VMs zu überwachen.

  • Verwenden Sie native PaaS-DR-Funktionen.

    Integrierte PaaS-Features vereinfachen sowohl die Entwurfs- als auch die Bereitstellungsautomatisierung für replikations- und failoverbasierte Workloadarchitekturen. Organisationen, die Dienststandards definieren, können außerdem die Dienstkonfiguration mithilfe von Azure Policy überwachen und erzwingen.

  • Verwenden Sie native Azure-Funktionen für die Sicherung.

    Dank Azure Backup und PaaS-nativer Sicherungsfeatures sind Sicherungssoftware und Infrastrukturkomponenten von Drittanbietern nicht mehr erforderlich. Wie bei anderen nativen Features können Sie Sicherungskonfigurationen mit Azure Policy festlegen, überwachen und erzwingen, um die Einhaltung der Organisationsanforderungen sicherzustellen.

  • Verwenden Sie mehrere Regionen und Peeringstandorte für ExpressRoute-Verbindungen.

    Eine redundante hybride Netzwerkarchitektur kann bei einem Ausfall einer Azure-Region oder eines Peering-Anbieterstandorts dazu beitragen, eine unterbrechungsfreie, standortübergreifende Konnektivität zu gewährleisten.

  • Vermeiden Sie Überschneidungen bei den IP-Adressbereichen für Produktions- und DR-Standorte.

    Produktions-DR-Netzwerke, die die gleichen klassenlosen domänenübergreifenden Routingblöcke verwenden, erfordern einen Failoverprozess, der das Anwendungsfailover erschweren und verzögern kann. Entwerfen Sie nach Möglichkeit eine BCDR-Netzwerkarchitektur, die eine gleichzeitige Konnektivität mit allen Standorten ermöglicht.