Wählen einer Notfallwiederherstellungsstrategie für SharePoint Server

BETRIFFT:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint in Microsoft 365

Notfallwiederherstellung wird von uns definiert als die Fähigkeit, nach einer Situation eine Wiederherstellung auszuführen, in der ein Rechenzentrum, in dem SharePoint Server gehostet wird, nicht mehr betriebsbereit ist. Unabhängig von der Art des Ereignisses und seiner Ursache ist der Ausfall des Rechenzentrums so schwerwiegend, dass die im Notfallwiederherstellungsplan Ihrer Organisation vorgegebenen Aktionen ausgelöst werden. Dies bedeutet, dass eine vollständige betriebsbereite Farm mithilfe von Computerressourcen in der Produktionsumgebung bereitgestellt wird, die sich in einem nicht von dem Ereignis betroffenen Rechenzentrum befinden.

SharePoint Server 2019, 2016, 2013 und die SQL-Server, die sie unterstützen, bieten Konfiguration und Inhaltswiederherstellungsoptionen, die das Recovery Time Objective (RTO) und das Recovery Point Objective (RPO) erfüllen können, die für Ihr Unternehmen bei einem Notfall erforderlich sind. Weitere Informationen zu diesen und anderen Notfallwiederherstellungskonzepten finden Sie unter Konzepte für hohe Verfügbarkeit und Notfallwiederherstellung in SharePoint Server.

Einführung

Eine wirkungsvolle Strategie für die Notfallwiederherstellung einer SharePoint Server-Farm muss die geschäftlichen Anforderungen Ihrer Organisation erfüllen, die in der Regel mithilfe zweier Angaben definiert werden: den Zielwerten für die Wiederherstellungszeit (RTO) und den Wiederherstellungspunkt (RPO). Die RTO- und RPO-Anforderungen ergeben sich aus dem Bestimmen der Ausfallkosten für die Organisation bei einem Notfall.

Wichtig

[!WICHTIGER HINWEIS] Am besten ist es, die Werte für RTO und RPO für Ihre Organisation eindeutig zu bestimmen und zu quantifizieren, bevor Sie eine Wiederherstellungsstrategie entwickeln und eine technische Lösung implementieren. Konzentrieren Sie sich zunächst darauf, was erforderlich ist, und nicht darauf, wie Sie es erreichen können.

Die Ausfallkosten variieren erheblich zwischen und innerhalb der Branche, insbesondere aufgrund der unterschiedlichen Auswirkungen von Ausfallzeiten. Die Geschäftsgröße ist der offensichtlichste Faktor. Es ist jedoch nicht die einzige. Die Festlegung einer Maßnahme bedeutet, die Art und die Auswirkungen des Scheiterns zu ermitteln. Auf die einfachste Ebene reduziert, kann ein Fehler einer kritischen Anwendung zu den folgenden Arten von Verlusten führen:

  • Verlust des Anwendungsdiensts. Die Auswirkungen von Ausfallzeiten variieren je nach Anwendung und Unternehmen.

  • Datenverlust. Der potenzielle Verlust von Daten aufgrund eines Systemausfalls kann beträchtliche rechtliche und finanzielle Auswirkungen haben.

Die meisten Organisation erleiden Ausfallkosten aufgrund der beiden zuvor genannten Typen von Verlust, doch die Art des Geschäfts bestimmt, welcher Ausfalltyp die schwerwiegendsten Auswirkungen hat. Der folgende Artikel von Chris Preimesberger auf der eWEEK-Website erläutert die finanziellen Folgen eines Rechenzentrumsausfalls. Unplanned IT Downtime Can Cost $5K Per Minute: Report.

In den meisten Fällen ist SharePoint-Produkte eine von mehreren Anwendungen, die im Falle eines Rechenzentrumsausfalls, der als Notfall eingestuft wird, wiederhergestellt werden muss. Aus diesem Grund haben wir keine Informationen zur Notfallwiederherstellungsplanung eingeschlossen, sondern konzentrieren uns auf Optionen, um sicherzustellen, dass Sie Ihre SharePoint Server-Farm an einem anderen Speicherort wiederherstellen können.

Unabhängig von Typ und Ausmaß eines Notfalls umfasst die Wiederherstellung den Einsatz eines Standby-Rechenzentrums, in dem Sie die Farm wiederherstellen können.

Optionen für die Wiederherstellung mithilfe eines Standby-Rechenzentrums

Standby-Rechenzentren werden in Szenarien benötigt, bei denen mittels lokaler redundanter Systeme und Sicherungen das primäre Rechenzentrum bei einem Ausfall nicht wiederhergestellt werden kann. Die Zeit und der unmittelbare Aufwand, den Betrieb einer Ersatzfarm aufzunehmen und an einem anderen Standort auszuführen, werden häufig als entweder "unmittelbar betriebsbereit", "betriebsbereit" oder "verzögert betriebsbereit" beschrieben. Unsere Bezeichnungen dieser Rechenzentren zur Farmwiederherstellung lauten wie folgt:

  • Verzögert betriebsbereit. Ein sekundäres Rechenzentrum, das binnen Stunden oder Tagen Verfügbarkeit bieten kann.

  • Betriebsbereit. Ein sekundäres Rechenzentrum, das binnen Minuten oder Stunden verfügbar sein kann.

  • Unmittelbar betriebsbereit Ein sekundäres Rechenzentrum, das binnen Sekunden oder Minuten verfügbar sein kann.

Jedes dieser Standby-Rechenzentren hat bestimmte Merkmale und Anforderungen und weist entsprechende Kosten für Betrieb und Wartung auf.

  • Notfallwiederherstellungsstrategie mit verzögert betriebsbereiter Standby-Lösung: Ein Unternehmen sendet zur Unterstützung der Bare-Metal-Recovery regelmäßig Sicherungen an lokale und regionale Speicherorte außerhalb des Betriebsgeländes und hat Mietverträge für Notfallserver in einer anderen Region abgeschlossen.

    Pros: Häufig die günstigste Option für die Wartung. Im Hinblick auf die Wiederherstellung oft eine kostspielige Option, da nach einem Notfall physische Server ordnungsgemäß konfiguriert werden müssen.

    Nachteile: Die langsamste Wiederherstellungsoption

  • Notfallwiederherstellungsstrategie mit betriebsbereiter Standby-Lösung mit Azure Site Recovery.

    Pros: Oft relativ kostengünstige Wiederherstellung, da eine virtuelle Serverfarm bei der Wiederherstellung möglicherweise wenig Konfiguration erfordert.

    Cons: Die Wartung kann sehr kostspielig und zeitraubend sein.

  • Notfallwiederherstellungsstrategie mit unmittelbar betriebsbereiter Standby-Lösung: Ein Unternehmen betreibt mehrere Rechenzentren, stellt jedoch Inhalte und Dienste nur über ein Rechenzentrum bereit.

    Pros: Oft relativ schnelle Wiederherstellung.

    Cons: Wartung und Konfiguration können sehr kostspielig sein.

Wichtig

Unabhängig davon, für welche Notfallwiederherstellungslösung Sie sich entscheiden, wird vermutlich ein gewisser Datenverlust auftreten.

Verzögert betriebsbereite Wiederherstellungslösung

In einem Szenario für die Notfallwiederherstellung im Kalten Standbymodus stellen Sie die Wiederherstellung wieder her, indem Sie eine neue Farm an einem neuen Speicherort einrichten (vorzugsweise mithilfe einer skriptgesteuerten Bereitstellung) und Sicherungen wiederherstellen. Sie können die Wiederherstellung auch durchführen, indem Sie die Farm mithilfe einer Sicherungslösung wie System Center – Data Protection Manager (DPM) wiederherstellen. DPM schützt Ihre Daten auf Computerbetriebssystem-Ebene und ermöglicht es Ihnen, jeden Server einzeln wiederherzustellen. Dieser Artikel enthält keine detaillierten Anweisungen zum Erstellen und Wiederherstellen in Szenarien mit verzögert betriebsbereiter Standby-Lösung. Weitere Informationen finden Sie unter:

Betriebsbereite Wiederherstellungslösung

Bei einer Notfallwiederherstellung mit betriebsbereiter Standby-Lösung richten Sie eine betriebsbereite Standby-Umgebung ein, indem Sie die Farm im sekundären Rechenzentrum duplizieren und regelmäßig mithilfe vollständiger und inkrementeller Sicherungen der primären Farm aktualisieren.

Virtuelle betriebsbereite Standby-Umgebungen

Die Virtualisierung bietet eine funktionsfähige und wirtschaftliche Option für eine betriebsbereite Standby-Wiederherstellungslösung. Sie können Hyper-V als interne oder Azure als gehostete Lösung nutzen, um die für die Wiederherstellung benötigte Infrastruktur bereitzustellen. Weitere Informationen finden Sie unter Bereitstellen von SharePoint Server mit SQL Server Always On Verfügbarkeitsgruppen in Azure

Unmittelbar betriebsbereite Wiederherstellungslösung

In einem Notfallwiederherstellungs-Szenario mit unmittelbar betriebsbereiter Standby-Lösung können Sie eine Failoverfarm so im Standby-Rechenzentrum einrichten, dass diese den Produktionsbetrieb nahezu sofort übernehmen kann, nachdem die primäre Farm offline gegangen ist. Eine Umgebung mit einer getrennten Failoverfarm weist die folgenden Merkmale auf:

  • In der Failoverfarm müssen eine separate Konfigurationsdatenbank und Inhaltsdatenbank der die Website für die SharePoint-Zentraladministration verwaltet werden.

  • Alle Anpassungen müssen in beiden Farmen bereitgestellt werden.

    Tipp

    Es besteht Konsistenz zwischen den beiden Farmen, und zum Verringern der Fehlerwahrscheinlichkeit wird empfohlen, zum Erstellen der primären Farm und der Failoverfarm mit den gleichen Konfigurationseinstellungen und Anpassungen die skriptgestützte Bereitstellung zu verwenden.

  • Betriebssystem-, SQL Server- und SharePoint Server-Softwareupdates müssen in beiden Farmen eingespielt werden, damit beide eine einheitliche Konfiguration aufweisen.

  • Sie können SharePoint Server-Inhaltsdatenbanken mithilfe der asynchronen Spiegelung, eines asynchronen Commits für ein Verfügbarkeitsgruppenreplikat oder des Protokollversands kopieren.

    Hinweis

    Die SQL Server-Spiegelung kann nur zum Kopieren von Datenbanken auf einen einzigen Spiegelserver verwendet werden. Sie können jedoch den Protokollversand an mehrere sekundäre Server verwenden.

    Das SQL Server-Datenbankspiegelungsfeature wird in zukünftigen Versionen entfernt. Es wird empfohlen, dieses Feature nicht in neuen Bereitstellungen zu verwenden. Planen Sie die Änderung von Anwendungen, die derzeit dieses Feature verwenden. Verwenden Sie stattdessen Always On Verfügbarkeitsgruppen.

  • Nicht alle Dienstanwendungen können per Protokollversand an eine Farm gesendet werden. Weitere Informationen finden Sie weiter unten in diesem Artikel unter Redundanz von Dienstanwendungen.

Diese Topologie kann bei mehreren Rechenzentren wiederholt werden, sofern Sie den SQL Server-Protokollversand an ein oder mehrere zusätzliche Rechenzentren konfigurieren.

Wichtig

[!WICHTIGER HINWEIS] Die verfügbare Netzwerkbandbreite und Latenz sind wesentliche Aspekte bei Befolgen eines Failoveransatzes bei der Notfallwiederherstellung. Es wird empfohlen, dass Sie sich an Ihren SAN-Anbieter wenden, um zu ermitteln, ob Sie die SAN-Replikation für SQL-Datenbanken oder einen anderen unterstützten Mechanismus verwenden können, um die verfügbarkeitsbereite Standbystufe über Rechenzentren hinweg bereitzustellen. Beachten Sie, dass die Verwendung der SAN-Replikation für SharePoint-Server nicht unterstützt wird.

Redundanz von Dienstanwendungen

Zum Bereitstellen von Verfügbarkeit für Dienstanwendungen zwischen Rechenzentren wird empfohlen, für Dienste, die farmübergreifend ausgeführt werden können, eine separate Dienstfarm auszuführen, auf die über das primäre und sekundäre Rechenzentrum zugegriffen werden kann.

Für Dienste, die nicht farmübergreifend ausgeführt werden können, und für die Bereitstellung von der Verfügbarkeit für die Dienstfarm selbst gibt es unterschiedliche Strategien für die Bereitstellung von Redundanz für eine Dienstanwendung zwischen Rechenzentren. Die verwendete Strategie hängt von folgenden Faktoren ab:

  • Die Ausführung der Dienstanwendung in der Notfallwiederherstellungsfarm, wenn diese nicht verwendet wird, hat einen geschäftlichen Nutzen.

  • Die der Dienstanwendung zugeordneten Datenbanken können per Protokollversand gesendet, asynchron gespiegelt oder über einen asynchronen Commit repliziert werden werden.

  • Die Dienstanwendung kann mit schreibgeschützten Datenbanken ausgeführt werden.

Lesen Sie den Artikel Unterstützte Hochverfügbarkeits- und Notfallwiederherstellungsoptionen für SharePoint-Datenbanken, bevor Sie eine Notfallwiederherstellungslösung entwerfen, die ein betriebsbereites bzw. unmittelbar betriebsbereites Standby-Rechenzentrum nutzt.

Systemanforderungen für die Wiederherstellung

In einem idealen Szenario entsprechen die Failoverkomponenten und -systeme in jeder Hinsicht den primären Komponenten und Systemen: Plattform, Hardware und Anzahl der Server. Die Failoverumgebung muss mindestens in der Lage sein, den Datenverkehr zu verarbeiten, den Sie während eines Failovers erwarten. Beachten Sie, dass nur eine Teilmenge der Benutzer von der Failoverwebsite bedient wird. Die Systeme müssen mindestens in diesen Aspekten übereinstimmen:

  • Betriebssystemversion und alle Updates

  • SQL Server-Versionen und alle Updates

  • SharePoint Server-Versionen und alle Updates

Zusätzlich zu den vorherigen Anforderungen ist die Farmwiederherstellungsdauer auch von der Verfügbarkeit von Versorgungssystemen und Infrastrukturkomponenten abhängig. Stellen Sie sicher, dass folgende Anforderungen erfüllt sind:

  • Infrastrukturabhängigkeiten wie beispielsweise Stromversorgung, Kühlung, Netzwerk, Verzeichnis und SMTP sind vollständig redundant.

  • Wählen Sie einen den Anforderungen entsprechenden Umschaltmechanismus (DNS oder Hardwarelastenausgleich) aus.

Siehe auch

Konzepte

Konzepte für hohe Verfügbarkeit und Notfallwiederherstellung in SharePoint Server

Weitere Ressourcen

Welche Arbeitslasten können Sie mit der Azure Site Recovery schützen?

Replizieren einer SharePoint-Anwendung mit mehreren Ebene für die Wiederherstellung mithilfe von Azure Site Recovery