Ausfallsicherheit und Kontinuität (Übersicht)

Wie stellt Microsoft die Geschäftskontinuität sicher, wenn ein Notfall oder eine andere Bedrohung für die Dienstverfügbarkeit auftritt?

Das ERCM-Team (Enterprise Resilience and Crisis Management) von Microsoft überwacht Geschäftskontinuitäts-Management- und Notfallwiederherstellungsaktivitäten für Microsoft-Dienste und Cloudangebote. Vertreter der Microsoft-Geschäftseinheiten stimmen sich mit dem ERCM-Team zusammen, um Geschäftskontinuitätspläne zu entwickeln und die Einhaltung der Geschäftskontinuitätsanforderungen zu überprüfen.

Der Lebenszyklus von Business Continuity Management (BCM) ist der Kern unserer BCM-Methodik. Dieser dreistufige Prozess ist so konzipiert, dass er anpassungsfähig ist, sodass er von einer Vielzahl von Geschäftsmodelle in Microsoft implementiert werden kann. Es beginnt mit einer Bewertungsphase , um kritische Prozesse und Ziele zu identifizieren, die in das Geschäftskontinuitätsprogramm aufgenommen werden sollten. Die Bewertungsphase erfordert auch eine Geschäftsauswirkungsanalyse (Business Impact Analysis, BIA). Die Planungsphase konzentriert sich auf die Entwicklung und Implementierung von Resilienz- und Wiederherstellungsstrategien und deren Dokumentation in offiziellen Geschäftskontinuitätsplänen. Schließlich testet die Funktionsvalidierung Geschäftskontinuitätspläne und deren Implementierungen, um die Effektivität zu überprüfen und potenzielle Verbesserungen zu identifizieren.

Microsoft Onlinedienste Geschäftskontinuitätsstrategien verwenden Hardware-, Netzwerk- und Rechenzentrumsredundanz. Die Datenreplikation zwischen Rechenzentren bietet Hochverfügbarkeit und Zuverlässigkeit während eines schwerwiegenden Incidents. Es erhöht auch die Resilienz bei alltäglichen Vorfällen wie isolierten Hardwarefehlern oder Datenbeschädigungen.

Wie teste Microsoft Pläne für Geschäftskontinuität und Notfallwiederherstellung?

Die ERCM-Richtlinie (Enterprise Resilience and Crisis Management) von Microsoft sieht vor, dass alle Pläne für Geschäftskontinuität und Notfallwiederherstellung von Microsoft jährlich getestet, aktualisiert und überprüft werden müssen. Microsoft Onlinedienste ihre Geschäftskontinuitätspläne mindestens jährlich pro ERCM-Richtlinien testen. Nachdem Aktionsberichte erstellt und überprüft wurden, um die Ergebnisse zu überprüfen, zu testen und Planupdates als Reaktion auf probleme zu informieren, die während des Tests erkannt wurden.

Um Resilienz- und Wiederherstellungsstrategien für eine Vielzahl von potenziellen Vorfällen zu validieren, definiert das ERCM-Programm mehrere Kategorien von Testszenarien, die sich auf Personen, Standorte und Technologien auswirken. Die für jeden Dienst erforderliche Überprüfungsebene basiert auf dem Maß, in dem der Dienst kritisch ist, wobei kritischere Dienste einer strengeren Überprüfung unterzogen werden. Jedes Microsoft-Onlinedienstteam testet seinen Geschäftskontinuitätsplan gemäß den ERCM-Richtlinien, um die Effektivität des Plans und die Bereitschaft des Serviceteams zur Ausführung des Plans zu messen.

Gemäß DEN ERCM-Richtlinien müssen jährliche Überprüfungen von Geschäftskontinuitätsplänen und funktionsvalidierung innerhalb von 12 Monaten nach der letzten Überprüfung erfolgen. Die Funktionsüberprüfung muss eine Überprüfung der unterstützenden Dokumentation wie der BIA umfassen, um sicherzustellen, dass sie korrekt bleibt. Microsoft stellt die Ergebnisse der Funktionsüberprüfung für ausgewählte Microsoft-Onlinedienste unseren Kunden über Quartalsberichte zur Verfügung.

Wie stellt Microsoft Onlinedienste sicher, dass die Systemkapazität den Anforderungen entspricht?

Die Kapazitätsplanung hilft Serviceteams dabei, die Ressourcen zuzuordnen, die zur Unterstützung der Verfügbarkeit von Microsoft-Onlinediensten erforderlich sind. Eine regelmäßige Kapazitätsplanung ist im Rahmen des ERCM-Programms von Microsoft erforderlich. Serviceteams überprüfen Kapazitätsdaten während vierteljährlicher Überprüfungen und in Notfallsituationen, die eine größere Kapazitätsüberprüfung erfordern.

Die Rohdaten für die Kapazitätsplanung werden von jedem Serviceteam verwaltet und umfassen Metriken wie Systemverarbeitung, Arbeitsspeicher und Hardwarekapazität. Geplante Überprüfungen verwenden ein Modell der aktuellen Kapazität des Systems und testen es gegen den prognostizierten Bedarf in Notfallsituationen. Wenn das Modell Kapazitätsengpässe anzeigt, werden der Leitung des Serviceteams Änderungsvorschläge zur Prüfung unterbreitet. Genehmigte Änderungen werden in ein neues Modell integriert, bevor es von Serviceteamtechnikern implementiert wird.

Wie kann Microsoft Onlinedienste die Dienstverfügbarkeit bei routinemäßigen Systemausfällen aufrechterhalten?

Microsoft Onlinedienste Dienstresilienz durch redundante Architektur, Datenreplikation und automatisierte Integritätsprüfung erreichen. Redundante Architektur umfasst die Bereitstellung mehrerer Instanzen eines Diensts auf geografisch und physisch getrennter Hardware, wodurch eine höhere Fehlertoleranz für Microsoft Onlinedienste bereitgestellt wird. Die Datenreplikation stellt sicher, dass immer mehrere Kopien von Kundendaten in verschiedenen Fehlerzonen vorhanden sind, sodass kritische Kundendaten wiederhergestellt werden können, wenn sie vom Kunden beschädigt, verloren gehen oder sogar versehentlich gelöscht werden. Die automatisierte Integritätsprüfung erhöht die Datenverfügbarkeit, indem daten automatisch wiederhergestellt werden, die von vielen Arten von physischen oder logischen Beschädigungen betroffen sind.

Die Onlinedienste von Microsoft werden regelmäßig auf Einhaltung externer Vorschriften und Zertifizierungen überprüft. Informationen zur Überprüfung von Steuerelementen im Zusammenhang mit Resilienz und Kontinuität finden Sie in der folgenden Tabelle.

Azure und Dynamics 365

Externe Überwachungen Section Datum des letzten Berichts
ISO 27001/27002

Erklärung der Anwendbarkeit
Zertifikat
A.17.1: Informationssicherheitskontinuität
A.17.2: Redundanzen
6. November 2023
ISO 22301

Zertifikat
Alle Steuerelemente 24. April 2023
SOC 1
SOC 2
SOC 3
BC-1: Geschäftskontinuitätspläne
BC-3: Verfahren für Geschäftskontinuität und Notfallwiederherstellung
BC-4: BCDR-Tests
BC-7: Geschäftskontinuitätspläne für Rechenzentren
BC-8: Geschäftskontinuitätstests für Rechenzentren
BC-9: Bewertung der Rechenzentrumsresilienz
DS-5: Sicherungsschlüsseldienstkomponenten
DS-6: Redundanz kritischer Komponenten
DS-7: Automatische Replikation von Kundendaten
DS-8: Sicherungszeitplan
DS-9: Sicherungswiederherstellungsverfahren
DS-11: Offsite-Sicherungen
DS-14: Automatische Wiederherstellung von Kundendiensten
17. November 2023

Microsoft 365

Externe Überwachungen Section Datum des letzten Berichts
FedRAMP (Office 365) CP-2: Notfallplan
CP-3: Notfalltraining
CP-4: Notfallplantests
CP-6: Alternativer Speicherstandort
CP-7: Alternativer Verarbeitungsstandort
CP-9: Sicherung des Informationssystems
CP-10: Wiederherstellung und Wiederherstellung des Informationssystems
31. Juli 2023
ISO 27001/27002

Erklärung der Anwendbarkeit
Zertifikat
A.17.1: Informationssicherheitskontinuität
A.17.2: Redundanzen
März 2024
ISO 22301
Zertifikat
Alle Steuerelemente März 2024
SOC 1
SOC 2
CA-49: Sicherungsrichtlinien
CA-50: Geschäftskontinuität
CA-51: Datenreplikation
23. Januar 2024
SOC 3 CUEC-09: EXO-E-Mail-Wiederherstellung 23. Januar 2024

Ressourcen