Erkunden des Microsoft-Programms für Unternehmensresilienz und Krisenmanagement (ENTERPRISE Resilience and Crisis Management, ERCM)

Abgeschlossen

Die Resilienz ist eine kritische Komponente der Verfügbarkeit von Microsoft-Diensten, aber selbst robuste Dienste können durch unerwartete Ereignisse beeinträchtigt werden. Das Ercm-Programm (Enterprise Resilience and Crisis Management) von Microsoft trägt dazu bei, sicherzustellen, dass unsere Onlinedienste darauf vorbereitet sind, sich nach unerwarteten Ereignissen schnell zu erholen.

ERCM-Teamstruktur

Das ERCM-Programm office bietet Governance, Aufsicht und Unterstützung für business continuity management (BCM) in Microsoft. Der dazugehörige Rat für Geschäftskontinuität (Business Continuity Council), der sich aus Vertretern des leitenden Managements von Microsoft zusammensetzt, hat die Aufgabe, die Förderung der Geschäftskontinuität, das Bewusstsein, die Ressourcenzuweisung und die Programmverantwortung in ihren jeweiligen Geschäftsbereichen voranzutreiben. Gemeinsam treiben diese Teams die Einhaltung des Frameworks von Microsoft-Geschäftskontinuitätsmanagement (BCM) im gesamten Unternehmen voran.

Jede Microsoft-Geschäftseinheit muss die Ziele des Microsoft ERCM-Programms erfüllen. Zur Unterstützung der ERCM-Ziele bestimmt jede Geschäftseinheit einen Vertreter oder Business Continuity Lead (BCL), der die ERCM-Implementierungsaktivitäten innerhalb ihrer Geschäftseinheit leitet und koordiniert. Dieser Vertreter dient als Hauptansprechpartner für alle Fragen der Kontinuität und Resilienz. Die meisten BCLs verlassen sich auf ein Team von Personen, die bei der Durchführung von Kontinuitätsprogrammen innerhalb ihrer Geschäftseinheit helfen. Diese Personen werden oft als Experten, Fachexperten (Subject Matter Experts, SMEs) oder Programmverwalter bezeichnet.

Das ERCM-Programmbüro verwaltet eine Datenbank aller Onlinedienste, einschließlich Upstream- und Downstreamabhängigkeiten, die als zentrales Repository für Informationen zur Geschäftskontinuität in unseren Onlinediensten dienen. Außerdem werden alle relevanten Dokumentationen, Überprüfungen und Testtermine aufgezeichnet. Serviceteams werden automatisch benachrichtigt, wenn ihre ERCM-Dokumentation oder -Prozesse aktualisiert oder getestet werden müssen.

Die ERCM-Programm-Office- und individuellen Dienst-BCLs arbeiten mit Microsoft Enterprise Governance Risk & Compliance (EGRC) zusammen, um alle Risiken auf Unternehmensebene hervorzuheben, die im Rahmen von jährlichen Plantests und -überprüfungen identifiziert werden. Auf diese Weise hervorgehobene Risiken erhalten eine Risikobewertung, einen Verantwortlichen für die Behebung und werden bis zu ihrer Behebung nachverfolgt. Die ERCM-Koordination verfolgt einen One Microsoft-Ansatz und führt zu einer engmaschigen Beziehung zwischen Partnerteams. Die folgende Liste enthält die Teams, die an ERCM-Aktivitäten im Zusammenhang mit Microsoft 365 beteiligt sind:

  • EGRC (Enterprise Governance Risk & Compliance) – Team, das für die Berichterstattung auf Unternehmensebene über Risiken/Compliance und das Auffinden aktueller Informationssicherheitsstandards verantwortlich ist, die mit der Sicherheitsrichtlinie von Microsoft, den Implementierungsverfahren und anerkannten Industriestandards übereinstimmen. Verwaltet das Gesamtrisiko für Microsoft, einschließlich risiken im Zusammenhang mit ERCM.
  • ERCM Program Office – Team, das für die Verwaltung des Microsoft ERCM-Programms verantwortlich ist, einschließlich Resilienzstandards, Richtlinien, Schulungen und Metriken.
  • Business Continuity Council – Hochrangige Vertreter jeder Geschäfts-/Engineering-Funktion, wie z. B. Microsoft 365, die an gruppenübergreifenden Plänen und allgemeinen Richtlinien zusammenarbeiten.
  • Business Continuity Leads – Personen aus den einzelnen Diensten, welche die Kontinuitäts- und Resilienzbemühungen innerhalb ihrer Geschäftseinheit leiten (beispielsweise Azure, Microsoft 365, Dynamics).
  • Business Continuity Champions – Einzelpersonen aus jedem Dienstteam, z. B. Exchange Online oder Microsoft Teams, welche die Bemühungen um Geschäftskontinuität und Notfallwiederherstellung (Business Continuity and Disaster Recovery, BCDR) für ihr Dienstteam leiten (beispielsweise Azure Blob Storage, Exchange, Power BI).
  • Workload DevOps – Ingenieure innerhalb von Dienstteams, die für die Entwicklung von Funktionen, den täglichen Betrieb und die Unterstützung von Live-Site-Problemen einschließlich BCDR-Aufgaben zuständig sind (beispielsweise Vorfallmanager, Bereitschaftsingenieure, DevOps-Teams).
  • Microsoft 365 Vorfallkommunikation und -koordination – Microsoft 365-Team, das während eines Vorfalls von Microsoft 365-Diensten als zentraler Knotenpunkt für die interne und externe Kommunikation fungiert und für die Benachrichtigung der Kunden über dienstbeeinflussende Vorfälle über das Microsoft 365 Service Health Dashboard und andere Kommunikationsplattformen verantwortlich ist.
  • Kundendienst und Support – Team zuständig für die Bearbeitung von Problemen, die von Kunden gemeldet wurden. Dient als erste Anlaufstelle für Kunden im Falle eines Vorfalls.

BCM-Framework

Das ERCM-Programm von Microsoft erleichtert nicht nur die Zusammenarbeit bei der Geschäftskontinuität, es bietet ein konsistentes BCM-Framework, das von Geschäftseinheiten im gesamten Unternehmen implementiert wird. Dieses Framework befasst sich mit der Wiederherstellung und Kontinuität von kritischen Geschäftsfunktionen, Diensten und Daten, die zur Aufrechterhaltung eines akzeptablen Betriebsniveaus während eines Vorfalls erforderlich sind. Die Verwendung eines gemeinsamen Frameworks gewährleistet die Existenz effektiver, zuverlässiger, gut getesteter Pläne, Systeme und Prozesse, auf die man sich verlassen kann, um die Geschäftskontinuität zu unterstützen und nachteilige Auswirkungen während eines störenden Ereignisses zu minimieren.

Diagramm, das zeigt, wie das ERCM-Programm mit Microsoft Business Units funktioniert. Das ERCM-Programm ist für Governance, Compliance und Anleitungen verantwortlich. Microsoft Business Units sind für die Einhaltung der ERCM-Methodik und -Richtlinie verantwortlich und arbeiten mit dem ERCM-Programm in verschiedenen Aspekten zusammen.

BCM-Lebenszyklus

Der BCM-Lebenszyklus ist der Kern unserer BCM-Methodik. Dieser Prozess ist so konzipiert, dass er anpassungsfähig ist, so dass er von einer Vielzahl von Geschäftsmodellen bei Microsoft implementiert werden kann. Die Phasen des BCM-Lebenszyklus leiten jede Geschäftseinheit bei Microsoft durch die Entwicklung und Implementierung effektiver Pläne für Geschäftskontinuität und Resilienz.

Der BCM-Lebenszyklus umfasst drei übergeordnete Phasen. Es beginnt mit einer ersten Bewertung, bei der kritische Prozesse und Ziele identifiziert werden, die in das Geschäftskontinuitätsprogramm aufgenommen werden sollten. In der Phase Planung liegt der Schwerpunkt auf der Entwicklung und Umsetzung von Resilienz- und Wiederherstellungsstrategien sowie deren Dokumentation in offiziellen Geschäftskontinuitätsplänen. Schließlich testet Kapazitätsüberprüfung die Geschäftskontinuitätspläne und ihre Implementierungen, um die Wirksamkeit zu überprüfen und Verbesserungen zu identifizieren.

Diagramm des BCM-Lebenszyklus – Bewertung, Planung und Kapazitätsüberprüfung

Weitere Informationen