探索 Microsoft 的企業復原和危機管理 (ERCM) 計劃

已完成

復原能力是 Microsoft 服務可用性的重要組成部分,但即使是復原服務也可能受到意外事件的影響。 Microsoft 的企業復原與危機管理 (ERCM) 計劃可協助確保我們的 線上服務 已準備好從非預期的事件快速復原。

ERCM 小組結構

ERCM 計劃 Office 為整個 Microsoft 的 BCM) 提供商務持續性管理 (控管、監督和支援。 由 Microsoft 資深管理代表組成的相關商務持續性委員會已安排在其各自業務單位推動商務持續性贊助、認知、資源配置和計畫責任。 這些小組共同推動整個企業遵循 Microsoft 商務持續性管理 (BCM) 架構。

每個 Microsoft 業務單位都必須符合 Microsoft ERCM 計劃的目標。 為了支援 ERCM 目標,每個業務單位都會指定代表業務持續性潛在客戶 (BCL) ,以在其業務單位內領導和協調 ERCM 實作活動。 此代表作為所有復原和持續性問題的主要連絡點。 大多數 BCL 依靠個人小組協助其業務單位執行持續性計畫。 這些個人通常被稱為精英、主題專家 (SME) 或專案經理。

ERCM 計劃 Office 會維護所有 線上服務 的資料庫,包括上游和下游相依性,作為整個 線上服務 商務持續性資訊的中央存放庫。 它還記錄所有相關文件、檢閲和測試日期。 當服務小組的 ERCM 檔或程式需要更新或測試時,會自動收到通知。

ERCM 計劃 Office 和個別服務 BCL 會與 Microsoft 企業治理風險 & 合規性 (EGRC) 搭配運作,以醒目提示在年度計劃測試和檢閱中識別為一部分的任何企業層級風險。 以這種方式醒目提示的風險將被指派風險評分、推動補救的擁有者,並且在其得到解決前將一直被追蹤。 ERCM 協調採用一個 Microsoft 方法,並在合作夥伴小組之間產生緊密關聯性。 下列清單概述與 Microsoft 365 相關的 ERCM 活動所涉及的小組:

  • 企業控管風險與合規性 (EGRC) – 團隊負責企業級風險/合規性報告,並尋找符合 Microsoft 安全性原則、實作程序和公認行業標準的目前資訊安全標準。 管理 Microsoft 的整體風險,包括與 ERCM 相關聯的風險。
  • ERCM 計劃 Office – 負責管理 Microsoft ERCM 計劃的小組,包括復原標準、原則、訓練和計量。
  • 商務持續性委員會 — 來自各業務/工程職能部門 (如 Microsoft 365) 的高階代表,他們跨團隊計畫和整體原則合作。
  • 商務持續性負責人–在其業務部門 (如 Azure、Microsoft 365、Dynamics) 內領導每項持續性和復原工作服務的人員。
  • 商務持續性精英–來自每個服務團隊 (如 Exchange Online 或 Microsoft Teams) 的個人,他們為其服務團隊 (如 Azure Blob 儲存體、Exchange、Power BI) 領導商務持續性和嚴重損壞修復 (BCDR) 工作。
  • 工作負載 DevOps – 服務團隊中負責功能開發、日常作業和支援包括 BCDR 職責 (例如,事件管理員、待命工程師、DevOps 團隊) 在内之即時網站問題的工程師。
  • Microsoft 365 事件通訊與協調 – 在 Microsoft 365 服務事件期間充當內部和外部通訊中心樞紐的 Microsoft 365 團隊,其負責透過 Microsoft 365 服務健康情況儀表板和其他通訊平台向客戶通知影響服務的事件。
  • 客戶服務與支援 - 負責處理客戶報告問題的團隊。 在發生嚴重損壞時,作為客戶的第一連絡點。

BCM 架構

除了促進商務持續性合作之外,Microsoft 的 ERCM 計劃還提供一致的 BCM 架構,由整個企業的業務單位實作。 該架構解决了在事件期間維持可接受作業水準所需的關鍵商務功能、服務和資料的復原和持續性問題。 使用一般架構可確保存在有效、可靠、經過充分測試的計畫、系統和處理序,它們可用於支援商務持續性,並在中斷事件期間將不利影響降至最低。

顯示 ERCM 程式如何與 Microsoft 商務單位搭配運作的圖表。ERCM 計劃負責治理、合規性和指引。Microsoft 業務單位負責遵循 ERCM 方法和原則,並以不同層面與 ERCM 計劃共同作業。

BCM 生命週期

BCM 生命週期是 BCM 方法的核心。 該流程設計為易調整,因此可以透過 Microsoft 的各種商務模型來實作。 BCM 生命週期的階段會透過開發和實作有效的商務持續性和復原計劃,引導 Microsoft 的每個業務單位。

BCM 生命週期包括三個高等級階段。 它從初始評定開始,包括識別應包括在商務持續性計畫中的關鍵處理序和目標。 規劃階段著重於開發及實施復原和修復策略,以及將其記錄在官方商務持續性計畫中。 最後,功能驗證測試商務持續性計畫及其實作,以驗證效能並識別改進。

BCM 生命週期圖表 - 評定、規劃和功能驗證

深入了解