處理 Microsoft 365 中的數據損毀

在大量數據和獨立系統下,執行大規模雲端服務的其中一個挑戰性層面是如何處理數據損毀。 資料損毀可能是由下列原因所造成:

  • 應用程式或基礎結構 Bug,損毀部分或所有應用程式狀態
  • 導致數據遺失或無法讀取數據的硬體問題
  • 人為操作錯誤
  • 惡意駭客和心不在心的員工
  • 外部服務中導致數據遺失的事件

因為數據完整性的復原能力越高,表示數據損毀事件較少,所以 Microsoft 已內建 Microsoft 365 保護機制來防止損毀發生,以及可讓我們在發生時復原數據的系統和程式。 檢查和程式存在於工程發行程式的各種階段內,以提高數據損毀的復原能力,包括:

  • 系統設計
  • 程式代碼組織和結構
  • 程式代碼檢閱
  • 單元測試、整合測試和系統測試
  • 車程線路測試/閘道

在 Microsoft 365 生產環境中,數據中心之間的對等複寫可確保任何數據一律有多個實時複本。 標準映像和腳本可用來復原遺失的伺服器,並使用復寫的數據來還原客戶數據。 在 Exchange Online 中,每個信箱都會裝載於資料庫可用性群組 (DAG) ,並復寫到相同區域內地理位置不同的數據中心。 每個信箱資料庫都有四個在 DAG 內的數據中心散發的復本:一個使用中復本、兩個最新復本,以及一個 7 天延遲的複本,用於發生嚴重邏輯損毀的罕見事件。 針對 SharePoint 和 OneDrive, 檔案會同時寫 入主要和次要數據中心區域。 多種類型的 總和檢查碼 會儲存在元數據中與對應檔案不同的位置,並用來確保數據生命週期的所有階段的數據完整性。

由於內建數據復原檢查和程式,Microsoft 只會維護 Microsoft 365 資訊系統文件的備份 (包括安全性相關文件) ,使用 SharePoint Online 中的內建複寫和我們的內部程式代碼存放庫工具 Source Depot。 系統檔會儲存在 SharePoint Online 中,而 Source Depot 則包含系統和應用程式映射。 SharePoint Online 和 Source Depot 都會使用版本控制,並以近乎即時的方式複寫。

資源