共用方式為


資料中心架構與基礎結構

Microsoft數據中心的設計目的是要實作深層防禦策略,採用多層保護來可靠地保護我們的雲端架構和支援基礎結構。 備援內建在多個層級的所有系統中,以支持數據中心可用性。

Microsoft具有高度安全的數據中心設施,全球各地都建立了分散式數據中心基礎結構,支持數千個 線上服務。 這個全域散發的基礎結構旨在讓應用程式更接近使用者、保留數據落地,併為客戶提供完整的合規性和復原選項。

區域是一組數據中心,可透過龐大且具復原性的網路進行互連。 區域會組織成地理位置,讓具有特定數據落地和合規性的客戶能夠讓其數據和應用程式保持接近。 內建容錯功能可讓地理位置透過與專用、高容量網路基礎結構的連線,承受完整的區域失敗。

區域內實際分開的位置稱為可用性區域,每個區域都是由一或多個配備獨立電源、冷卻和網路的數據中心所組成。 可用性區域可讓任務關鍵性應用程式以高可用性和低延遲複寫來執行。

下圖顯示全域基礎結構如何將相同數據落地界限內的區域和可用性區域配對,以獲得高可用性、災害復原和備份。

數據落地界限。

地理位置分散的數據中心可讓Microsoft讓服務更接近客戶、減少網路等待時間,以及允許異地備援備份和故障轉移。

可用性

Microsoft數據中心已設計成提供 99.999% 的可用性,以符合客戶 SLA 和服務需求。 Microsoft在提供 24x7x365 服務之設施的全球營運、管理、網路和永續性方面投入了大量投資。

合規性標準和需求

Microsoft已投資超過 150 億美元建置我們的全球基礎結構,以及超過 90 億美元的研究和開發,以提高效率並推動創新。 因此,Microsoft的數據中心發展速度會比產業中許多設施更快,因此不會遵循傳統數據中心標準所述的規範性需求。 除了執行其中一個全球最大數據中心組合所帶來的豐富作見解之外,Microsoft使用 IEEE 金書數據和第三方可靠性模擬軟體,持續改善數據中心設計標準。 Microsoft數據中心會廣泛稽核為合規性組合中所述數個法規稽核的一部分。 Microsoft數據中心的成熟度層級可以透過合規性組合進行評估,特別是針對復原,也可評估 ISO 22301 認證。

雖然Microsoft運作的程式符合 ANSI/TIA-942 Datacenters 的電信基礎結構 Standard,但此標準的一部分不適用於Microsoft或與其他法規和/或國家/地區特定需求發生衝突。 此外,Microsoft選擇使用更以效能為基礎的方法來符合客戶需求。

資料和網路備援

關鍵資料中心設施採用多層備援系統,以利承受錯誤,並盡可能避免服務中斷。 磁碟層級的本機備援儲存體可保護區域內的資料,而異地備援儲存體則提供區域內的備援。 為了確保可靠的網路通訊,Microsoft 擁有並運用各種不同的光纖路由和備援硬體,以保護重要元件,避免故障或服務中斷。

異地復寫可用來為替代地理位置提供備援。 數據持久性是透過在不同數據中心內的多個資料庫間同步複寫數據來取得。 系統會針對雲端擁有的所有備份數據執行還原測試。 災害復原是透過異步複寫至不同地理區域中的數據中心來達成。

容量

雲端作業是一個專門的容量小組,可預測未來的需求,以確保必要的容量已結構化,並可供客戶和內部使用。 系統會受到監視,以確保可接受的服務效能、可用性、服務使用率、記憶體使用率、網路等待時間,以及稽核記錄容量。 Microsoft也會保護數據中心抵禦阻斷服務攻擊對頻寬、交易容量和記憶體容量的影響。

所有服務小組都包含容量規劃作為其數據中心模型和數據復寫計劃的重要功能,以確保資訊處理、電信和環境支援都有必要的容量。

Power

Microsoft的數據中心具有專用的 24x7 不間斷電源供應器, (UPSs) 和緊急電源支援,其中包括提供備份電源的現場發電機。 對 UPS 和發電機進行定期維護和測試, 且作業小組會與本地廠商簽訂遞送緊急燃料的合約協議。 資料中心也有專用的設備作業中心來監控電力系統,包括重要的電子元件。

Microsoft數據中心配備保護空間和適當的纜線標籤。 電源基礎結構設備會放置在經過工程設計來防範環境風險的環境中。 所有可攜式 線上服務 的資產都必須就地鎖定或載入,以提供防護來防範遭竊或移動損毀。 電源線會在樓層下執行、纜線匣中的額外負荷,以及在封包內執行,以防止行動元件和意外損壞。 所有電力空間都位於卡片閱讀機後方,或視需要進行其他密鑰鎖定。 系統會透過視訊監視來監視入口、外部入口和設備設備。 電源系統也會利用備援作為保護形式,將多個電源/公用程式饋送至設備、發電機和UPS系統。

系統會實作長期替代電源供應器,以最少所需的作功能來維護電源。 當電源故障或降到無法接受的電壓等級時,UPS 系統會立即上線。 這會提供足夠的電源來執行伺服器,直到產生器可以接管為止。 緊急發電機會針對延長中斷、計劃性維護提供備份電源,並在發生天然災害時,使用現場燃料保留來作數據中心。

Microsoft數據中心 (已租用且完全受控的) 在 UPS 和產生器系統所備份的專用線路上,以額外負荷緊急光源的形式實作緊急光源。 自動緊急照明是根據國家防火與保護關聯 (NFPA) 生命安全代碼或適用的當地法規/法律來實作。 如果公用程式電源中斷,緊急照明會自動切換為UPS和產生器系統所提供的電源。 數據中心內的緊急光源系統會進行例行維護,以確保它們保持正常工作順序。

維護

系統維護原則和程式是根據Microsoft的在線服務實體和環境安全 Standard。 系統會定期維護所有Microsoft設備和系統,以確保營運效率。 任何設備或系統的維護都必須根據製造商的建議執行、由授權的人員執行,並記錄在維護票證中。

有兩個資產小組會維護不同類型的系統:

  • 重要環境 (CE) 小組:

    • CE 是一個小組,為組成設備作基礎結構的電力、機械和實體系統提供設備管理。 CE 小組會排程、執行、檔及檢閱在CE元件上執行的所有維護活動。 Microsoft數據中心依賴計算機化系統來管理維護排程和工作順序。
    • Datacenter 管理 (DCM) 負責在月臺或遠端執行的所有 CE 維護。 CE 維護是在稱為程式 (MOP) 的必要逐步文件中規定。 在開始任何工作之前,數據中心管理會先檢閱/核准 MOP。
  • 網站服務 小組:

    • 「站臺服務」是提供Microsoft在線服務資產服務的小組,這些資產位於Microsoft數據中心。 DC Site Services 小組為屬於從數據中心布建服務之屬性的資產,提供智慧型手機動/斷手修正服務。 例如,需要實體維護的資產可能會向DC Site Services小組要求智慧型手機服務。 Microsoft資產上的所有網站服務工作都會在工作流程票證工具內的工作票證中排程、執行、記載及檢閱,而且沒有核准的工作票證,就無法進行任何工作。
    • 技術計劃經理 (TPM) 和 DCM 小組負責數據中心內發生的所有月臺服務工作,以及需要在異地傳輸資產的工作。 月臺服務維護會在受實體安全性機制控制及保護的數據中心區域中執行。

如果需要從設備移除 CE 元件,DCM 會核准處理設備。 在大部分情況下,CE元件會接收現場維護,而且不會從設施中移除。 屬性資產 (例如,需要異地傳輸的網路裝置或伺服器) 必須具有明確的資產擁有者核准。

除非將雲端內的數位媒體移至終結,否則無法從共置空間傳輸數字媒體。 當這些資產要終結時,這些資產會儲存在鎖定的記憶體間隔中,而這些存放站位於[負載] 相機涵蓋範圍之下。 當資產準備好要終結時,資產管理的實體安全性人員和Microsoft的全職員工必須將鎖定的間隔從共置空間擷取到發生現場壓縮的位置。 當數據中心發生壓縮,且受到Microsoft監督時,Microsoft資產不會離開數據中心的受控制區域。

所有維護工作都必須在工作開始之前核准,包括系統維護工具的存取權。 Microsoft基礎結構已藉由在 Datacenter Access Tool (DCAT) 內建立存取層級來實作維護工具控件。 每個設施都包含受限制的實體鎖定方塊或存取控制空間,可用來儲存特製化維護工具。 DCAT 工具會控制對鎖定方塊或儲存空間的存取,以禁止未經授權的維護工具存取。 此程式可確保只有具有核准存取權的人員可以存取工具。 月臺服務小組會執行例行清查檢查,以確認所有工具的狀態。 數據中心管理小組和實體安全性小組每季會執行DCAT存取清單的稽核,讓維護人員的存取清單保持在最新狀態。 人員終止或轉移會透過手動更新存取清單立即反映。 系統會在存取徽章讀取器記錄中追蹤鎖定方塊或維護儲存空間的存取權,這些記錄可供任何調查使用。

月臺服務小組會維護已核准維護工具的清查,以便在數據中心內使用。 系統會指示維護人員使用提供的維護工具。 Datacenter 管理 (需要 DCM) 核准,才能使用資料中心未提供的工具。 實體手部工具不受此類型的控制。

Microsoft數據中心會維護常駐維護人員,以支援重要數據中心基礎結構系統, (月臺服務小組) (「重大環境」小組) 和數據中心作業。 重要環境和月臺服務小組已識別出他們維護現場備援的重要安全性和技術系統元件。 重要資訊系統服務是從多個數據中心布建,以避免因為其中一個數據中心發生事件而中斷服務。