實作延展式叢集
傳統上,容錯移轉叢集可為位於相同實體位置的一或多個叢集節點提供預防區域性失敗的高可用性保護。 如果需要在多個實體位置提供對等的功能,您可以使用延展式叢集。
什麼是延展式叢集?
延展式叢集可跨兩個不同的實體位置實作高可用性和災害復原。 這兩個位置都裝載各自的儲存系統,施行從主要網站到次要網站的單向同步複寫。 如果失敗影響到主要網站的可用性,為了盡可能縮短停機時間,叢集會自動將其工作負載轉換至次要網站中的節點。 對於主要網站上的計劃性維護,您可以使用 Hyper-V 即時移轉順暢地將工作負載轉換至另一個網站,以避免發生整體性的停機。
使用延展式叢集,可提供數個優於手動維護災害復原網站的好處:
- 叢集工作負載的自動複寫和自動容錯移轉。
- 降低系統管理額外負荷。
- 盡可能避免人為錯誤,這是手動程序固有的問題。
另一方面,延展式叢集的設計和實作較為複雜。 這通常也需要額外投資於儲存體和網路基礎結構。
儲存體複本概觀
延展式叢集會運用儲存體複本,這是一項 Windows Server 功能,可提供伺服器或叢集之間的磁碟區複寫,以供災害復原之用。 藉由使用儲存體複本,延展式叢集將可同步連結至兩個不同位置中的延展式叢集節點的儲存磁碟區。
儲存體複本支援同步和非同步複寫:
- 同步複寫會透過低延遲網路複寫資料 (來回時間僅數毫秒),確保在容錯移轉期間不會遺失檔案系統層級的資料。
- 非同步複寫會以較長的距離複寫資料 (因而受限於較高的延遲),但不保證兩個網站在容錯移轉時會有相同的資料複本。
這很重要
延展式叢集需要同步複寫。 這項需求會在複寫網站中的兩個叢集節點群組之間施加 5 毫秒的來回網路延遲限制。 根據實體網路連線特性,此條件約束通常會轉譯為大約 20-30 英哩的距離。
儲存體複本功能
下表列出儲存體複本的主要功能。
| 特徵 / 功能 | Description |
|---|---|
| 區塊層級複寫 | 有了區塊層級複寫,就不可能會發生檔案鎖定。 |
| 簡單性 | 您可以依賴 Windows Admin Center 引導您完成在兩部伺服器之間建立複寫合作關係的流程。 若要部署延展式叢集,您可以使用以容錯移轉叢集管理員為基礎的精靈。 |
| 使用伺服器訊息區 (SMB) 3.0 | 儲存體複本依賴 SMB 3.x,此工具是在 Windows Server 2012 中導入的,然後在 Windows Server 的後續版本中大幅增強。 SMB 的進階特性,例如 SMB 多重通道和 SMB 直接傳輸,皆可供儲存體複本使用。 |
| 安全性 | 儲存體複本具有各式各樣的安全性機制,包括封包簽署、AES-128-GCM 完整資料加密、支援協力廠商加密加速,以及預先驗證完整性中間人攻擊防護。 儲存體複本也在節點之間依賴 Kerberos AES256 進行所有驗證。 |
| 網路條件約束 | 在複寫磁碟區之間有多個網路路徑的情況下,您可以將儲存體複本流量設為使用指定的網路介面卡。 這可讓您將複寫流量對生產工作負載的潛在影響降到最低。 |
| 精簡佈建 | 您可以選擇在儲存空間直接存取中實作精簡佈建,將初始複寫時間降至最低。 |
部署延展式叢集的必要條件
實作延展式叢集的必要條件包括:
叢集節點必須是相同或受信任 AD DS 樹系的成員。
每個叢集節點至少應有 2 GB 的 RAM,且每個伺服器要有兩個 CPU 核心。
每個叢集節點都應執行 Windows Server 2025 Datacenter 或 Windows Server 2016 Datacenter Edition。 您可以使用 Windows Server 2025 Standard Edition,但這類設定僅支援單一磁碟區 (大小上限為 2 TB) 的複寫。
每個叢集節點至少應有 1 個 Gigabit Ethernet 介面卡來進行同步複寫,但最好使用遠端直接記憶體存取 (RDMA)。
主要和次要網站要有兩組磁碟區 (一組用於資料,另一組用於記錄),且設定如下:
磁碟必須初始化為 GUID 磁碟分割表格 (GPT),而不是主開機記錄 (MBR)。
- 磁碟區應格式化為 ReFS 或 NTFS。
- 資料磁碟區大小和磁區大小必須相符。
- 記錄磁碟區大小和磁區大小必須相符。
- 記錄磁碟區應該使用比資料磁碟區更快的儲存體。
- 記錄磁碟區不能用於任何其他工作負載。
在兩個網站之間,透過網際網路控制訊息通訊協定 (ICMP)、SMB (連接埠 445,外加適用於 SMB 直接傳輸的連接埠 5445),以及 Web 服務管理 (WS-MAN) (連接埠 5985),進行雙向連線。
伺服器之間的網路,須有足夠的頻寬可因應叢集工作負載的 I/O 寫入,以及小於 5 毫秒的來回延遲。
部署延展式叢集的考量
並非每個工作負載和各種案例都適用延展式叢集。 當您設計延展式叢集解決方案時,請明確識別組織的需求和期望。 此外請留意,相較於所有節點都位於相同實體位置中的傳統叢集,延展式叢集的管理負荷會更高。 您也應審慎考量仲裁見證的最佳選擇,使其能夠在災害影響到整個實體網站時保有最大的可用性。
這很重要
具狀態的應用程式和服務 (例如 Microsoft SQL Server、Hyper-V、Microsoft Exchange Server 和 AD DS) 應使用本身的原生復原機制,而非依賴延展式叢集來實現高可用性。
在延展式叢集中進行容錯移轉和容錯回復的考量
在規劃部署延展式叢集的過程中,您必須定義其容錯移轉和容錯回復設定,並考量下列事項:
- 基礎結構相依性。 您應明確定義在容錯移轉至次要網站後仍可供使用的重要服務,例如 AD DS、DNS 和 DHCP。
- 仲裁模型。 選擇適當的仲裁模型以便在容錯移轉後保有叢集功能,是很重要的。
- 服務發佈和名稱解析。 如果您有發佈給內部或外部使用者的服務 (例如電子郵件和網頁),請您注意,在某些情況下,容錯移轉至另一個網站時需要變更名稱或 IP 位址。 在這種情況下,您應該要有在內部或公用 DNS 中變更 DNS 記錄的程序。 若要縮短停機時間,建議您降低重要 DNS 記錄的存留時間 (TTL) 值。
- 用戶端連線能力。 發生災害時,容錯移轉計畫必須能夠處理從用戶端應用程式到叢集工作負載的連線。 這包括內部和外部用戶端。
- 容錯回復程序。 您應規劃並實作要在主要網站恢復上線後執行的容錯回復程序。 容錯回復和容錯移轉同樣重要,因為若未正確執行容錯回復,可能會導致資料遺失和服務停止運作。
建立延展式叢集
您可以使用 Windows Admin Center、容錯移轉叢集管理員或 Windows PowerShell 來建立延展式叢集。 Windows Admin Center 可引導您完成佈建程序並將大部分的設定工作自動化,而簡化延展式叢集的實作。 這包括支援:
- 超融合式叢集 (容錯移轉叢集、Hyper-V 和儲存空間直接存取)。
- 儲存體叢集 (容錯移轉叢集和儲存空間直接存取)。
備註
使用容錯移轉叢集管理員或 Windows PowerShell 建立延展式叢集的程序較為複雜。 這兩種方法都需要逐一執行各個中繼實作步驟。 簡言之,首先必須要建立傳統、非延展的容錯移轉叢集,其中包含主要和次要網站中的所有節點。 建立叢集並完成其驗證後,您必須在每個網站中分別建立一組儲存磁碟區。 最後,您必須設定儲存體複本,以在兩個網站之間複寫儲存磁碟區。