本文說明可用的復原選項,並概述每個選項的規模需求、記憶體效率,以及一般優點和取捨。
Overview
儲存空間直接可為您的資料提供容錯能力,通常稱為「韌性」。 其實作與RAID類似,但不同的是分散式部署於伺服器上,並以軟體方式實作。
和RAID一樣,儲存空間可以採取幾種不同的方式,在容錯、儲存效率與計算複雜度之間做出不同的取捨。 這些大致分為兩類:「鏡像」和「同位」,後者有時稱為「清除編碼」。。
Mirroring
鏡像會保留所有數據的多個複本,以提供容錯功能。 這最類似於RAID-1。 如何對資料進行條帶化和放置並非微不足道(請參閱 此部落格 以了解更多信息),但可以說使用鏡像儲存的任何資料都會被寫入多次,這是絕對正確的。 每個副本都會寫入到不同的實體硬體(不同伺服器中的不同磁碟驅動器),這些驅動器假設會各自獨立發生故障。
您可以選擇兩種鏡像類型 – 「雙向」和「三向」。
雙向鏡
雙重鏡像會將所有內容寫入兩個複本。 其儲存效率為 50% – 若要寫入 1 TB 的數據,您至少需要 2 TB 的實體記憶體容量。 同樣地,您至少需要兩個 硬體「容錯網域」,在使用 Storage Spaces Direct 時,這表示需要兩部伺服器。
Warning
如果您有兩台以上的伺服器,我們建議您改用三重鏡像。
三向鏡
三重鏡像會將所有資料寫入三份副本。 其儲存效率為 33.3%, 若要寫入 1 TB 的數據,您至少需要 3 TB 的實體記憶體容量。 同樣地,您需要至少三個硬體故障域-使用直接儲存空間,這表示三部伺服器。
三向鏡像能夠同時安全地容忍至少兩個硬體問題(磁碟驅動器或伺服器)。 例如,如果您在重新啟動一部伺服器時,突然有另一部磁碟驅動器或伺服器故障,所有數據依然會保持安全並持續可存取。
Parity
奇偶校驗編碼通常稱為“糾刪碼”,使用按位算術提供容錯能力,這可能會變得 非常複雜。 這種運作方式比資料鏡像顯得更不明顯,但有許多非常優秀的線上資源(例如這本第三方的《初學者刪除編碼指南》),能幫助您了解其中的概念。 已足夠表示,它可提供更佳的儲存效率,而不會影響容錯能力。
儲存空間提供兩種同位檢查的類型 — “單一”同位檢查和“雙重”同位檢查,後者在更大規模中採用一種稱為“局部重建碼”的先進技術。
Important
我們建議針對大部分的效能敏感工作負載使用鏡像。 若要深入瞭解如何根據您的工作負載平衡效能和容量,請參閱 規劃磁碟區。
單一奇偶校驗
單位元同位只保留一個位元同位符號,僅能容錯一次故障。 它最類似於RAID-5。 若要使用單一奇偶校驗,您需要至少三個硬體容錯網域,以儲存空間直接存取來說,這表示需要三部伺服器。 由於三向鏡像在相同規模上提供更多的容錯,因此不建議使用單一同位。 但是,如果你堅持使用它,它就在那裡,它是完全支援的。
Warning
我們不建議使用單一校驗位,因為它一次只能安全地容忍一個硬體故障:如果您正在重新啟動一台伺服器,而此時另一台硬碟或伺服器突然故障,您將會遇到停機。 如果您只有三部伺服器,建議您使用三向鏡像。 如果您有四個以上,請參閱下一節。
雙奇偶校驗
雙同位實施 Reed-Solomon 糾錯編碼以保持兩個位同位符號,因此提供與三向鏡像相同的容錯能力(同時最多支援兩次故障),同時保持儲存效率。 它最類似於RAID-6。 若要使用雙重同位元,您需要至少四個硬體容錯域 – 也就是說,在儲存空間直接存取中,這表示需要四部伺服器。 在該規模下,記憶體效率為 50% – 若要儲存 2 TB 的數據,您需要 4 TB 的實體儲存容量。
當您擁有更多的硬體故障網域時,雙重奇偶校驗的儲存效率會從 50% 提高到 80%。 例如,當有七部伺服器(使用 Storage Spaces Direct)時,效率躍升至 66.7%——要儲存 4 TB 的資料,您只需要 6 TB 的實體儲存容量。
請參閱 摘要 部分,了解各種規模的雙方和地方重建規範的效率。
本機重建代碼
儲存空間引進了Microsoft研究院開發的先進技術,稱為「區域重建代碼」或 LRC。 大規模情況下,雙重同位配合使用 LRC 來將其編碼和解碼分割成一些較小的群組,從而減少進行寫入操作或從故障中恢復所需的額外負擔。
使用硬碟(HDD)時,群組大小為四個符號:使用固態硬碟 (SSD),群組大小為六個符號。 例如,以下是硬碟驅動器和12個硬體錯誤容許網域(即12台伺服器)的版面配置外觀:共有兩組四個數據符號。 其可達到 72.7% 的儲存效率。
我們推薦這篇由Claus Joergensen撰寫的深入但非常易讀的逐步解說,講述本地重建代碼如何處理各種失敗情況,以及它們為何吸引人。
鏡像加速同位
儲存空間直接(Storage Spaces Direct)中的磁碟區可以兼具鏡像和同位的部分。 先將資料寫入鏡像部分,然後逐漸移至同位部分。 實際上,這會使用鏡像技術來加速糾刪碼。
若要混合三向鏡像和雙重同位,您需要至少四個容錯網域,這表示四部伺服器。
鏡像加速同位的儲存效率介於純鏡像和純同位的選項之間,具體取決於您選擇的比例。
Important
我們建議針對大部分的效能敏感工作負載使用鏡像。 若要深入瞭解如何根據您的工作負載平衡效能和容量,請參閱 規劃磁碟區。
Summary
本節摘要說明儲存空間直接存取中可用的復原類型、使用每種類型的最低規模需求、每個類型可容許的失敗數目,以及對應的儲存效率。
復原類型
| Resiliency | 容錯 | 儲存效率 |
|---|---|---|
| 雙向鏡 | 1 | 50.0% |
| 三向鏡 | 2 | 33.3% |
| 雙奇偶校驗 | 2 | 50.0% - 80.0% |
| Mixed | 2 | 33.3% - 80.0% |
最小規模需求
| Resiliency | 所需的最小容錯網域數目 |
|---|---|
| 雙向鏡 | 2 |
| 三向鏡 | 3 |
| 雙奇偶校驗 | 4 |
| Mixed | 4 |
Tip
除非您使用 機箱或機架容錯,否則容錯域的數量即指伺服器的數量。 只要您符合 Storage Spaces Direct 的最低需求,每部伺服器中的磁碟數量都不會影響您可以使用的復原類型。
混合式部署的雙重同位效率
下表顯示混合式部署的每個級別雙同位和本機重建碼的儲存效率,其中包含硬碟(HDD)和固態硬碟(SSD)。
| 容錯域 | 版面配置 | Efficiency |
|---|---|---|
| 2 | – | – |
| 3 | – | – |
| 4 | 盧比 2+2 | 50.0% |
| 5 | 盧比 2+2 | 50.0% |
| 6 | 盧比 2+2 | 50.0% |
| 7 | 盧比 4+2 | 66.7% |
| 8 | 盧比 4+2 | 66.7% |
| 9 | 盧比 4+2 | 66.7% |
| 10 | 盧比 4+2 | 66.7% |
| 11 | 盧比 4+2 | 66.7% |
| 12 | LRC (8, 2, 1) | 72.7% |
| 13 | LRC (8, 2, 1) | 72.7% |
| 14 | LRC (8, 2, 1) | 72.7% |
| 15 | LRC (8, 2, 1) | 72.7% |
| 16 | LRC (8, 2, 1) | 72.7% |
全快閃陣列部署的雙重同位元效率
下表顯示在全快閃部署中,每個級別的雙重同位碼和本機重建碼的儲存效率,其中僅包含固態硬碟(SSD)。 同位陣列佈局可以使用較大的群組大小,並在全快閃設定中達到更佳的儲存效率。
| 容錯域 | 版面配置 | Efficiency |
|---|---|---|
| 2 | – | – |
| 3 | – | – |
| 4 | 盧比 2+2 | 50.0% |
| 5 | 盧比 2+2 | 50.0% |
| 6 | 盧比 2+2 | 50.0% |
| 7 | 盧比 4+2 | 66.7% |
| 8 | 盧比 4+2 | 66.7% |
| 9 | 盧比 6+2 | 75.0% |
| 10 | 盧比 6+2 | 75.0% |
| 11 | 盧比 6+2 | 75.0% |
| 12 | 盧比 6+2 | 75.0% |
| 13 | 盧比 6+2 | 75.0% |
| 14 | 盧比 6+2 | 75.0% |
| 15 | 盧比 6+2 | 75.0% |
| 16 | LRC (12, 2, 1) | 80.0% |
Examples
除非您只有兩部伺服器,否則建議您使用三向鏡像和/或雙同位,因為它們提供更佳的容錯能力。 具體而言,它們可確保即使兩個容錯網域——在儲存空間直接存取中,這表示有兩部伺服器——同時遭遇故障的影響,所有數據仍能保持安全且持續可用。
保持一切在線的範例
這六個範例顯示了三向鏡像和/或雙奇偶校驗 可以容忍 什麼。
- 1. 一個驅動器丟失(包括緩存驅動器)
- 2. 丟失一台服務器
- 3. 一台伺服器和一個磁碟機遺失
- 4. 兩個驅動器在不同的服務器中丟失
- 5. 超過兩個驅動器丟失,只要最多兩台服務器受到影響
- 6. 兩台伺服器遺失
...在每個情況下,所有磁碟區都會保持在線狀態。 請確保您的叢集維持法定人數。
所有事物皆離線的範例
在其存留期內,儲存空間能承受多次故障,因為在每次故障後,若給予充足時間,它都能恢復到完全復原的狀態。 不過,在任何時刻,最多會有兩個容錯網域能安全地受到故障的影響。 因此,以下是三向鏡像和/或雙奇偶校驗 不能容忍 的範例。
- 7. 驅動器同時在三台或更多服務器中丟失
- 8. 同時丟失三台或更多服務器
Usage
查看 * 建立磁碟區 * 。
後續步驟
如需本文所提及主題的進一步閱讀,請參閱下列內容: