Odolnost proti chybám a efektivita úložiště v clusterech Azure Stack HCI a Windows Server
Platí pro: Azure Stack HCI verze 22H2 a 21H2; Windows Server 2022, Windows Server 2019
Tento článek vysvětluje dostupné možnosti odolnosti a popisuje požadavky na škálování, efektivitu úložiště a obecné výhody a kompromisy každého z nich.
Přehled
Prostory úložiště s přímým přístupem poskytuje pro vaše data odolnost proti chybám, často označovanou jako odolnost. Jeho implementace je podobná raid, kromě toho, že je distribuovaná napříč servery a implementovaná v softwaru.
Stejně jako u RAID existuje několik různých způsobů, Prostory úložiště to udělat, které představují různé kompromisy mezi odolností proti chybám, efektivitou úložiště a složitostí výpočetních prostředků. Ty obecně spadají do dvou kategorií: "zrcadlení" a "parita", druhá kategorie se někdy nazývá "kódování mazání".
Zrcadlení
Zrcadlení zajišťuje odolnost proti chybám tím, že uchovává více kopií všech dat. To se nejvíce podobá RAID-1. Způsob, jakým jsou data prokládání a umísťování, není triviální (více se dozvíte na tomto blogu ), ale je naprosto pravda, že všechna data uložená pomocí zrcadlení jsou zapsána v celém rozsahu několikrát. Každá kopie se zapisuje na jiný fyzický hardware (různé jednotky na různých serverech), u kterého se nezávisle předpokládá selhání.
Můžete si vybrat mezi dvěma variantami zrcadlení – obousměrným a třícestným.
Dvoucestný zrcadlový svazek
Dvoucestné zrcadlení zapisuje dvě kopie všeho. Efektivita úložiště je 50 procent – k zápisu 1 TB dat potřebujete aspoň 2 TB fyzické úložné kapacity. Stejně tak potřebujete aspoň dvě hardwarové domény selhání – s Prostory úložiště s přímým přístupem to znamená dva servery.
Upozornění
Pokud máte více než dva servery, doporučujeme místo toho použít třícestné zrcadlení.
Třícestný zrcadlový svazek
Třícestné zrcadlení zapisuje tři kopie všeho. Efektivita úložiště je 33,3 % – k zápisu 1 TB dat potřebujete aspoň 3 TB fyzické úložné kapacity. Stejně tak potřebujete aspoň tři hardwarové domény selhání – s Prostory úložiště s přímým přístupem, to znamená tři servery.
Trojcestné zrcadlení může bezpečně tolerovat alespoň dva hardwarové problémy (jednotku nebo server) najednou. Pokud například restartujete jeden server, když náhle selže jiná jednotka nebo server, všechna data zůstanou v bezpečí a nepřetržitě dostupná.
Parity
Paritní kódování, často označované jako kódování mazání, poskytuje odolnost proti chybám pomocí bitové aritmetické metody, která může být pozoruhodně komplikovaná. Způsob, jakým to funguje, je méně zřejmý než zrcadlení a existuje mnoho skvělých online zdrojů (například tento průvodce pro fiktivní kódování třetích stran), které vám můžou pomoct pochopit, co potřebujete. Stačí říct, že poskytuje lepší efektivitu úložiště bez ohrožení odolnosti proti chybám.
Prostory úložiště nabízí dva druhy parity – "jednoduchou" a "duální" paritu, druhá varianta využívá pokročilou techniku označovanou jako "kódy místního obnovení" ve větším měřítku.
Důležité
U většiny úloh citlivých na výkon doporučujeme používat zrcadlení. Další informace o tom, jak vyvážit výkon a kapacitu v závislosti na úlohách, najdete v tématu Plánování svazků.
Jednoduchá parita
Jednoduchá parita uchovává pouze jeden bitový symbol parity, který poskytuje odolnost proti chybám pouze proti jednomu selhání najednou. Nejvíce se podobá RAID-5. Pokud chcete použít jednu paritu, potřebujete aspoň tři hardwarové domény selhání – s Prostory úložiště s přímým přístupem, to znamená tři servery. Vzhledem k tomu, že trojcestné zrcadlení poskytuje větší odolnost proti chybám ve stejném měřítku, nedoporučujeme používat jednoduchou paritu. Pokud ale trváte na jeho použití, je plně podporovaná.
Upozornění
Nedoporučujeme používat jednu paritu, protože může bezpečně tolerovat pouze jedno selhání hardwaru najednou: pokud restartujete jeden server a náhle dojde k selhání jiné jednotky nebo serveru, dojde k výpadku. Pokud máte jenom tři servery, doporučujeme použít třícestné zrcadlení. Pokud máte čtyři nebo více, podívejte se na další část.
Duální parita
Duální parita implementuje Reed-Solomon kódy oprav chyb, aby zachovaly dva bitové paritní symboly, čímž poskytuje stejnou odolnost proti chybám jako trojcestné zrcadlení (tj. až dvě selhání najednou), ale s lepší efektivitou úložiště. Nejvíce se podobá RAID-6. Pokud chcete použít duální paritu, potřebujete aspoň čtyři hardwarové domény selhání – s Prostory úložiště s přímým přístupem to znamená čtyři servery. V takovém měřítku je efektivita úložiště 50 % – k uložení 2 TB dat potřebujete 4 TB fyzické úložné kapacity.
Efektivita úložiště duální parity zvyšuje počet domén selhání hardwaru, a to z 50 % až na 80 %. Například při sedmi (s Prostory úložiště s přímým přístupem, to znamená sedm serverů) se efektivita vyskočí na 66,7 % – k uložení 4 TB dat potřebujete jenom 6 TB fyzické úložné kapacity.
V části Souhrn najdete informace o efektivitě kódů duálních stran a místního obnovení v každém měřítku.
Kódy místního obnovení
Prostory úložiště zavádí pokročilou techniku vyvinutou společností Microsoft Research nazvanou "kódy místního obnovení" (LRC). Ve velkém měřítku duální parita používá LRC k rozdělení kódování/dekódování do několika menších skupin, aby se snížila režie potřebná k zápisu nebo zotavení po selhání.
U pevných disků (HDD) je velikost skupiny čtyři symboly; s jednotkami SSD (Solid-State Drive) je velikost skupiny šest symbolů. Takto například vypadá rozložení s pevnými disky a 12 hardwarovými doménami selhání (tj. 12 serverů) – existují dvě skupiny čtyř symbolů dat. Dosahuje 72,7% efektivity úložiště.
Doporučujeme tento podrobný, ale velmi čitelný návod k tomu , jak kódy místního obnovení zpracovávají různé scénáře selhání a proč jsou zajímavé. Autor: Claus Joergensen.
Zrcadleně akcelerovaná parita
Svazek Prostory úložiště s přímým přístupem může být částečně zrcadlový a částečně paritní. Zápisy přistane nejprve v zrcadlené části a jsou postupně přesunuty do paritní části později. V podstatě se používá zrcadlení k urychlení kódování mazání.
Pokud chcete kombinovat třícestné zrcadlení a duální paritu, potřebujete alespoň čtyři domény selhání, tedy čtyři servery.
Efektivita úložiště zrcadleně akcelerované parity se pohybuje mezi tím, co byste získali při použití veškerého zrcadlení nebo veškeré parity, a závisí na poměrech, které zvolíte. Například ukázka po 37 minutách této prezentace ukazuje různé kombinace s 12 servery s dosažením 46%, 54% a 65% efektivity .
Důležité
U většiny úloh citlivých na výkon doporučujeme používat zrcadlení. Další informace o tom, jak vyvážit výkon a kapacitu v závislosti na úlohách, najdete v tématu Plánování svazků.
Souhrn
Tato část shrnuje typy odolnosti dostupné v Prostory úložiště s přímým přístupem, minimální požadavky na škálování pro použití jednotlivých typů, počet selhání, které může každý typ tolerovat, a odpovídající efektivitu úložiště.
Typy odolnosti
Odolnost | Odolnost proti chybám | Efektivita úložiště |
---|---|---|
Dvoucestný zrcadlový svazek | 1 | 50.0% |
Třícestný zrcadlový svazek | 2 | 33.3% |
Duální parita | 2 | 50.0% - 80.0% |
Smíšené | 2 | 33.3% - 80.0% |
Minimální požadavky na škálování
Odolnost | Minimální požadované domény selhání |
---|---|
Dvoucestný zrcadlový svazek | 2 |
Třícestný zrcadlový svazek | 3 |
Duální parita | 4 |
Smíšené | 4 |
Tip
Pokud nepoužíváte odolnost skříně nebo stojanu proti chybám, odkazuje počet domén selhání na počet serverů. Počet jednotek na každém serveru nemá vliv na typy odolnosti, které můžete použít, pokud splňujete minimální požadavky na Prostory úložiště s přímým přístupem.
Efektivita duální parity pro hybridní nasazení
Tato tabulka ukazuje efektivitu úložiště duální parity a kódů místního obnovení v jednotlivých škálách pro hybridní nasazení, která obsahují pevné disky (HDD) i jednotky SSD (Solid-State Drive).
Domény selhání | Layout | Efektivita |
---|---|---|
2 | – | – |
3 | – | – |
4 | RS 2+2 | 50.0% |
5 | RS 2+2 | 50.0% |
6 | RS 2+2 | 50.0% |
7 | RS 4+2 | 66.7% |
8 | RS 4+2 | 66.7% |
9 | RS 4+2 | 66.7% |
10 | RS 4+2 | 66.7% |
11 | RS 4+2 | 66.7% |
12 | LRC (8, 2, 1) | 72.7% |
13 | LRC (8, 2, 1) | 72.7% |
14 | LRC (8, 2, 1) | 72.7% |
15 | LRC (8, 2, 1) | 72.7% |
16 | LRC (8, 2, 1) | 72.7% |
Efektivita duální parity pro čistě flashová nasazení
Tato tabulka ukazuje efektivitu úložiště duální parity a kódů místního obnovení na každém stupnici pro čistě flashová nasazení, která obsahují pouze jednotky SSD (Solid-State Drive). Paritní rozložení může používat větší velikosti skupin a dosáhnout lepší efektivity úložiště v konfiguraci typu all-flash.
Domény selhání | Layout | Efektivita |
---|---|---|
2 | – | – |
3 | – | – |
4 | RS 2+2 | 50.0% |
5 | RS 2+2 | 50.0% |
6 | RS 2+2 | 50.0% |
7 | RS 4+2 | 66.7% |
8 | RS 4+2 | 66.7% |
9 | RS 6+2 | 75.0% |
10 | RS 6+2 | 75.0% |
11 | RS 6+2 | 75.0% |
12 | RS 6+2 | 75.0% |
13 | RS 6+2 | 75.0% |
14 | RS 6+2 | 75.0% |
15 | RS 6+2 | 75.0% |
16 | LRC (12, 2, 1) | 80.0% |
Příklady
Pokud nemáte pouze dva servery, doporučujeme používat trojcestné zrcadlení nebo duální paritu, protože nabízejí lepší odolnost proti chybám. Konkrétně zajišťují, aby všechna data zůstala v bezpečí a nepřetržitě přístupná, i když jsou dvě domény selhání – s Prostory úložiště s přímým přístupem, to znamená dva servery – ovlivněné souběžnými selháními.
Příklady, kdy vše zůstane online
Těchto šest příkladů ukazuje, co třícestné zrcadlení a/nebo duální parita může tolerovat.
- 1. Ztráta jedné jednotky (včetně jednotek mezipaměti)
- 2. Jeden server se ztratil
- 3. Jeden server a jedna jednotka se ztratily
- 4. Dvě jednotky ztracené na různých serverech
- 5. Ztráta více než dvou jednotek, pokud jsou ovlivněny maximálně dva servery
- 6. Dva servery se ztratily
... v každém případě zůstanou všechny svazky online. (Ujistěte se, že váš cluster udržuje kvorum.)
Příklady, kdy všechno přejde do offline režimu
Během své životnosti může Prostory úložiště tolerovat libovolný počet selhání, protože se po každém z nich obnoví k plné odolnosti za dostatek času. Chyby však mohou být v daném okamžiku bezpečně ovlivněny maximálně dvěma doménami selhání. Níže jsou uvedeny příklady toho, co trojcestné zrcadlení a/nebo duální parita nemůže tolerovat.
- 7. Jednotky ztracené na třech nebo více serverech najednou
- 8. Tři nebo více serverů najednou
Využití
Podívejte se na téma Vytváření svazků.
Další kroky
Další informace o tématech uvedených v tomto článku najdete v následujících tématech:
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro